GPT-4 보다 낫다…구글, 차세대 AI모델 '제미나이' 공개

by김상윤 기자
2023.12.07 04:51:35

조직개편 후 내놓은 차세대 AI모델
3가지 버전으로 출시…바드에 탑재
멀티모달AI로 구축…이미지·동영상 인식

[뉴욕=이데일리 김상윤 특파원] 구글이 차세대 인공지능(AI) 대규모 언어모델(LLM) ‘제미나이’(Gemini)를 6일(현지시간) 공개했다. AI 선두주자인 오픈AI가 개발한 GPT-4를 능가하는 현존 최고 수준 성능을 갖춘 AI 모델이다.

구글은 5일(현지시각) 기자간담회를 통해 자체 개발한 가장 뛰어난 성능의 AI 모델 ‘제미나이 1.0’을 공개했다. 지난 4월 AI 조직인 구글브레인과 딥마인드를 구글 딥마인드로 통합한 뒤 내놓은 차세대 AI모델이다.

제미나이 1.0은 가장 강력하고 규모가 큰 ‘제미나이 울트라(Gemini Ultra)’, 중간 규모의 ‘제미나이 프로(Gemini Pro)’, 경량화한 ‘제미나이 나노(Gemini Nano)’ 세 가지 버전으로 출시된다.

범용으로 쓰이는 ‘제미나이 프로’는 이날부터 구글의 AI 챗봇 서비스인 ‘바드’에 탑재된다. 바드에는 지금까지 팜2(PaLM2)가 탑재돼 왔다. ‘제미나이 울트라’는 내년 초 ‘바드 어드밴스트’라는 이름으로 바드에 장착된다. 제미나이 나노’는 구글이 지난 10월 공개한 최신 스마트폰인 ‘픽셀8 프로’에 탑재될 예정이다.

제미나이는 개발단계부터 이미지를 인식하고 음성으로 말하거나 들을 수 있으며 코딩을 할 수 있는 능력까지 갖춘 ‘멀티모달 AI’로 구축됐다. 텍스트 데이터만 학습한 AI모델과 다른 방식이다. 이에 따라 텍스트, 코드, 오디오, 이미지, 동영상 등 다양한 유형의 정보를 이해하고 상호작용할 수 있다는 게 가장 큰 특징이다.



구글에 따르면 제미나이 울트라는 32개의 학술 벤치마크(benchmark, 성능 지표) 중 30개에서 GPT-4를 앞섰다.

특히 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개 과목을 조합해 지식, 문제 해결 능력을 테스트하는 ‘MMLU(대규모 다중 작업 언어 이해)’에서 90.0%의 점수를 획득, 최초로 인간 전문가를 능가했다. GPT-4의 MMLU 점수는 86.4%였다.

순다르 피차이 구글 CEO는 “첫 번째 버전인 제미나이 1.0은 구글 딥마인드의 비전을 처음으로 실현했다”며 “앞으로 펼쳐질 일과 제미나이가 전 세계 사람들에게 열어줄 기회에 대한 기대가 크다”고 설명했다.