제미나이는 구글이 GPT-4를 능가하는 현존 최고 수준 성능을 갖춘 AI 모델이라고 자랑할 만큼 야심 차게 내놓은 구글의 차세대 AI 모델이다.
제미나이는 오픈AI의 GPT와 달리 개발단계부터 이미지를 인식하고 음성으로 말하거나 들을 수 있으며 코딩을 할 수 있는 능력까지 갖춘 ‘멀티모달 AI’로 구축됐다. 텍스트 데이터만 학습한 AI모델과 다른 방식이다. 텍스트, 코드, 오디오, 이미지, 동영상 등 다양한 유형의 정보를 이해하고 상호작용할 수 있다는 게 가장 큰 특징이다.
구글에 따르면 제미나이 울트라는 32개의 학술 벤치마크(benchmark·성능 지표) 중 30개에서 GPT-4를 앞섰다. 특히 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개 과목을 조합해 지식, 문제 해결 능력을 테스트하는 ‘MMLU’(대규모 다중 작업 언어 이해)에서 90.0%의 점수를 획득, 최초로 인간 전문가를 능가했다. GPT-4의 MMLU 점수는 86.4%였다.
AI기술력도 중요하지만, 관건은 수익성을 낼 수 있느냐다. 구글은 제미나이를 구글 클라우드에 적용해 고객들을 끌어모으겠다는 전략이다.