AI, 더 센 놈이 왔다…글자 넘어 '눈' 뜬 GPT4
by김국배 기자
2023.03.15 15:25:22
이미지 보고 이해
최대 6만4000개 단어 기억, 챗GPT의 8배
여전히 잘못된 정보도 공유
"멀티모달 적용, AI 범용성 확대"
[이데일리 김국배 기자]
인공지능(AI) 챗봇 ‘챗GPT’를 개발한 오픈AI가 새로운 AI 언어모델 ‘GPT-4’를 14일(현지시간) 전격 공개했다. 2020년 GPT-3를 내놓은지 약 3년 만이다.
GPT-4가 이전 모델과 가장 달라진 것은 이미지를 보고 이해한다는 점이다. 즉, ‘멀티 모달’이 적용된 것이다. 가령 계란, 밀가루 등의 재료 사진을 보여주며 “이 재료로 무엇을 만들 수 있나요”라고 물으면 팬케이크, 와플, 크레페, 프렌치토스트 등의 레시피를 제안한다. 사진에 대해 설명하거나 이상한 점을 찾기도 한다. GPT-3나 챗GPT는 읽고 쓸 순 있지만, 이미지를 처리하진 못했다.
기억력도 높아졌다. 챗GPT가 약 8000개 단어 정도(책 4~ 5페이지)를 기억했다면, GPT-4는 6만4000개 단어(약 50페이지)까지 추적한다. 이는 웬만한 단편 소설 정도 되는 분량이다. 의도치 않은 발언을 유도하기도 어려워졌다고 한다. 지난 1~2년 동안 사용자들이 오픈AI에 제공한 수많은 ‘악성 프롬프트(AI에 입력하는 명령어)’에 대해 학습했기 때문이다. 오픈AI 측은 “새로운 모델은 ‘가드레일’ 밖으로 나가는 것을 거부하는 능력이 이전 모델보다 훨씬 향상됐다”고 했다.
다만 GPT-3와 마찬가지로 2021년 9월 이전의 데이터를 기반으로 답하며, “사실에 입각한 답변을 할 가능성이 40% 높아졌다”고 하나 여전히 잘못된 정보를 공유하는 경향은 남아있다. 또 오픈AI는 AI의 성능을 판단하는 기준인 매개변수 수 등 모델에 관한 정보를 공개하지 않았다. GPT-3는 매개변수가 약 1750억개였고, GPT-4는 1조개까지 늘어날 것이라는 예상이 있었다. 김영준 SK텔레콤 A.추진단 담당은 “모델 사이즈를 키우기보다 효율화에 힘쓴 것 같다”고 했다.
IT업계에선 GPT4의 등장으로 AI가 더 다양한 서비스 영역으로 확산될 것으로 내다봤다. 안성원 소프트웨어정책연구소 AI정책연구실 실장은 “멀티 모달 적용은 다양한 형태의 ‘입력’을 받아 이해할 수 있다는 점에서 범용성이 늘어난다는 의미”라며 “(GPT-4는) 더 많은 분야에 유용하게 활용될 수 있을 것”이라고 했다.