“김치 사진만 봐도 레시피 알려준다”…한국어 특화 생성형 AI 모델 공개

by김세연 기자
2024.10.18 10:37:26

한국 문화·지식 이해도 낮았던 영어 기반 VQA 모델 한계 극복

[이데일리 김세연 기자] 이미지를 분석하고 이에 대한 답변을 하는 생성형 인공지능(AI) 챗봇 ‘AI 헬피 Pro’가 공개됐다.

(사진=엘리스그룹)
AI 교육 솔루션 기업 ‘엘리스그룹’은 기존 생성형 인공지능 챗봇인 ‘AI헬피’에 이미지 인식 기능을 더한 AI 헬피 Pro를 공개했다고 18일 밝혔다. 이미지와 관련된 질문을 받으면 이미지를 분석해 답변하는 시각적 질의응답(VQA)이 가능하다.

이 챗봇은 특히 한국어와 한국 문화를 분석하고 이해하는 데 특화됐다. 유명 한국인 사진이나 국악과 같은 전통문화, 전통 음식 이미지도 이해한 후 설명할 수 있다. 예시로 김치 사진을 보내며 레시피를 알려달라고 하면, 챗봇이 김치 레시피를 제공한다. 기존 VQA 모델들이 주로 영어를 기반으로 했다는 것과 차이가 있다.

코드가 공개된 한국어 질의응답 기술들의 성능을 비교하는 ‘CVQA 벤치마크’에서도 빅테크를 포함한 오픈소스 AI 모델 중 최고 성능을 기록했다.



헬피 Pro는 이용자가 원하는 이미지도 만들어준다. 맥락과 다른 정보를 출력하는 기존 생성형 AI의 문제점은 실시간 정보 검색 기능을 통해 개선했다.

엘리스그룹은 시각 정보 습득에 어려움을 겪는 사람들을 위해 시각적 질의응답 기능을 개발했다며, 앞으로 4000곳 이상의 기관의 AI 교육에 활용 중인 엘리스의 학습 경험 플랫폼(LXP)에 순차적으로 적용할 예정이라고 밝혔다.

김수인 엘리스그룹 최고연구책임자와 권도현 AI 엔지니어는 “지난해 생성형 AI 챗봇 ‘AI헬피’ 공개 두 달 만에 15만 건 이상 질의응답이 진행되며 학습자들에게 큰 도움이 됐다는 사실이 매우 유의미했다”며 “앞으로도 많은 이들이 활용할 수 있는 신뢰도 높은 교육 특화 AI 모델을 개발할 계획”이라고 전했다.