키워드를 넣으면 시나 소설을 만들어준다.
영화 내용을 작성하면 영화 제목을 알려준다.
전공 서적 내용을 물어보면 답해준다.
비속어를 필터링해주며 문법 교정을 자동으로 해주고 상품 리뷰를 요약해준다.
회의 문서가 자동으로 생성된다.
AI가 인간처럼 생각하고 글을 써주는 초거대 AI 시대가 온다.
카카오브레인(대표 김일두)이 ‘GPT-3’ 모델의 한국어 특화 AI 언어모델 ‘KoGPT’를 최대 오픈소스 커뮤니티 깃허브(github)에 공개했다.
OpenAI의 언어 모델 GPT-3는 인간과 AI가 자연어 기반으로 소통할 수 있는 AI 모델로 딥러닝의 한계를 끌어올려 차세대 AI 시대를 열었다고 평가받는 기술이다
예를 들어 기존의 딥러닝 방식에서 감성 분석을 할 때 사람의 선호도를 파악하기 위해 엄청나게 많은 데이터를 확보하고, 좋음 또는 나쁨을 판단해 레이블링을 했었다. GPT 모델을 적용하면, 추가 학습 없이 스스로 판단해 감정 분석을 할 수 있다.
예를 들어 영화 리뷰 댓글을 보고 댓글이 영화에 대한 긍정적인지 부정적인지 판별할 수 있고, 글의 내용을 짧게 요약 가능하다. ‘3주 동안 식물에게 물을 주었다’ 라는 글을 입력하면 ‘식물이 꽃을 피웠다’ 처럼 인과 관계를 예측해 보여주고 다음 이야기도 스스로 적을 수 있다.
카카오브레인, 한국어 특화버전으로 구축
카카오브레인의 ‘KoGPT’는 이같은 ‘GPT-3’ 모델의 한국어 특화 버전이다. 60억개의 매개변수와 2000억개 토큰(token)의 한국어 데이터를 바탕으로 구축했다.
‘KoGPT’는 한국어를 사전적, 문맥적으로 이해하고 이용자가 원하는 결과값을 보여 준다. △ 주어진 문장의 긍정과 부정 판단 △ 긴 문장 한줄 요약 △ 문장을 추론해 결론 예측 △ 질문을 하면 문맥 이해해 답변하는 등 언어를 가지고 활용할 수 있는 모든 과제를 수행한다. 맥락에 따라 자동으로 글쓰기가 가능해지기 때문에 상품 소개글 작성, 감정 분석, 기계 독해, 기계 번역 등 높은 수준의 언어 과제를 해결하고 다양한 분야에서 활용할 수 있다.
향후 한국어 뿐만 아니라 영어, 일본어 모델도 준비해 오픈소스화한다. 베트남어, 말레이시아어 등 동남아시아 언어도 준비해 더 많은 곳에서AI 기술의 혜택을 누릴 수 있도록 할 예정이다.
|
오늘 ‘if (kakao) 2021’ 컨퍼런스에서 ‘KoGPT’ 직접 소개
김일두(33)카카오브레인 대표는 “앞으로 GPT 기술의 사이즈와 성능을 100배 규모로 키울 예정” 이라며 “GPT는 대규모 데이터를 다루기 때문에 높은 수준의 리소스와 투자가 필요하다. GPT를 오픈소스로 개방해 일반 대학이나 스타트업 등의 기술 접근성을 높일 것”이라고 포부를 전했다.
그는 “‘KoGPT’에 이어 초거대 AI의 다양한 모델을 발표하는 등 지속적으로 혁신 기술을 공유하고 국내 IT 기술 발전과 연구 활성화에 기여해 다양한 사회 문제를 같이 해결하기 위해 노력할 것” 이라고 밝혔다.
김 대표는 오늘(16일) 개최하는 ‘if (kakao) 2021’ 컨퍼런스의 ‘카카오브레인 2.0’세션에서 카카오브레인의 향후 방향성과 주요 연구를 비롯해‘KoGPT’에 관해 직접 설명하는 자리를 가진다.
별도의 신청 절차나 인원 제한 없이 누구나 참여할 수 있으며, 이프 카카오 공식 홈페이지 및 카카오TV를 통해 시청 가능하다. 오전 10시, 이프카카오 공식 홈페이지에서 해당 세션에 관해 자유롭게 소통하는 Q&A 자리도 마련한다.
카카오브레인은 2017년 2월 설립한 카카오(035720)의 AI 연구 자회사다. 머신러닝 방법론, 로보틱스, 강화학습, 자연어처리, 음성인식 및 합성, 의료진단 등 다양한 분야의 연구를 진행하고 국내외 다양한 기관과 학계와 교류하면서 AI 기술을 리딩하고 있다.
김일두 대표는
김일두 대표는 1988년생으로 고려대에서 공학 학사, 연세대에서 공학 석사 학위를 취득했다. 카카오와 인연을 맺은 건 2012년 소프트웨어 엔지니어로 입사하면서다. 2018년부터는 카카오브레인 딥러닝 알고리즘 연구팀에서 근무하며 컴퓨터 비전, 데이터 증강 기술, 의료진단 등 AI 연구개발을 해왔다.
카카오 측은 김 대표가 지난 3년간 국제 학회에 10여 편의 논문을 등재 했고, 국제 AI, 기계학습 대회에서 8회 수상한 바 있다고 설명했다. 지난해 신경정보처리시스템학회 ‘뉴립스(NeurIPS)’에서 학습 연산 시간을 60배 이상 줄이는 기술을 선보였고, 폐암 조기 진단 흉부 CT(컴퓨터단층촬영) 영상 분류 알고리즘 추천 대회인 LNDb(폐 결절 데이터베이스) 그랜드 챌린지에서 우승했다고 전했다.