"초거대 AI로 의사도 못찾던 질병 찾겠다" 카카오의 새 도전

김국배 기자I 2022.08.21 17:05:28

김일두 카카오브레인 대표
"보편적 문제 풀겠다…헬스케어에 집중"
"의사 수준 진단 능력 가진 초거대 AI 개발 목표"
치료 분야선 스타트업 '갤럭스'와 공동 연구…"신약 개발 성공률 4배 올릴 것"

김일두 카카오브레인 대표 (사진=카카오브레인)


[이데일리 김국배 기자] 카카오(035720)가 인공지능(AI) 연구개발(R&D) 계열사 카카오브레인을 통해 헬스케어 분야 난제 해결에 도전한다. 초거대 인공지능(AI)이 핵심 수단이다.

최근 경기 성남시 알파돔타워에 위치한 본사에서 만난 김일두 카카오브레인 대표는 “기존 의사들도 진단하기 어려웠던 질병들을 효과적으로 진단할 수 있는 초거대 AI 모델을 만드는 데 집중할 것”이라고 말했다. ‘AI로 보편적 문제를 푼다’는 것을 카카오브레인의 방향성으로 잡았다는 그는 “내부적으로 헬스케어를 매우 중요한 섹터로 보고 있다”고 했다. 2012년 카카오에 입사한 김 대표는 카카오브레인의 딥러닝 알고리즘 연구팀장을 거쳐 지난해 3월부터 회사를 이끌고 있다.

[이데일리 김일환 기자]


◇“초거대 AI, 데이터 수 적은 난치병 진단 유리할 수도”

김 대표가 초거대 AI를 만들어 판독 등 진단 분야에서 검증하려는 것은 크게 두 가지다. 하나는 AI가 의사에 ‘준하는’ 진단을 할 수 있는지, 다른 하나는 난치병처럼 의사들이 진단하기 어려운 질병을 효과적으로 진단할 수 있는 지다. 김 대표는 “초거대 AI는 적은 양의 데이터로 새로운 태스크를 해결할 수 있다는 가능성을 보여줬다”며 “헬스케어에 접목하면 희귀병, 난치병처럼 데이터 수가 적은 질병을 진단하는 데 유리할 수 있다는 가설을 세울 수 있다”고 했다.

또 “기존 업체들은 한 가지 특정 질병에 대해 (AI 기반의) 진단 사업을 한다면, 우리는 훨씬 더 보편적인 접근”이라고 설명했다. 예를 들면, ‘유방암’만 진단하는 게 아니라 여러 종류의 암을 찾는 것이 목표다. 가톨릭대학교와 공동 연구에 나설 예정이다.

치료도 카카오브레인이 집중하는 또 하나의 영역이다. 지난해 12월 AI 신약 설계 플랫폼 기업 갤럭스에 50억원의 지분 투자를 단행한 것이 단적인 예다. 카카오브레인의 첫 투자다. 갤럭스는 석차옥 서울대 교수가 창업한 회사로, 단백질 구조 예측 소프트웨어 등으로 구성된 신약 설계 플랫폼을 개발한다. 김 대표는 “갤럭스는 한 번 만나고 투자를 결정했다”며 “전 세계 ‘톱3’ 안에 드는 팀이라 생각한다”고 했다.

그는 “암 관련 신약을 개발할 때 평균 13년이 걸리고 최소 1조원이 들며 성공률은 3%라고 한다”며 “우리는 기간은 1~2년 내, 비용은 수백억원대로 줄이며 성공률을 4배 이상 올리는 것이 목표”라고 말했다. 그러면서 “진단, 치료 분야를 혁신하면 ‘질병 없는 세상’이라는 비전을 향해 나아갈 수 있을 것”이라고 덧붙였다.

‘바나나 모양의 의자를 그려줘’라는 말에 카카오의 AI 아티스트 ‘칼로’가 그린 그림. 카카오브레인은 이달 말 초거대 AI 이미지 생성 모델의 기반이 될 텍스트-이미지 데이터셋 ‘코요’를 공개할 예정이다. 데이터셋 규모는 6억~ 8억장이다. (사진=카카오브레인)


◇‘최대 8억장’ 텍스트-이미지 데이터셋 공개

카카오브레인은 지난해부터 초거대 AI 연구에서 적극적인 행보를 보이고 있다. 작년 11월 한국어 기반 초거대 AI 언어 모델 ‘KoGPT’를 공개했으며, 곧바로 초거대 AI 이미지 생성 모델 ‘민달리’도 내놨다. 이후 카카오브레인은 KoGPT를 기반으로 시 쓰는 AI ‘시아’를, 초거대 AI 이미지 생성 모델 ‘민달리’ 등을 발전시켜 AI 아티스트 ‘칼로’를 탄생시켰다. 1만3000여 편의 시를 읽고 작법을 익힌 시아가 최근 펴낸 시집 ‘시를 쓰는 이유’는 1쇄가 다 팔려 2쇄를 찍는다고 한다.

이달 말에는 초거대 AI 연구의 기반이 될 텍스트-이미지 데이터셋 ‘코요’도 공개할 예정이다. 김 대표는 “데이터셋 스펙이 확정되진 않았지만, 6억~ 8억장 정도 규모의 고품질 이미지·텍스트 쌍”이라며 “국내외 기업을 통틀어 이 정도 규모의 데이터셋이 공개된 적은 없다”고 설명했다.

메타버스, 디지털 휴먼 등과 관련된 분야에 적극적으로 투자하고 있다고도 했다. 그는 “특히 (2D 사진을 3D 장면으로 전환하는) ‘뉴럴 렌더링’ 분야에 공격적으로 투자 중”이라고 했다. 다만, 디지털 휴먼 출시 가능성에 대해선 “(당장) 나온다기보다 논의 아젠다에는 올라와 있다”고 했다. 카카오 본사는 올해 AI, 헬스케어 등 기술 기반 신규 사업 투자를 확대하겠다고 밝힌 바 있다. 카카오브레인은 카카오톡 ‘톡서랍(클라우드 기반 데이터 저장)’ 서비스에 이미지 검색 기능도 지원하는 등 카카오 그룹 서비스에도 AI 기술을 제공 중이다.

주요 뉴스

ⓒ종합 경제정보 미디어 이데일리 - 상업적 무단전재 & 재배포 금지