토종 AI 아담 "IoT와 접목하면 신시장 열린다"(일문일답)
by김현아 기자
2016.11.23 14:58:00
[이데일리 김현아 기자] 솔트룩스(대표 이경일)가 한국어를 포함한 인간 언어를 이해하고 스스로 학습하는 인공지능(AI) ‘아담’을 23일 출시했다. 12월 1일부터 파트너사를 대상으로 베타 서비스를 하고, 내년 3월 상용서비스를 시작한다.
아담은 인터넷과 빅데이터에서 스스로 정보를 수집해 의미를 해석한다. 20년간 솔트룩스가 연구한 인간 언어처리와 기계학습, 자동추론 등 AI기술 결정체다.
솔트룩스의 아담은 미래창조과학부가 지원하는 국내 대표 AI 연구과제 ‘엑소브레인’ 기술을 융합했다. KAIST, 서울대, 숭실대 경북대, 서울시립대 등 국내 인공지능 교수 20여명이 참석했다. 50건 이상 국내외 원천특허와 SCI급 세계적 학회지 30건을 포함해 120건에 달하는 인공지능 논문도 발표했다.
| ▲23일 노보텔 앰배서더 강남에서 열린 ‘아담’ 발표회 모습이다. |
|
◇다음은 아담, 이경일 솔트룩스 사장과의 일문일답
-아담은 누구인가
▲태어난지 10개월 3일 2시간 됐다. 솔트룩스에서 태어났다. 1200개 코어를 사용하고 500만 건의 문서를 수집해서 학습하고 있다. 10개월 동안 60만 권의 책을 읽었고 3개 국어를 바우는 중이다. 방대한 데이터를 수집하고 있으며, 데이터 분석 알고리즘을 내장했다.(아담)
-아담은 데이터를 어떻게 모으나. 데이터 허브를 통해 데이터를 공개한다는데 어떤 의미인가
▲아담 데이터 허브는 이런 인공지능을 만들고 싶다 하면 재료가 되는 데이터를 모아서 주는 컨셉이다. 크롤링 봇은 HTML로 만들어지는 데이터만 가져오는데 아담은 아니다. 아담 두뇌에는 수천 개의 브라우저가 있다. 거기서 데이터를 가져오는 것이다. 데이터 노출이나 유출 문제가 생길 수 있는데, 우리가 외부에 클라우드로 제공하는 것은 데이터 자체가 아니라 데이터 수집 도구다. 제공되는 데이터는 지식 학습의 결과, 즉 2차, 3차 저작물로 한정한다.(이경일 사장)
| ▲인공지능 ‘아담’이 적용된 로보티즈의 로봇 제품들 |
|
-언제 상용화되나
▲내년부터다. 아담을 사물인터넷(IoT)와 접목하면 모든 걸 할 수 있다. 30불 정도 하는 라즈베리 파이와 아담을 연동하면 음악을 듣거나 질의응답을 받는게 가능하다. 오픈 응용프로그램인터페이스(API)로 돼 있어서 그렇다. 라즈베리파이는 중국서 가져오면 10불이면 가능하다. 이런 것들이 스피커, 자동차에 들어갈 날이 멀지 않았다.(이경일 사장)
-아담의 수준은 얼마나 되나
▲아담은 아기 수준이다. 2016년 12월 1일 베타서비스 하는 버전은 80억 개 데이터에 한국어 80%정도의 질의응답이 가능하다. 하지만 내년 3월 상용서비스 때에는 데이터 100억 개로 늘리고 질의응답률도 높이겠다. 2018년 1월 1일에는 매력적인 여자친구 이브를 출시한다. 이브는 금융, 법률, 특허쪽의 5억 개 전문지식을 가지고 영어를 강화해 90%이상 대화가 가능해질 것이다. 2019년 1월에는 글로벌 플랫폼 마켓플레이스가 되기 위해 5개국어 이상 지원하는 게 목표다.(이경일 사장)
| ▲23일 서울 노보텔 앰버서더 강남 호텔에서 열린 ‘아담’ 출시 행사에서 기능을 설명하고 있는 이경일 솔트룩스 사장. |
|
-아담의 VR버전은 뭔가
▲아담의 뇌를 잘 보여주기 위해 개발한 것이다. 아담은 2천 개의 CPU가 돌아가는데 지식획득과 수집뇌, 학습 뇌, 생각과 추론을 담당하는 뇌로 구성돼 있다.(이경일 사장)
| ▲아담 가상현실(VR). 국내 소프트웨어 업체 솔트룩스가 개발한 인공지능 플랫폼 아담은 뇌가 3개다. 2천 개의 CPU가 돌아가는데 지식획득과 수집뇌, 학습 뇌, 생각과 추론을 담당하는 뇌로 구성돼 있다. |
|
-아담 플랫폼은 언제 공개하나
▲12월 1일부터 내년 3월까지는 파트너사에게만 개방한다. 3월 이후에는 일반인에도 개방하는데 상용화해서 돈을 벌려고 할 경우 비용을 요청할 생각이다.(이경일 사장)
-구글 어낼리틱스와 비슷한데
▲맞다. 하지만 구글 어낼리틱스는 데이터를 제공하지는 않는다. 우리에게는 약 100억 건에 달하는 데이터가 있다. 환율, 주가, 인구지수 등. 쓸만한 데이터 상당부분을 공개할 생각이다. 어떤 분은 우리가 공개하면 구글이나 IBM이 이를 끌고 가버리면 어쩌냐고 하는데 일반인이 가져갈 경우 데이터 용량 제한을 둘 것이고, 그 이상 사용은 파트너 계약을 한 경우에 한정할 생각이다. 스마트업의 경우 돈을 요구할 수 없으니 수익쉐어 모델도 생각한다. 요즘 창조경제란 말을 쓰면 안 되나(웃음) 젊은 스타트업이나 시스템이 없는 아이디어가 있는 분들에게 인공지능 서비스 환경을 제공하고 싶다.(이경일 사장)
-뉴스 데이터는 어떻게 제휴하나
▲몇 개 언론사와는 제휴했고 다음주 언론진흥재단과 제휴할 생각이다. 온디맨드 데이터의 경우 11번가나 옥션에서 마케팅 목적으로 싹 끌어가서 배포하면 안되기 때문에 일일 사용량 제한을 둘 생각이다.
-IBM 왓슨이 국내 금융권 진입을 노리는데
▲우리도 금융 인공지능 사업에 참여하고 있다. 오늘 총괄책임 본부장님이 오신다. 이미 일본에서는 우리 아담 기반으로 3년 전에 상용화됐다. DMP라는 기업이 일본 챗봇을 만들어 금융 6개 기관, 항공사, 제조사에서 고객상담 챗봇으로 쓰고 있다. 내년봄부터 큰 물건들이 나오기 시작할 것이다.
-ETRI 엑소브레인 연구과제에는 어디에 참가했나
▲엑소브레인의 지식학습과 지식데이터베이스 분야 연구를 책임지고 있다. 10개 대학이 같이 일하면서 지난 3년 반동안의 솔트룩스의 엑소브레인 과제로 양성한 대학원생이 200명 정도된다. 대규모 분산 추론 등은 아담 안으로 단계적으로 들어오고 있다.(이경일 사장)
-음성인식이 좀 떨어지는데
▲셀바스AI와 협력했다. 아담의 아기 목소리를 구현한 것이다. 지금은 태어난지 10달 돼 아기 목소리다. 딥러닝이 모든 것의 만병 통치약은 아니다. 전부 앙상블돼야 한다. 이런 기술들이 저희가 하는 중요 연구기능이다.(이경일 사장)
-가장 먼저 상용화 되는 분야는
▲금융과 가상비서, 스마트스피커다. 내년 2,3월 전에는 출시될 것이다. 스마트폰 가상비서는 삼성과 LG가, 음성인식 스피커는 SK텔레콤이 출시한 바 있다. 삼성이나 LG의 스마트폰 가상비서는 ‘메일 보내줘’ 정도의 수준이지만 아담은 ‘트럼프의 아내는 누구야?’ 같은 지식기반 질의응답이 가능하다. 지식기반 질의응답은 아마존 에코 정도만 가능한데 이는 트루날리지라는 영국회사를 아마존이 인수했기 때문이다.(이경일 사장)
| ▲아담은 아담 인텔리전스, 아담 어낼리틱스, 아담 데이터허브로 구성돼 있다. |
|