LG유플도, 네이버도 탐내는 이회사…AI 정확도 높이는 RAG 최강자

by김현아 기자
2024.07.28 12:27:23

42 MARU 김동환 대표 인터뷰
기계독해(MRC)기술로 2018년 구글과 함께 글로벌 1위
"기업 AI 위해선 LLM과 MRC 함께 써야"
"도면 설계 가능한 AI 개발중"..IPO 주관사 두곳 선정
LG유플, 네이버, 한컴, 영국 테크스타 등 전략적 투자자

[이데일리 김현아 IT전문기자] “작년 4월, 검색증강생성(RAG·Retrieval-Augmented Generation)을 국내에 처음 도입한 회사가 바로 저희입니다. 생성형 인공지능(AI)의 정확도를 높이려면 거대언어모델(LLM)뿐만 아니라 RAG와 기계독해(MRC·Machine Reading Comprehension)가 필요합니다.”

검색증강생성이란 LLM이 응답을 생성하기 전에 신뢰할 수 있는 지식 데이터베이스를 참조하는 기술이다. 기업이 생성형 AI 서비스를 컨택센터 등에 도입할 때 반드시 RAG를 거치는 추세다. 포티투마루(42MARU)는 RAG 시장에서 최강자로 자리매김하고 있다. 지난 23일 만난 김동환(49)포티투마루 대표는 “MRC와 LLM의 융합, 그리고 RAG의 적용이 포티투마루의 핵심 경쟁력”이라고 설명했다.

[이데일리 이영훈 기자] 김동환 포티투마루 대표 인터뷰


김동환 대표는 거대언어모델(LLM)과 기계독해(MRC)의 차이를 학생에 비유해 설명했다. 그는 “LLM은 모든 과목을 두루 공부하여 예술, 운동, 동아리 활동까지 평균 80점 정도 받는 학생과 같다. 그러나 때때로 과장하거나 정확하지 않은 정보를 제공할 수 있다”면서 “반면 MRC는 특정 분야 공부만 집중해서 해당 전공 분야에서는 98~99%의 높은 정확도를 자랑한다”고 말했다. 기자로 치면, LLM은 여러 출입처를 거친 기자이고, MRC는 특정 분야에 특화된 전문기자와 같다.

이런 가운데, RAG는 LLM이 필요한 정보를 정확하게 찾고 제공할 수 있게 도와, 환각(할루시네이션) 문제를 줄이고 정확성을 높인다. RAG를 활용하면 LLM의 넓은 커버리지와 MRC의 높은 정확성을 동시에 확보할 수 있다. 이는 특히 최신 정보나 기업 내 방대한 데이터베이스에서 필요한 정보를 찾는 데 유리하다.

한마디로 포티투마루는 MRC와 LLM, RAG 기술을 융합해 생성형 AI의 정확도를 높이는 ‘엔진’을 만드는 회사다. 포티투마루는 2018년 11월, 미국 스탠퍼드대학교가 주관한 글로벌 기계독해(MRC) 경진대회인 ‘스쿼드2.0’에서 구글과 공동 1위를 기록해 원천 기술 경쟁력을 증명했다. 이는 2022년 11월 오픈AI의 챗GPT가 나오기 훨씬 전의 일이다. 또한, 포티투마루는 국내 최초로 검색증강생성(RAG) 기술을 제안하고, 기업용 AI 시장에 서비스형 소프트웨어(SaaS) 형태로 공급해 이 시장에서 1위를 기록 중이다.

김 대표는 컴퓨팅 기술을 이용해 세상의 모든 질문에 답을 찾는 데 인생을 걸었다. 엠파스에 병역특례로 입사해 검색엔진 개발에 참여한 뒤, SK커뮤니케이션즈에서 검색본부장을 역임한 후, 2015년 포티투마루를 창업했다. 그는 “당시 해결되지 않았던 문제는 검색 시 챗GPT처럼 답변을 바로 제공하는 것과 문서 내용을 요약하여 사용자에게 보여주는 것이었다”면서, “2000년대 초반 구글도 기술적 한계를 인정하며 포기했었다”고 회상했다.

김 대표는 딥러닝 기술을 통해 이 문제 해결의 가능성을 봤다. 바로 기계독해(MRC) 분야였다. 그래서 포티투마루는 초기부터 기계독해 기반 ‘딥 시맨틱 QA 플랫폼(Deep Semantic QA Platform)’을 구축하고, 특정 도메인에 특화된 작업을 지속해왔다. 김 대표는 “이 기술이 다양한 산업 분야와 일상생활에 걸쳐 광범위하게 적용될 것이라고 확신했다”고 말했다. 실제로 포티투마루는 은행, 증권, 보험, 카드사 등 다양한 금융기관에 이상거래 탐지, 자금세탁 방지, 고객응대용 챗봇 등 맞춤형 솔루션을 제공하고 있으며, 대우조선해양, 한국조선 등에서는 정비 사례 분류 및 고장 예측 솔루션을 제공하고 있다.



[이데일리 이영훈 기자] 김동환 포티투마루 대표 인터뷰
김 대표는 회사 이름을 적을 때 “가능하면 42MARU로 표시해 주시고, 그렇지 않으면 한글로 포티투마루로 적어 주세요”라고 부탁하곤 한다. ‘왜 이리 까다로울까?’라고 생각한 적이 있지만, 그 이유는 그의 철학에 담겨있다. 그는 SF 소설에서 영감을 받아 세상의 모든 질문에 대한 답을 제공하겠다는 목표를 가지고 있었다.

포티투마루라는 사명은 ‘은하수를 여행하는 히치하이커를 위한 안내서’라는 영국 SF 소설에서 따왔다고 한다. 이 소설에 등장하는 슈퍼컴퓨터 ‘딥소트(Deep Thought)’는 750만 년간 우주를 여행한 후 세상 모든 질문에 대한 궁극적 해답으로 ‘42’라는 답을 내놓았다. ‘42’ 자체가 의미 있다기보다는 세상의 모든 질문에 답을 찾자는 취지로 사명에 42를 사용했고, 여기에 정상을 뜻하는 순우리말 ‘마루’를 붙였다. 자신의 집무실 이름을 ‘딥소트(Deep Thought)’로 지은 것도 같은 맥락이다.

포티투마루에는 현재 70여 명의 직원이 근무하고 있으며, 반도체, 통신, 금융, 보안, 법률, 병원 등 다양한 분야에서 LLM 적용을 넓히고 있다. 지난해 5월에는 환각, 보안, 고비용 문제를 해결한 소형언어모델(sLM) ‘LLM42’를 선보였고, 9월에는 LLM42 내부에 ‘RAG42’를 추가 출시했다.

포티투마루는 이러한 기술력을 바탕으로 2021년 금융권에서 시리즈 A 투자를 유치한 지 2년 만에 시리즈 B 투자 유치에 성공했다. 한국투자증권과 DB금융투자를 공동 주관사로 선정해 기업공개(IPO) 준비도 진행 중이다. 시리즈 B 투자에서는 오버부킹으로 인해 투자액을 줄여 받을 정도로 시장의 높은 관심을 받았다. 주요 투자자로는 스프링캠프, 영국의 테크스타, 하나증권, KDB, IBK, 웹케시, LG유플러스, 네이버, 한컴 등 다양한 전략적 투자자들이 있다. 금융권과 대기업들의 투자로 안정적인 사업 환경이 마련됐다.

김동환 대표는 “IPO 주관사를 선정했으며 내부 통제와 회계 시스템 등의 준비는 끝났지만, 코로나19 팬데믹으로 인해 IPO 계획이 일부 연기됐다”고 말했다. 그는 “고객사의 요구에 맞춰 단순히 기술을 제공하는 걸 넘어 데이터 학습과 최적의 AI 도입 결과를 보장하는 진정한 비즈니스 파트너가 되기 위해 솔루션을 제공하고 있다”고 덧붙였다.

이어 “MRC와 RAG 기술력을 LLM에 접목한 하이브리드 LLM으로 기존 LLM에 비해 학습 비용을 줄이면서도 정확도를 높이는 기술 개발에 집중하고 있다”고 설명했다. 또 “연내 사무직 업무에 필요한 표, 그래프, 차트 등의 데이터 처리에 중점을 두고 있으며, 도면 해석과 설계까지 포함하는 방향으로 연구하고 있다. 표, 그래프, 차트의 이해, 해석, 분석 및 생성 기능을 탑재한 솔루션을 올해 안에 출시하는 게 목표”라고 했다.

김 대표는 “업무에 몰두할 때는 집중적으로 일하고, 그렇지 않을 때는 완전히 쉬는 스타일”이라면서 “세상의 모든 질문에 답을 주는 일에 성공하게 되면, 원래는 남해에 가서 외국인 전용 게스트하우스를 하고 싶었지만 너무 많이 생긴 것 같다. 로봇에 AI를 접목하는 일도 관심이 있다”고 말했다.