X

"실패한 실험도 데이터…논문 검색 100년 관성, AI로 깬다"

이 기사 AI가 핵심만 딱!
애니메이션 이미지
원재연 기자I 2025.11.25 08:20:00

유준선 플루토랩스 대표 인터뷰
구글·사카나·오픈AI가 뛰어든 ‘AI 리서처’ 시장 본격화
기존 AI 모델의 한계 넘어 ‘오류 없는 요약·정확성’
논문 정리·문헌 검토 넘어 가설 제안까지

[이데일리 마켓in 원재연 기자] “구글 검색할 때 8~9페이지까지 가보는 경우 거의 없잖아요. 연구자들은 논문을 찾을 때 그 페이지까지 가는 게 일상입니다. 제목이 비슷비슷해도 일일이 열어봐야 하고, 검색 문장을 계속 바꿔가며 찾는 데 엄청난 시간이 들어요.”

유준선 플루토랩스 대표
AI 챗봇이 일상에 들어왔지만, 연구실 환경은 크게 달라지지 않았다. 수억 편의 논문을 학습한 거대 모델이 등장했음에도 연구자들은 여전히 키워드를 바꿔가며 문헌을 뒤진다. 논문 출판 구조는 1900년대 방식에서 크게 벗어나지 못했고, 문헌 검토·인용 구조 파악에만 하루 절반 가까운 시간을 써야하는 비효율이 계속되고 있다. 연구자들은 더 많은 지식을 생산해야 하는 시대를 살고 있지만, 지식에 접근하는 방식은 여전히 과거의 관성을 떨치지 못하고 있는 것이다.

특히 생명과학·재료·의학처럼 문헌량이 폭발적으로 늘어난 분야에서는 ‘무엇을 먼저 읽어야 하는지’를 판단하는 데만 며칠이 걸리는 경우도 적지 않다. 최신 연구 흐름이 빠르게 바뀌는 상황에서 연구자 개개인이 모든 정보를 따라잡기는 사실상 불가능해진 셈이다.

이 틈을 정면으로 겨냥한 스타트업이 플루토랩스다. 회사는 전 세계 17만명 이상 연구자가 사용하는 학술 검색 서비스 ‘싸이냅스(Scinapse)’를 개발했고, 최근에는 문헌 조사와 연구 설계까지 지원하는 ‘싸이냅스 AI(Scinapse AI)’를 공개했다. 유준선 플루토랩스 대표는 “우리가 지향하는 건 AI가 과학자를 대체하는 것이 아니라, 옆에서 함께 설계하고 토론하는 ‘공동 연구자(co-scientist)’ 역할”이라고 설명했다. 단순히 논문을 분류·요약해 주는 수준을 넘어, 연구자가 다음 단계에서 무엇을 해야 하는지까지 제안하는 구조다. 유 대표는 “플루토랩스가 지향하는 건 AI가 과학자를 대체하는 세상이 아니라, 연구자의 곁에서 함께 설계하고 토론하는 ‘공동 연구자(co-scientist)’ 역할을 하도록 하는 것”이라고 설명했다.

유 대표의 문제의식은 학부 시절 경험에서 시작됐다. 포스텍 재학 당시 친구들의 대학원 연구실에서 논문을 함께 쓰며 논문을 쓰고 찾고 인용하는 방식 자체가 현재의 웹 환경과 맞지 않는다는 점을 체감한 것이다. 논문이 출판되면 저자는 유통권을 잃고, 논문 심사자들의 노고 역시 사실상 자원봉사에 가깝다. 심지어 실패한 실험(negative result)은 기록에 남지 않아, 연구자들이 실제로 고민한 수많은 과정이 사라진다. 연구의 전 과정을 웹이 흡수하지 못하는 구조적 균열이 오랫동안 방치된 셈이다.

플루토랩스의 시작도 여기서 비롯됐다. 그는 처음 ‘논문 출판 절차 자체를 바꾸는 기술’을 고민했다. 출판 절차를 자동화하고, 저널 밖에서도 연구자가 연구 결과를 올릴 수 있도록 설계하는 아이디어였다. 그러나 현실에서 마주한 첫 번째 과제는 의외로 기본적인 부분이었다. 연구자·논문·인용 관계가 제대로 정리돼 있지 않아, 동명이인 구분조차 쉽지 않은 상태였기 때문이다. 유 대표는 “누가 어떤 연구를 했는지부터 정리되지 않은 상황에서는 어떤 자동화도 불가능했다”며 “이에 가장 먼저 검색 인프라를 다시 만드는 작업부터 시작했고, 그 결과가 지금의 싸이냅스”라고 말했다.

싸이냅스는 단순한 검색 엔진이 아니다. 논문과 연구자 간 인용망을 기반으로 영향력 있는 논문을 우선적으로 보여주고, 분야별 핵심 흐름을 먼저 파악할 수 있는 구조로 설계됐다. 싸이냅스 AI는 이 위에서 작동한다. 시스템이 중요한 논문을 먼저 선별해 주면 AI는 그 안에서 정리·요약·비교만 수행한다. 기존의 거대 언어모델이 학습 데이터 전체를 기반으로 ‘가능성 있는 답변’을 예측하는 방식이라면, 싸이언스 AI는 이미 정해진 답안지 안에서 일하는 구조에 가깝다. 덕분에 기존 논문과 전혀 다른 내용을 만들어내는 이른바 ‘AI 할루시네이션(AI 환각)’ 발생 가능성이 극도로 낮아진 것이다.

유 대표는 “AI에게 ‘모든 판단을 맡기는 방식’을 쓰지 않는다”며 “방대한 데이터를 먼저 시스템이 정제하고, AI는 그 범위 안에서만 작동하도록 해 오류 가능성을 원천적으로 차단했다”고 설명했다. 그는 “일반적인 AI는 사실 여부보다 문장 흐름의 자연스러움을 우선하기 때문에 과학 분야에서는 엉뚱한 답이 나오는 경우가 많다”며 “싸이언스 AI는 애초에 거짓 정보를 만들 수 없는 방식으로 설계했다”고 말했다.

이 구조는 비용 경쟁력까지 가져왔다. 회사에 따르면 싸이언스 AI는 글로벌 대형 AI 모델과 동일 과제를 수행했을 때 비용이 약 10분의 1 수준이다. 모델 자체의 크기를 키우는 대신, ‘어떤 데이터를 주고 어떤 작업만 시킬지’를 정교하게 설계하는 접근이 효율을 극대화한 것이다.

AI 기반 연구지원 시장에서는 ‘AI 리서처’ 경쟁이 본격화되고 있다. 구글은 여러 AI가 협업하는 A2A(Agent 2 Agent)등을 통해 연구자가 목표를 입력하면 관련 논문 검토와 가설 초안을 제시하는 실험적 도구를 선보였다. 일본의 ‘사카나AI(Sakana AI)‘는 아이디어 생성부터 논문작업까지 전 과정을 자동화하는 ‘AI 사이언티스트’를 구축해 학회 심사를 통과한 논문을 만들기도 했다. 오픈AI 역시 ‘딥 리서치(Deep Research)’를 통해 논문을 찾아 읽고 참고문헌이 포함된 리뷰 초안을 자동 작성하는 기능을 제공하며 연구 자동화 시장에 진입했다. 다만 대부분의 서비스가 대규모 모델을 중심으로 한 범용 기능에 머물고 있다.

플루토랩스는 이 지점에서 전략을 달리한다. 연구지원 AI 시장에서 단순히 모델 크기를 키우기보다 인풋과 역할을 전략적으로 나누는 방식을 택한 것이다. 싸이냅스AI는 대량의 논문을 그대로 모델에 넘기는 대신, 인용망 분석을 통해 핵심 정보만 먼저 추려내고 그 위에서 AI가 비교·정리 작업을 수행하도록 설계됐다. 유 대표는 “연구자는 넓은 정보보다 실제 실험에 적용할 수 있는 몇 가지 선택지만 필요로 한다”며 “싸이언스 AI는 그 선택지를 명확하게 정리해 주는 데 초점을 둔다”고 말했다. 여기에 더해 최근에는 연구자가 보유한 장비나 조건에 맞춰 ‘현실적으로 수행 가능한 가설’만 다시 걸러내는 기능도 테스트하고 있다.

현재 플루토랩스의 고객은 국내 대학·연구소 보다는 해외 유저가 다수다. 이미 싸이냅스 이용자의 98%가 해외 연구자들이다. 올해 공개된 AI모델은 현재 글로벌 제약사 등과 협업을 위한 준비를 마친 상태다. 바이오·신약 개발 분야에서는 문헌 검토 속도 자체가 기업의 경쟁력을 좌우하는 요소로 부상하면서 도입 문의가 꾸준히 늘고 있다는 설명이다.

장기적으로 회사가 바라보는 핵심은 데이터 경쟁력이다. 프라이빗 데이터의 활용도는 향후 연구 AI 경쟁력을 결정하는 핵심 변수로 꼽힌다. 공개된 학술 텍스트는 이미 대부분 대형 모델이 학습을 마친 상태이기 때문에, 앞으로 우위를 가르는 것은 연구자가 실험 과정에서 남기는 비공개 메모·실험 실패 기록·중간 데이터와 같은 ‘현장 데이터’가 된다는 것이다.

유 대표는 “최근 AI 업계에서는 ‘공개된 텍스트는 이미 대부분 학습이 끝났다’는 분석이 나오고 있다”며 “앞으로 경쟁력이 되는 건 공개되지 않은 연구 데이터, 특히 실패 사례나 중간 과정 같은 ‘실험의 생생한 기록’”이라고 설명했다. 싸이언스 AI를 사용하는 과정에서 생성되는 연구자의 상호작용 기록 역시 장기적으로 중요한 자산이 된다는 설명이다.

향후 실험 수행·데이터 분석·논문 작성 단계까지 서비스를 확장할 계획이다. 유 대표는 “플루토랩스는 AI기반 모델을 만드는 회사는 아니지만, AI를 과학 분야에서 가장 효율적으로 쓰기 위한 구조와 기술은 세계 최고를 노릴 수 있는 영역”이라며 “이미 공개된 지식을 정리하는 AI는 많지만, 앞으로는 연구자와 함께 ‘새로운 지식을 만드는 AI’가 더 중요해질 것”이라고 말했다.

이 기사 AI가 핵심만 딱!
애니메이션 이미지지

주요 뉴스

ⓒ종합 경제정보 미디어 이데일리 - 상업적 무단전재 & 재배포 금지