노벨상 받은 구글, 압도 자신하는 쓰리빌리언...AI희귀진단 분석 절대강자

by김승권 기자
2024.10.18 08:35:57

[이데일리 김승권 기자] 단백질 구조를 파악하는 인공지능(AI) 모델을 개발한 구글의 AI 기업 딥마인드의 데미스 허사비스 최고경영자(CEO)가 9일 노벨 화학상을 수상한 가운데 이 회사와 AI로 경쟁하는 쓰리빌리언이 다시 주목받고 있다.

쓰리빌리언은 AI로 유전자 변이로 인한 희귀질환을 분석하는 기술(쓰리씨넷)을 개발했는데 희귀질환 분석 영역에서 딥마인드와 올 하반기 말 진검승부를 겨룰 것으로 예상된다. 딥마인드가 희귀질환을 분석하는 AI인 알파미스센스를 개발했고 고도화 작업을 진행 중인데 과거 AI 대회에 나온 지표를 보면 쓰리빌리언이 앞서고 있다는 게 회사 측 주장이다.

10일 AI의료업계에 따르면 쓰리빌리언은 최근 한국거래소 상장 예비 심사를 통과했고 11월 코스닥 시장에 상장할 예정이다. 상장 후 12월 경 AI 문제해결 국제 대회인 ‘케이지’에서 구글 딥마인드 알파미스센스와 대결을 펼친다.

금창원 쓰리빌리언 대표는 “쓰리씨넷(3cnet)은 2년 전 열린 AI 희귀질환 경진대회에서 딥마인드보다 앞선 성능을 보였다”며 “아직 희귀질환 분석 쪽에서는 구글 AI가 학습데이터가 많지 않을 것으로 예상되기 때문에 이번 대회에도 승산이 있다고 본다”고 말했다.

(그래픽=이데일리 문승용 기자)
쓰리빌리언은 국내 최대 유전체 분석 회사인 마크로젠에서 임상유전학팀을 이끌던 금창원 대표가 2016년 스핀오프해 창업한 회사다. 희귀질병 수는 1만개 정도로 알려졌다. 그중에 80%가 유전질병이다. 즉 쓰리빌리언은 희귀질병 중에서 80% 차지하고 있는 전체 유전 질병을 진단하는 기술을 가진 회사인 것이다.

금창원 대표는 일찌감치 희소병에 주목해 AI 플랫폼을 만드는 것을 구상했다. DNA는 아데닌(A), 시토신(C), 구아닌(G), 티민(T) 등 4가지 염기로 구성됐다. 염기 중 하나가 빠지거나 순서가 바뀌는 변이가 발생하면 세포 조직이 제대로 형성되지 않아 질병이 발생할 수 있다. 이러한 염기의 잘못된 변화를 ‘미스센스 돌연변이’라고 한다. 쓰리빌리언 AI는 이런 변화를 포착해 질병을 진단해준다.

(사진=팜이데일리 유튜브)
쓰리빌리언의 희귀질환 AI 분석 기술력은 글로벌 최고 수준으로 인정받고 있다. 유전 변이 해석 과정에서 10만개의 변이들이 실제 유전자의 증상을 망가뜨려 질병을 일으킬 수 있는 병원군 변이인지 아닌지를 판별하는 시스템의 정확도가 99.4%에 달한다. 진단율 또한 미국 유전자 데이터 플랫폼기업 인비테와 독일 진단 기업 센토진보다 높았다. 쓰리빌리언의 진단율은 52.4%인데 비해 미국 인비테는 28.8%, 독일 센토진은 36% 수준에 각각 그쳤다. 또한 최근 거대언어모델( LLM )을 도입, 유전변이 해석 인공지능 성능이 향상됐다.

금 대표는 “희귀질환은 의사가 오진하는 비율인 오진율이 높은 편이다. 미국 기준 희귀질환 오진율은 의사 17명 중에 16명은 못 잡아내는 정도”라며 “이 때문에 희귀질환을 발견하지 못해서 발생하는 의료사회적 비용은 미국 2019년 기준 약 1300조원에 달하는데 AI를 통해 상당부분 개선이 가능할 것”이라고 강조했다.



이번에 노벨 화학상을 받은 구글 딥마인드는 다양한 영역의 AI 플랫폼을 개발하고 있다. △프로그래밍 대회 수준의 코딩 능력을 보여주는 ‘알파코드’, △스스로 학습하여 바둑, 체스, 일본 장기(쇼기) 등의 게임에서 사람과 기존 AI를 능가하는 성능을 보여주는 알파고 후속작 ‘알파제로’, △복잡한 수학 문제를 해결하는 데 특화된 AI 시스템인 ‘알파프루프’, △다양한 로봇 유형에 걸쳐 일반화된 학습이 가능한 로보틱스 AI 모델 ‘RT-X’, △1080p 해상도의 1분 이상 길이의 비디오를 생성할 수 있는 멀티모달 비디오 생성 모델 ‘베오(Veo)’ 등이다.

의료 분야에서도 3개 이상의 AI 플랫폼을 보유하고 있다. 의료 영상 분석과 질병 예측 등에 사용되는 ‘딥마인드 헬스’, 단백질 구조 예측에 특화된 AI 모델 ‘알파폴드’, 희귀질환을 분석하는 ‘알파미스센스’가 그것이다.

구글 딥마인드 알파미스센스 희귀질환 분석 방식 (사진=딥마인드)
특히 알파미스센스는 DNA가 정상적인 형태를 유지할지 예측하는 방식으로 질병 발생 가능성을 평가한다. 이 플랫폼은 알파폴드를 발전시킨 형태로 학습됐는데 단백질의 화학적 구성을 바탕으로 향후 단백질의 3D 구조를 예측하는 방식을 도입했다. 인간과 가까운 영장류의 DNA데이터를 바탕으로 어떤 미스센스 돌연변이가 빈번하게 발생하는지 학습했다.

이 때문에 전문가들은 이러한 알파미스센스의 예측 방식을 ‘단백질 언어를 해독한 것’이라고 빗댔다.

이 플랫폼은 프로그램의 정밀도를 90%로 설정했을 때 분석 대상 유전자 변이 중 57%는 무해하고 32%는 질병을 일으킬 가능성이 있는 것으로 분석했지만 나머지는 영향을 확실하게 파악하지 못했다. 이 때문에 업계에선 희귀질환 분석 영역에서는 아직 고도화되지 못한 것으로 평가하고 있다.

실제 쓰리빌리언은 작년 미국에서 열린 AI 희귀질환 경진대회 ‘엑셀러레이트 레어’에서 우승했다. AI 희귀질환 성능 평가에서 구글 딥마인드의 알파미스센스가 또 다른 AI ‘EVE’ 대비 3.1% 우위를 보인 반면 쓰리빌리언 ‘3cnet’이 17.5% 우위로 구글을 앞섰다. 동일 ‘test set’ 에 대한 비교가 아니기 때문에 정확한 비교라고 할 수는 없지만 간접적으로 비교해 볼 수 있는 수치다.

금 대표는 “딥마인드가 단백질 분석 다음으로 뛰어든 것이 ‘알파미스센스’를 통한 병원성 유전변이 해석 문제”라며 “올해 구글 알파미스센스와 쓰리빌리언 AI의 성능이 비슷하거나 조금 우위를 보일 것으로 예상하고 있다”고 내다봤다.