의사 부족 시대...성큼 다가온 韓 'AI 의사'[생성형 의료AI시대]①

by김승권 기자
2024.09.30 09:30:05

[이데일리 김승권 기자] 인공지능(AI)이 일반인들의 개인 주치의 시대를 열어줄까. ‘AI의사’의 상용화 단계가 거의 임박했다. 미국 빅테크들은 연이어 대화가 가능한 의료 AI 플랫폼을 공개했다. LLM 모델을 기반으로 다양한 의학 지식을 학습한 AI는 의사 시험을 손쉽게 통과하고 환자의 개인 맞춤형 진료도 가능한 수준으로 발전했다. 국내에서도 루닛, 카카오, 네이버 등이 의료 상담이 가능한 LLM 모델을 개발하고 있는 상황이다.

25일 AI의료업계에 따르면 챗GPT를 만든 오픈AI는 최근 의사가 암 환자를 진단하고 진료하는 데 도움을 주는 생성형 의료AI 보조 플랫폼을 개발했다. 이 AI는 환자의 위험 요인, 가족력 등 데이터를 수집해 검진 계획을 짜고 병변 진단을 돕는다. 아직 의사를 보조하는 방식으로 밖에 사용할 수 없지만 올해 하반기부터 20만 명 이상의 환자가 해당 서비스를 이용할 수 있도록 할 계획이다.

생성형AI는 이용자의 요구나 상황에 따라 결과를 능동적으로 생성해내는 기술을 말한다. 의료 분야에 딥러닝과 언어 활용이 가능한 AI를 적용하면 수많은 패턴을 기억해 스스로 학습하고 이를 활용, 질환을 판단할 수 있다. 특히 AI가 인간 전문의보다 강점을 보일 것으로 예상되는 분야는 영상 판독 분야다. 엑스레이 등의 영상을 보고 특이점을 판단하는 부분에서 인간보다 오류가 낮을 수 있다는 임상 결과가 속속 등장하고 있어서다.

챗GPT-4 (사진=로이터-연합뉴스)
실제 북미영상의학회(RSNA) 저널 래디올로지에 공개된 독일 쾰른 대학병원 영상의학과 로만 게르츠 박사 연구팀 논문에 따르면 오픈AI의 거대언어모델(LLM)인 GPT-4는 영상의학 전문의만큼 진단 영상의 오류를 감지할 수 있었다. GPT-4는 150개 오류 가운데 124개를 찾아내 82.7%의 탐지율을 기록했다. 전문가 집단의 경우 영상의학 선임 전문의의 탐지율이 89.3%(134개), 주치의와 레지던트가 각각 120개를 찾아내 80%의 탐지율을 기록했다.

시간과 비용 효율성 측면에서는 GPT-4가 영상의학 전문의보다 높았다. 진단 영상 한 건당 GPT-4의 판독 시간은 평균 3.5초였으나 영상의학 전문의 가운데 판독 속도가 가장 빠른 전문의의 평균 판독 시간은 25.1초였다.

구글도 의학적 질문에 대한 답을 내놓거나 건강 관련 문서 요약 등의 작업을 수행할 수 있는 생성형 AI ‘메드팜2’를 올해 안에 출시할 계획이다. 구글은 이미 2020년 유방암 분야에서 AI가 전문의보다 영상 판독 정확도가 높다는 것을 입증한 바 있다.



루닛 관계자는 “의료 영상 분야의 AI는 사람의 시각 중추를 본뜬 딥러닝 기술이 핵심”이라며 “결국 학습을 많이 할수록 오류는 줄어들고 능력은 좋아질 수밖에 없다. 이같은 흐름은 시대적으로 어쩔 수 없는 것”이라고 설명했다.

국내에서는 루닛(328130), 카카오(035720), 네이버가 대화가 가능한 ‘AI의사’를 개발하고 있다. 루닛은 흉부 엑스레이를 해석해 의사들이 볼 수 있는 판독문을 써주는 LLM 모델을 만들었고 현재 시연 단계에 있다. AI가 독립적으로 영상을 판독할 수 있는 ‘자율형 AI’를 개발하는 것이 목표다.

카카오 자회사 카카오브레인도 흉부 엑스레이 사진에 대해 초안 판독문을 자동 생성해 의사가 빠르게 최종 판독을 내릴 수 있도록 돕는 생성형AI 모델 출시를 앞두고 있다.

이미 카카오의 카라 CXR은 오픈AI의 초거대 언어모델(LLM)인 GPT-4를 능가하는 진단 성능을 입증했다. 인하대병원 연구진이 국제학술지 ‘다이그노스틱스’를 통해 공개한 데이터에 따르면 카라 CXR의 정확도는 68~70% 수준으로, GPT-4(40~47%)보다 20%포인트 이상 높았다.

카카오브레인 카라 판독문 작성 예시 (사진=카카오브레인)
배웅 카카오브레인 CHO(Chief Healthcare Officer)는 “영상의학과 의사 부족으로 인한 판독 지연과 오류 문제를 해결하기 위해 생성형 AI 기술을 주목했다”며, “아직 인허가를 받지 않았지만, 관련 프로젝트로로 KARA CXR를 개발했고 출시를 앞두고 있다”고 전했다.

네이버는 자체 개발한 LLM ‘하이퍼클로바X’를 활용한 헬스케어 서비스를 테스트하고 있다. 헬스케어연구소 산하 사내병원을 활용, AI 기반 다이어트 프로그램으로 직원들의 체중 관리에 도움을 주는 방식이다. 또한 생성형 AI를 활용한 진료 차트 생성, 네이버 예약 시스템을 활용한 환자-의료진 연결, 독거 노인 대상 AI 의료 케어 전화 서비스 등 다양한 의료 플랫폼 출시를 앞두고 있다.

나군호 네이버 헬스케어 연구소장은 “2028년이 의료AI 실용화의 원년이 될 것으로 전망한다”며 “네이버의 경우 순천향대 대학병원 간호사들의 음성파일을 학습한 음성인식 전자의무기록(EMR) 개발을 완료했다. 삼성의료원 응급실과 실증 사업 중이며, 이르면 올해 말이나 내년 중 의료기관에 제공할 수 있을 전망”이라고 예고했다.