인공지능 시스템, 건강검진에서 폐암도 잡아낸다

[이데일리 이순용 기자]서울대병원이 개발한 인공지능 흉부X선 진단시스템이 또 다시 성능을 입증했다.

서울대병원 영상의학과 박창민 교수팀(이종혁·선혜영)은 2008년~2012년 건강검진을 받은 5만70명의 흉부X선 사진을 활용해, 진단시스템의 성능을 검증한 결과를 19일 발표했다.

건강검진으로 촬영 한 흉부X선 사진. 우측 폐 상부에 폐암이 의심 되는 음영이 있고 (좌), 이는 흉부 전산화 단층촬영상에서도 폐암이 의심됨 (가운데). 인공지능 시스템은 이 병변의 존재와 위치를 식별하여 폐암으로 판정함 (우).

수집된 자료는 총 10만576장이며 실제 폐암은 98장이었다. 이 중, 흉부 X선만으로는 폐암인지 확인이 어려운 51장을 제외한 뒤, 진단시스템의 성능을 측정했다. 그 결과, 인공지능 진단시스템은 약 97%의 진단정확도를 보이며 우수한 성능을 입증했다. 또한 약 83%의 우수한 민감도를 보였다. 민감도는 검사법이나 예측도구의 성능을 잘 나타내는 지표이다. 특히, 매우 뚜렷하게 보이는 폐암에선 100%의 민감도를 보였다.

이번 연구는 건강한 일반인 대상 실제 건강검진 상황에서 시스템의 진단능력을 검증했다는 의의가 있다. 이전 연구를 통해 인공지능 진단시스템의 성능은 검증됐으나, 질병의 빈도가 낮은 일반인에게 적용했을 때 결과는 알려지지 않았다. 이번 연구는 총 5만70명의 수검자 중 폐암 빈도가 약 0.1% 수준으로 매우 낮았다. 실험 결과, 진단시스템은 실제 상황에서도 높은 정확도를 보이며 성능을 증명했다.

우리나라 한 해 건강검진 수진자는 500만 명이 넘는다. 대량의 흉부X선 검사가 시행됨에 따라 판독할 영상의학과 의사의 업무가 과중되고, 판독 오류로 이어질 위험도 많다. 향후 인공지능이 해당영역에서 과중한 업무를 덜어줄 수 있을 것으로 기대된다.

박창민 교수는 “이번 연구를 통해 인공지능시스템이 대규모 건강검진 상황에서 폐암을 찾는데 유용하다는 사실을 확인했다”며 “인공지능이 연구실 수준을 넘어, 실제 환자나 일반인들에게 실질적인 도움이 될 수 있도록 연구 개발을 지속할 것”이라고 밝혔다.

건강검진 흉부X선 상 폐암 진단에 대한 인공지능시스템과 영상의학과 전문의의 진단능 비교 그래프. 인공지능시스템의 진단능 그래프(청색)가 영상의학과 전문의의 진단능을 나타내는 점 (적색) 위에 위치하고 있고, 이는 더 나은 진단능을 나타냄.

이번 연구는 서울대학교병원 집중육성연구 지원으로 시행됐으며, 서울대학교병원과 ㈜루닛이 공동개발한 루닛인사이트 CXR 인공지능을 활용하였다. 연구 결과는 영상의학 분야 최고권위 학술지인 ‘방사선학(Radiology)’ 온라인판에 게재됐다.