연세대 의대 의생명시스템정보학교실 박유랑 교수와 유재용 박사, 심우섭 연구원과 연세암병원 종양내과 김한상 교수 연구팀은 조기 발병 대장암 환자의 임상데이터를 기반으로 사망 위험을 예측하는 양자 머신러닝 모델을 개발했으며, 예측 정확도는 90%에 달한다고 12일 밝혔다. 이번 연구 결과는 국제학술지 ‘어플라이드 소프트 컴퓨팅’(Applied Soft Computing)에 게재됐다.
젊은 대장암이라고도 불리는 ‘조기 발병 대장암’은 50세 미만에서 발생하는 대장암을 말한다. 우리나라의 20~40대 대장암 발병률은 인구 10만명당 12.9로 세계 1위다. 조기 발병 대장암은 다른 연령층에서 진단되는 대장암과 비교해 더 공격적이고 생존율이 낮다. 때문에 조기에 질병을 발견하고 정확한 예후예측을 통한 치료가 중요하다.
최근 헬스케어 분야에서 질병의 진단, 예후예측 등에 활용할 수 있는 AI 기반의 다양한 인공지능 모델들이 개발되고 있다. 인공지능 모델의 예측 정확도를 높이기 위해서는 충분한 임상데이터가 필수적이다. 하지만 헬스케어 분야는 비용 문제, 희귀질환에 대한 데이터 부족 등 어려움이 있다. 이로 인해 적은 데이터의 양으로도 분석 정확도를 높일 수 있는 양자컴퓨팅 기술이 주목받고 있다.
연구팀은 양자컴퓨팅 기반의 ‘Quantum Support vector machine’을 통해 조기 발병 대장암 환자의 사망 위험 예측 모델을 개발하고 그 정확성을 분석했다. 2008년부터 2020년까지 세브란스병원에 내원한 조기 발병 대장암 환자 1253명의 치료 데이터를 기반으로 환자의 질병 상태에 따른 사망 위험을 예측하는 양자 머신러닝 모델을 개발했다. 양자컴퓨팅 기술을 활용한 머신러닝 모델의 예측 인자로는 나이, 성별과 같은 환자 정보 데이터와 병기, 치료 정보에 관한 임상데이터 등 총 93개의 변수를 적용했다.
연구팀은 해당 모델의 효과성을 확인하기 위해 최적의 변수 개수, 표본 크기, 결과변수의 비율에 따른 정확도를 기존 머신러닝모델과 비교분석했다. 예측 정확도는 ‘수신기 작동 특성 곡선’(AUROC)의 지표로 분석했다. AUROC는 ‘ROC 곡선의 아래 면적’으로, 어떤 예후를 예측하기 위한 특정 검사 도구의 예측 정확도를 나타내는 방법이다. AI 모델의 성능평가 지표로 주로 사용되는데, 통상적으로 1에 가까울수록 성능이 뛰어나며 0.8 이상이면 고성능 모델로 평가된다.
|
분석 결과 기존 머신러닝 모델(Conventional SVM)의 예측 정확도는 70%를 기록한데 비해 양자 머신러닝 모델은 조기 발병 대장암 환자의 사망 위험 예측 정확도가 90%를 기록했다. 또한 연구팀은 양자컴퓨팅의 견고성을 검증하기 위해, 사망과 생존의 비율을 조절해 성능 검증을 진행했다.
그 결과, 기존 머신러닝 모델은 사망 비율을 불균형하게 조정했을 때 예측 성능이 80%를 보였다. 반면 양자 머신러닝 모델의 예측 정확도는 사망 비율이 불균형한 상황에서도 88%의 높은 예측 정확도를 유지하며, 양자 머신러닝 모델이 사망과 생존의 비율이 불균형한 상황에서도 기존 머신러닝 모델에 비해 더 높은 예측 정확도를 유지하는 것을 확인했다.
박유랑 교수는 “이번 연구를 통해 조기 발병 대장암 환자의 사망 위험을 정확히 예측하는 양자 머신러닝 모델을 구축했다”면서 “이를 기반으로 앞으로도 양자 머신런닝 모델을 활용해 다양한 영역의 헬스케어 분야에 확장이 가능할 것으로 기대한다”고 말했다.
김한상 교수는 “이번 연구는 종양 분야에서 양자 컴퓨터, 의료 인공지능 등을 활용한 디지털 헬스케어가 접목되는 한 예로 암의 진단, 치료, 생존자 관리에 디지털 헬스케어 기술의 도입이 앞으로 암 진료 현장의 치료 패러다임을 바꿀 수 있을 것”이라고 말했다.
이번 연구는 산업통산자원부 산업혁신인재성장지원사업(P0023675)의 2024년 연구비를 지원받아 수행됐다.