[AI신약社 생존전략上] AI로 신약개발 판 바꾸는 구글...K바이오 미래는
by김승권 기자
2024.06.06 09:10:20
[이데일리 김승권 기자] AI 신약개발 기술이 제약·바이오업계의 판을 바꾸고 있다. 미국 빅파마(연 매출 13조 이상 제약사)들은 진행 중이던 신약 개발 파이프라인을 멈추고, AI가 도출하는 결과를 본 뒤 파이프라인 우선 순위를 바꿀 정도다.
가장 앞서는 기업은 구글 딥마인드다. 2016년 ‘알파고’로 세계 바둑을 제패한 구글 딥마인드는 인공지능(AI)을 통해 신약 개발의 비밀을 하나하나 풀고 있다. 단백질 구조 예측에 그치지 않고 생체 분자와 단백질 간 상호작용까지 예측하는 수준으로 진화했다. 실제 알파폴드는 폐 질환 신약후보물질을 46일 만에 발굴하기도 했다. 수년은 걸릴 작업을 두 달 남짓으로 줄인 것이다. 이에 업계에서는 구글 딥마인드가 엔비디아 생성형 AI 기반 신약개발 플랫폼 바이오니모나 마이크로소프트(MS) AI 에보디프보다 앞서있다는 평가가 나왔다.
인공지능(AI)을 이용한 신약개발이 효율적인 이유는 사람이 발견할 수 없는 패턴을 AI가 찾아낼 수 있는 능력을 갖고 있어서다. 사람은 단백질 구조를 1000개 본다고 해도 공통적인 패턴을 찾는 것은 불가능하다. 하지만 AI는 수학적 모델이기 때문에 그런 패턴을 사람보다 쉽게 찾아낼 수 있다.
AI신약개발 기업 한 관계자는 “신약 개발의 핵심은 일종의 패턴을 찾아내는 일이다. 약물이 질환을 일으키는 단백질에 잘 붙느냐, 안 붙느냐가 관건이다. 물리적인 방식을 거치는 AI는 기존 계산하는 방식보다 정확도가 높다”고 설명했다.
신약개발에서 단백질은 인간 질병의 자물쇠로 불리고, 약은 열쇠로 비유된다. 질병과 연관되어 있는 단백질을 찾을 수 있으면, 이 단백질에 꼭 맞는 물질을 찾아 치료제를 만들 수 있다는 의미다. 실제 단백질은 세포의 관문으로서 물질 수송이나 외부 신호 감지 등 중요한 생리기능을 담당하고 있다. 이에 단백질의 구조에 대한 정보는 단백질에 결합하는 화합물을 단백질의 작용원리에 따라서 찾을 수 있게 하는 매우 중요한 정보다. 코로나19 백신도 이런 방식으로 탄생했다. 코로나19 바이러스 표면에는 ORF8 등 20여 종의 단백질이 있고 이것을 몸에 주입해서 항체를 만드는 방식이다.
| 인공지능(AI)가 활용되는 신약개발 과정 (자료=딜로이트) |
|
국제학술지 ‘네이처’에 따르면 구글의 알파폴드3는 단백질-단백질 상호작용뿐만 아니라, 단백질-리간드 및 단백질-DNA 상호작용까지 예측할 수 있어 생물학적 이해와 약물 개발에 큰 혁신을 가져올 것으로 기대된다. 단백질 구조 분석을 통해 타겟을 정확하게 발견할 수 있고 후보물질 스크리닝 과정에서 약물과 단백질을 효과적으로 결합할 수 있는 후보물질을 빠르게 찾을 수 있게 된 것이다.
딥마인드 관계자는 “약물 효능을 높이고 부작용을 최소화하기 위해 단백질 상호작용을 예측하여 실험을 줄이고 임상 시간을 단축할 수 있게 됐다”고 설명했다.
그렇다면 향후 AI신약개발 시장 판도는 어떻게 바뀔까. 알파폴드로 인해 한국의 AI신약 회사는 도태되는 것이 수순일까. 여러 의견이 있지만 일단 현 단계에서는 구글 알파폴드의 모델이 ‘게임체인저’는 될 수 없을 것으로 전망된다. 반면 국내 AI신약개발 업체 경쟁력이 강화되지 않는다면 미국의 국내 시장 잠식 우려는 여전히 존재한다는 의견도 있다.
실제 한국은 세계 시장에서 인공지능(AI) 영상판독 산업 역량은 우수하지만 신약개발AI 분야에선 상당 부분 뒤처져 있다. 특허청이 최근 10년 주요국(한, 미, 중, 유럽연합, 일)에 출원된 특허를 분석한 결과, 루닛(328130), 딥바이오 등이 이끄는 한국의 AI의료영상(X선·초음파·CT·MRI 등) 데이터 분석 특허 수는 중국, 미국에 이어 3위였다.
하지만 AI신약개발 분야에서는 논문 수(특허도 비슷한 수준) 기준 세계 8위 수준이었다. 우리나라는 미국과 유럽 대비 각각 6년, 5년 기술 격차가 있는 것으로 나타난다. 일본 대비 3년, 중국에 비해서도 기술 역량이 1년 가량 늦다.
| 김우연 카이스트 교수(전 제약바이오협회 AI신약융합연구원 부원장, 히츠) |
|
김우연 카이스트 화학과 교수(전 한국제약바이오협회 AI신약융합연구원 부원장)는 “AI 기술은 독점력이 강하고, 전체 논문 수보다 각 분야 최고 기술이 얼마나 있느냐가 더 중요하다. 그런 면에서 한국은 단순히 순위 차보다 영향력 지수로 따지면 훨씬 더 격차가 큰 것 같다”며 “LLM(거대언어모델)의 경쟁이 기술보다는 컴퓨팅 파워, 데이터 등 자본력의 경쟁으로 변해간 것처럼 알파폴드3 최신 기술 개발에 있어서 점점 더 자본의 영향력이 커지고 있다. 한국에서는 상대적으로 적은 자본이 투입되다 보니 앞으로 한국의 경쟁력이 미국, 중국, 유럽에 비해 더 떨어지지 않을까 우려된다”고 내다봤다.
그는 이어 “국내 제약산업 규모는 글로벌 3%도 미치지 못하고, 미국, 유럽, 일본 등 전통적인 제약 강국에 비해 매우 미미하다. 민간의 자본 만으로 성장할 수 있는 미국 및 유럽과 경쟁하기 위해 당분간 정부 투자가 불가피하다”며 “추가로 신기술의 발전을 방해하는 낡은 규제들을 과감히 철폐함으로 AI신약개발의 더 빨리 발전할 수 있는 환경을 조성해야 빅테크와 경쟁할 수 있다”고 강조했다.
이에 반해 빅테크의 AI신약개발 모델이 과대 평가 받고 있다는 의견도 있다. 알파폴드는 분자 상호작용 예측과 분석, 즉 과학적 이해에 도움을 준다면 한국의 스탠다임, 쓰리빌리언 등과 같은 AI신약개발 회사는 신약 개발 과정에 AI를 적용하여 실질적인 의약품 개발에 기여할 수 있는 방식으로 살길을 모색할 수 있다는 것이다.
금창원 쓰리빌리언 대표는 “알파폴드는 ‘단백질 구조 예측 인공지능 모델’이지, 이 자체로 ‘신약개발’이 되지는 않는다. 결국 신약개발을 위한 하나의 부분인 것”이라며 “국내 AI신약개발사의 살길은 알파폴드가 해결되지 않은 부분들에 기술을 집중해 메꾸는 형태가 맞을 것으로 본다. 이를테면 사이드 체인 예측이라던가, 구조 예측에서도 여전히 해결 안 된 부분들이 있다. 이런 부분이 신약을 정밀하게 디자인 하는데는 매우 중요하기 때문에 구조 기반 신약 개발사들은 이런 기술에 앞으로 집중하게 될 것으로 보인다”고 관측했다.
데이터 투명성 문제도 있다. 미국 AI 기업 리커전의 발표에 따르면 알파폴드는 양적으로 인상적인 결과를 가져왔지만 모델이 결합을 정확하게 예측했는지에 대한 실험실 검증 데이터가 정확히 검증되지 않았다.
송상옥 스탠다임 대표는 “알파폴드는 단백질, DNA, RNA, 소분자 등 다양한 생체 분자의 상호작용을 예측할 수 있지만 스탠다임 AI 모델은 주로 신약후보물질 발굴과 최적화에 초점을 맞추고 있다”며 “이는 알파폴드가 스탠다임의 구조기반 약물탐색 워크플로우의 한 구성요소로써 활용될 수 있다는 것을 의미한다”고 강조했다.
◇아래는 AI신약개발 전문가 김우연 카이스트 교수(전 AI신약융합연구원 부원장)와의 일문일답.
△이 두 회사에 특정짓기보다는 소위 현존 최고 모델 보다 낫다고 주장하는 회사들에 대해서 답변하겠다. 인공지능의 예측 성능은 구체적으로 어떤 방법으로, 어떤 조건하에서, 어떤 벤치마크를 이용하여 테스트 했는지에 따라 성능의 왜곡이 매우 크다. 특히 데이터가 적고, 외부 환경에 영향을 매우 크게 받는 바이오 문제에서 이러한 경향이 더욱 크게 관찰된다.
알파폴드3와 같은 기술은 창의적인 아이디어 만으로 해결되지 않는다. 엄청난 자본력을 바탕으로한 컴퓨팅 파워와 각 요소 기술 부문에서 최고의 인재들을 통한 극한의 엔지니어링이 결합되어야 한다. 각 부분에서 상대적인 경쟁력이 떨어지는데도 불구하고, 더 나은 성능을 보였다는 것은 긴시간에 걸친 선행 연구를 통해 추적된 기술이 바탕이 될 수 있다. 하지만 최근 딥러닝 기술은 기존의 물리 기반 방법과 원리 자체가 다르기 때문에 기술의 역전은 자명하다고 할 수 있다.
△어떤 시장인지가 중요하다. 단백질, DNA, RNA, 저분자 구조 예측에 있어서 매우 강력한 기술이다. 적어도 이 분야에서는 당분간 선도하는 기술일 것으로 생각한다. 그렇지만 알파폴드3 자체의 독과점 우려는 없다. 이유는 1) 단백질, DNA, RNA, 저분자 구조 예측 외에도 신약개발에는 여러 난제가 있다, 2) 기술이 너무 빠르게 발전하고 있어서 아직 기술 발전의 한치 앞을 내다보기 힘들다 등이다.
AI신약개발 기술이 실제 신약개발까지 이어지기 위해서는 신약개발 경쟁력이 있어야 한다. AI가 만들었다고 해도 실제 실험에서 검증해야 하는 부분이 많이 있기 때문이다. 이 부분에서 한국은 기존 제약 산업과 협업 생태계가 여전히 부족하기 때문에 실제 신약개발 성과로 이어지기가 어려운 것 같다. △데이터 표준화도 미흡하겠지만, 주요 이유라고 생각하지는 않는다. 딥마인드는 누구나 사용할 수 있는 공개된 데이터를 이용해서 알파폴드3를 개발했다. 경쟁력을 강화하는 가장 효과적인 방법은 더 많은 돈을 투자하여서 인재를 유치하는 것이지만 현실적으로 쉽지 않다. 구글의 1년 R&D 예산은 50조원 정도다. 우리 정부의 1년 R&D가 40조원이 되지 않는다. 정부주도로 최신 AI 기술을 개발할 수 있도록 컴퓨팅 인프라를 구축하고, 인재 양성에 힘써야 할 것으로 보인다.
△끝으로 신기술의 등장은 산업의 지형을 바꾸어 놓기 때문에 사회의 어떤 사람들에게는 득이 되지만, 또 다른 집단에는 손이 될 수 있다. 이해관계가 서로 다른 집단간 갈등이 신기술의 시장 진입을 더디게 하고, 결국 발전의 때를 놓쳐 경쟁력을 잃게 한다. 미국이나 영국 등 시장 경제가 잘 자리 잡은 나라에서는 민간 스스로 이러한 문제를 해결할 수 있는 역량이 있지만, 우리나라는 아직 그러한 역량이 충분하지 않은 것 같다. 타다와 같은 것도 하나의 예가 될 수 있겠다. 이러한 갈등 요소를 슬기롭게 해결할 수 있도록 여러 유관 단체들이 새로운 기술의 이해를 높이고, 고민해야 할 필요가 있다.