국내 주요 대형언어모델(LLM)들의 성능이 대학입시를 치르면 낙방하는 수준에 불과한 것으로 나타났다. 김종락 서강대학교 수학과 교수 연구팀이 정부가 추진하는 국가대표 인공지능(AI) 프로젝트에 도전장을 낸 국내 5개 AI 개발팀의 LLM을 평가한 결과다. 반면 챗GPT 등 해외 주요 모델들은 같은 평가에서 모두 합격선에 들었다. 이는 글로벌 AI 경쟁에서 우리나라가 얼마나 많이 뒤지고 있는지를 일깨워주는 경종이다.
평가 대상 국내 모델은 업스테이지의 솔라 프로-2, LG AI연구원의 엑사원 4.0.1, 네이버의 HCX-007, SK텔레콤의 A.X. 4.0, 엔씨소프트의 라마 바르코 8B 인스트럭트다. 해외 모델은 GPT-5.1, 제미나이 3 프로 프리뷰, 클라우드 오푸스 4.5, 그록 4.1 패스트, 딥시크 V3.2다. 김 교수팀은 이들 모델에게 수학능력시험 수학 문제 20개와 국내외 대학 논술 문제 30개를 풀게 했다. 그 결과 해외 모델들이 76~92점을 받은 데 비해 국내 모델들은 2~58점을 받아 차이가 컸다. 그나마 솔라 프로-2가 58점을 받아 유일하게 후순위 턱걸이 합격이라도 노릴 수준으로 평가됐다. 라마 바르코 8B 인스트럭트는 불과 2점에 그쳐 초등학생이 대입 시험을 치른 꼴이고, 나머지 3개 국내 모델도 20점대를 받는 데 그쳤다.
국가대표 AI를 놓고 다투는 국내 모델들의 성능이 고작 이런 정도라니 개탄스럽다. 국가대표 AI는 소버린 AI를 지향하는 것이다. 소버린 AI는 외국의 간섭이나 외국에 대한 의존 없이 독자적으로 개발하고 운영하는 AI를 가리킨다. 아무리 글로벌화가 대세라고 해도 기술 주권 확보는 국가의 생존과 번영에 필수 요소임에 변함이 없다. 특히 오늘날과 같이 첨단기술이 국력을 좌우하는 시대에는 더욱 그렇다고 할 수 있다.
AI가 세계적으로 지식과 산업 활동의 중추로 떠오르는 시대에 경쟁력 있는 소버린 AI를 갖추지 못해서는 미래가 어두울 수밖에 없다. 우리의 AI 경쟁력을 서둘러 높여가야 한다. 최근 정부와 기업들이 AI의 중요성을 인식하고 투자에 적극 나서고 있지만 아직도 많이 부족하다. AI 전문 인력을 제대로 길러내지 못하는 교육 제도를 시급히 개선해야 한다.
![메리츠화재, 4000평 펜션 단돈 16억에 내놓은 사연[only 이데일리]](https://image.edaily.co.kr/images/Photo/files/NP/S/2025/12/PS25121701171t.500x.0.jpg)


![침묵보다 못해… 박나래, 사과·해명無 영상에 업계도 '당황'[스타in 포커스]](https://image.edaily.co.kr/images/vision/files/NP/S/2025/12/PS25121701207t.jpg)
