그동안 네이버의 거대언어모델(LLM) ‘하이퍼클로바 X’는 한국어 이해 능력이 뛰어난 모델로 평가받았지만, 오픈소스 플랫폼에서는 활용이 제한적이었습니다. 특히 글로벌 오픈소스 플랫폼 ‘허깅페이스(Hugging Face)’에서는 관련 모델을 찾기 어려워, 국내외 개발자들이 네이버 AI 생태계에 참여하기 쉽지 않았습니다.
그러나 지난 4월 23일, 네이버클라우드는 ‘하이퍼클로바 X’의 세 가지 크기 모델을 허깅페이스에 공개하며 이러한 한계를 돌파했습니다.
공개된 모델은 △하이퍼클로바X 시드 3B △시드 1.5B △시드 0.5B입니다. 이 중 3B 모델은 텍스트, 이미지, 음성을 동시에 처리하는 멀티모달 모델로, AI가 글을 읽고, 이미지를 보고, 소리를 들으며 종합적으로 이해할 수 있는 능력을 갖췄습니다. 1.5B와 0.5B 모델은 텍스트 처리에 특화된 언어모델입니다.
|
이는 기존 LG AI연구원이 공개한 ‘엑사원’ 모델과 비교해도 큰 차별점입니다. LG의 엑사원은 연구 목적으로만 개방되었고, 상업적 활용에는 제한이 있었습니다. 같은 맥락에서 이준석 개혁신당 대선 후보는 최근 안철수 국민의힘 경선 후보와의 AI 대담에서 “엑사원은 연구용으로 개방됐지만 상업적 활용은 제한적이었다”고 아쉬워했습니다.
네이버 내부에서도 이번 결정은 쉽지 않았던 것으로 알려졌습니다. 경영진 설득 과정을 거쳐 연구와 상업적 활용을 모두 허용하는 파격적인 오픈소스 공개가 이뤄진 겁니다.
공개된 네이버 모델에 대한 초기 반응도 긍정적입니다. 김태형 바이오넥서스 대표는 페이스북을 통해 “1.5B 텍스트 모델을 테스트해 본 결과, 한국어에 최적화된 모델답게 문맥 이해력과 응답의 자연스러움에서 매우 인상적인 성능을 보였다”며 “특히 바이오 분야 같은 전문 영역에서도 높은 정확도와 실용성을 보여줬다”고 밝혔습니다. 이어 “이 모델은 바이오 분야에 특화된 파인튜닝, RAG(검색증강생성), 온프레미스(설치형)서비스 구축을 상용화 관점에서 시도할 수 있는 국내 최초의 오픈소스 모델이라는 점에서 기대가 크다”고 덧붙였습니다.
이번 네이버의 오픈소스 공개는 단순한 기술 공유를 넘어, 국내 AI 기술의 글로벌 확산과 더불어 다양한 개발자 및 기업들이 네이버 AI 생태계에 참여할 수 있는 실질적 기회를 제공한 것으로 평가됩니다.
AI 기술 경쟁이 심화되고 있는 가운데, 네이버의 이번 행보는 한국형 AI 위상을 높이고, 국내외 혁신 서비스 개발을 촉진하는 중요한 계기가 될 것으로 보입니다.
더 나아가 오픈소스 전략은 정부가 추진 중인 ‘한국형 챗GPT(월드 베스트 LLM)’ 프로젝트에서도 핵심적인 역할을 할 전망입니다. 이 프로젝트는 세계 최고 수준의 한국형 거대언어모델 개발을 목표로 하며, 오는 5~6월 중 참여 기업 공모가 진행될 예정입니다. 정부는 선정된 기업에 대규모 데이터셋, GPU 등 컴퓨팅 인프라, 고급 AI 인재 등을 집중 지원하고, 개발된 모델은 오픈소스로 공개될 계획입니다. 이를 통해 공공 데이터 및 공공 AI 서비스에 활용될 수 있도록 별도의 인센티브도 제공됩니다.
이처럼 오픈소스는 단순한 기술 개방을 넘어, 국내 AI 솔루션과 AI 서비스 전반을 성장시키는 동력으로 작용할 것으로 기대됩니다.
네이버의 이번 결정은 그 시작을 알리는 신호탄으로 평가받고 있습니다.