네이버, 소버린AI로 사우디 뚫었다…아랍어LLM 구축(종합)

by최정희 기자
2024.09.12 14:44:29

작년 1000억원대 디지털트윈 수출에 이은 쾌거
세계에서 세 번째로 LLM '하이퍼클로바' 출시
美 중심 AI에 대항해 '소버린AI' 콘셉트로 중동 공략

[이데일리 최정희 기자] 네이버가 아랍어 버전의 거대언어모델(LLM·Large language model)을 구축한다. 이를 위해 사우디아라비아 데이터인공지능청(SDAIA)과 인공지능(AI) 분야 협력을 위한 협약을 맺었다. 단순히 아랍어 버전의 LLM을 구축하는 것을 넘어서 데이터센터, 클라우드 등 네이버가 국내에 도입했던 AI분야의 전반적인 기술 인프라를 사우디에 수출하는 방식이다.

네이버는 2020년 오픈AI의 챗GPT, 2021년 화웨이의 판구(Pan-Gu)에 이어 전 세계 세 번째로 ‘하이퍼클로바(HyperCLOVA)X’라는 초거대 LLM을 개발했다. 이후 미국, 중국의 AI기술력 등에 대항해 ‘소버린AI(Sovereign AI·주권과 AI의 합성어)’를 주창해왔다.

10일(현지시간)부터 사우디아라비아 리야드에서 개최된 GAIN 2024에 참석한 팀네이버. (왼쪽부터) H.E. Dr. Esam Alwagait NIC 디렉터, 이해진 GIO, 최수연 네이버 대표, H.E. Dr. Abdullah Alghamdi 데이터인공지능청장, 채선주 네이버 대외/ESG 정책 대표, 석상옥 네이버랩스 대표, 김유원 네이버클라우드 대표
챗GPT 등이 전 세계적으로 빠르게 전파되면서 시나브로 미국식 문화·언어·가치관이 담긴 LLM 등 생성형AI가 다른 나라로 퍼졌을 때 자국의 문화·언어·가치관이 흔들릴 수 있기 때문에 자국 버전의 LLM이 필요하다는 데서 출발했다. 사우디에서 개발하게 될 ‘아랍어 버전의 LLM’은 네이버의 소버린AI 전략이 타국에도 통했다는 데 의미가 있다. 이를 기반으로 사우디 뿐 아니라 아랍어를 쓰는 중동 국가 전반으로 확장 가능성이 커졌다.

네이버·네이버랩스·네이버클라우드 등 ‘팀 네이버’는 10일(현지시간) 사우디 리야드에서 열리고 있는 ‘글로벌 AI서밋 2024’에 참석해 사우디 데이터인공지능청(SDAIA)과 업무협약을 체결했다.

SDAIA는 무하마드 빈살만 왕세자 직속 기구로 국가적 차원에서 데이터와 AI전략을 실현하는 핵심 기구로 ‘글로벌 AI서밋’은 SDAIA가 주관하는 전 세계적인 규모의 AI컨퍼런스다.

팀 네이버는 이번 업무협약을 계기로 사우디와 AI·클라우드·데이터센터·로봇 분야에서 폭넓게 협력키로 했다. 구체적으로 △데이터센터 관련 솔루션 및 서비스 △이를 기반으로 한 클라우드 솔루션 △아랍어 기반 LLM 구축 및 관련 서비스 개발 △지능형 로봇 및 관련 응용 서비스 연구 개발 등을 협력한다.

김유원 네이버클라우드 대표는 ‘글로벌AI 서밋 2024’ 기조연설을 통해 “AI주권의 중요성이 커지고 있다”며 “네이버가 독보적인 AI기술 역량과 경험을 바탕으로 사우디가 AI시대의 새로운 장을 여는데 기여하겠다”고 밝혔다.

특히 이번 MOU를 비롯한 ‘글로벌AI 서밋’ 행사에는 최수연 네이버 대표 뿐 아니라 네이버 창업자인 이해진 글로벌투자책임자(GIO)가 참석했다. 채선주 대외/ESG정책 대표, 석상옥 네이버랩스 대표 등도 참여했다. 그 만큼 네이버로서는 국내에 구축했던 LLM을 비롯해 데이터센터, 클라우드 등 AI인프라를 중동에 수출할 수 있는 의미 있는 기회를 얻었다는 평가다.



네이버와 사우디의 AI분야 협력은 이번이 처음은 아니다. 네이버는 작년 10월 사우디 자치행정부택부(MOMRAH)로부터 1000억원대의 디지털 트윈 플랫폼 구축 사업을 수주받았다. 올 3월에는 사우디 에너지 기업 아람코의 IT계열사 ‘아람코 디지털’과도 파트너십을 체결했다.

사우디도 자체 LLM 개발 등을 해왔다. SDAIA는 2022년 ‘글로벌AI 서밋’을 통해 LLM ‘올람(ALLaM)’을 공개했다. 아랍어로 시를 쓰고 이해하고 아랍어 문장을 분석, 어린이가 재미있고 효과적으로 아랍어를 배울 수 있도록 돕는 모델이었다. 네이버는 올람과는 별도로 네이버의 ‘하이퍼클로바X(파운데이션 모델)’를 기반으로 아랍어 데이터를 학습시켜 검색증강생성(RAG) 방식으로 파인튜닝(미세조정)을 진행하고 현지 문화에 맞는 생성형 AI를 개발할 전망이다.

네이버의 아랍어 기반 LLM 구축 등 AI 인프라 수출은 주요국들의 소버린AI에 대한 관심이 높아지고 있음을 방증한다. 챗GPT 등 LLM을 기반으로 한 생성형AI가 빠르게 퍼질수록 ‘소버린AI’에 대한 관심이 높아지고 있다. 글로벌 리서치 회사 가트너(Gartner)는 7월초 발표한 ‘2024년 AI 하이프 사이클’에서 소버린AI를 새로운 키워드로 제시했다.

하정우 네이버 퓨처AI센터장은 7월말 한 토론회에서 “미국 AI가 성능이 좋고 똑똑한 것은 맞지만 각 나라 입장에서 봤을 때 학습 데이터의 95% 이상이 미국 인터넷 데이터이기 때문에 그 나라의 제도·정치·문화·역사·가치관 같은 것들에 대한 이해도가 낮은데 미국 가치관으로 쓴 글에 미래 세대들이 적응하게 되면 그 지역들의 가치관이 사라지게 될 우려가 있다”며 “이는 사우디 뿐 아니라 아세안, 아프리카 국가들에서도 걱정하는 부분이라 사우디는 자체적으로 LLM 등을 만들어왔다”고 설명했다.

이어 “각 나라들은 최소한 공공·교육·국방·법률·의료 같은 부문에 있어서는 경쟁력 있게 사용할 수 있는 자국을 잘 이해하는 AI를 확보하고 싶어한다”며 “다행히 우리나라는 이러한 부분에 앞서 있다”고 덧붙였다.

미국과 중국간 기술경쟁 등 지정학 시대가 심화되고 있는 현 상황도 우리나라가 AI인프라 부문을 수출하기에 유리한 정국이라는 평가도 나온다. AI기술을 중심으로 영국, 미국, 캐나다간 동맹이 형성되고 있고 중국은 개발도상국 중심으로 판을 짜고 있다. 프랑스는 아프리카 쪽으로 자국의 LLM ‘미스트랄’을 전파하고 있을 정도로 국가 대항전이 벌어지고 있다.

사우디 등 중동은 미국과 협력하기도 하지만 오랜 긴장 관계를 유지해왔고 그렇다고 중국과 협력하기에는 미국 눈치가 보이는 상황에서 우리나라는 미중 갈등에서 위험 부담이 적은 곳이다. 하 센터장은 “우리나라는 자체 기술도 있고 산업 생태계를 만든 경험이 있으니 정부와 기업이 힘을 합해 아랍, 아세안, 일부 유럽, 남미도 진출해야 한다”고 밝혔다.