구글 이어 엔비디아까지… LG AI연구원 ‘엑사원 3.0’ 협업 눈길

by김현아 기자
2024.09.24 13:14:11

엔비디아 H100 GPU와 네모 프레임워크 활용
구글 클라우드 인프라도 활용
AI 생태계의 혁신 가속화

[이데일리 김현아 기자] 엔비디아가 LG AI연구원의 최신 AI 모델 ‘엑사원 3.0’(EXAONE 3.0)에 엔비디아 H100 GPU와 네모(NeMo) 프레임워크를 적용했다고 24일 발표했다. 이번 협업은 AI 생태계의 발전을 더욱 가속화할 것으로 기대되며, 양사의 기술력이 융합된 혁신적인 결과물이 주목받고 있다.

엑사원 3.0은 지난 8월 발표된 LG AI연구원의 AI 파운데이션 모델로, 한국어, 영어, 코딩 등 13개 벤치마크 점수에서 1위를 기록했다.

특히 메타(Meta)의 라마(Llama) 등 글로벌 동급 오픈소스 모델과 비교했을 때 한국어와 영어에서도 뛰어난 벤치마크 성능을 보여주며, 누구나 연구 목적으로 자유롭게 활용할 수 있는 기회를 제공한다. 이로 인해 LG AI연구원은 국내외 연구자들의 적극적인 참여를 유도하고 있다.

출처=엔비디아

이번 협업의 핵심 기술 중 하나인 네모 프레임워크는 생성형 AI 모델을 구축하고 맞춤화할 수 있는 엔드 투 엔드 솔루션을 제공하여, 데이터 처리에서 모델 훈련, 추론에 이르는 전체 과정을 최적화한다.

이를 통해 엔비디아는 투자 대비 수익률(ROI)을 높이고, 빠른 훈련과 효율적인 모델 배포를 가능하게 했다. 이와 함께 엑사원 3.0은 텐서RT-LLM(TensorRT-LLM) SDK를 기반으로 하여 효율적인 비용으로 모델을 배포할 수 있도록 지원하고 있다.

또한 LG AI연구원은 엑사원 3.0을 기반으로 한 엔터프라이즈 AI 에이전트 ‘챗엑사원’(ChatEXAONE)을 공개했는데, 엑사원 3.0과 챗엑사원은 구글 클라우드의 AI 최적화 인프라를 기반으로 개발됐다.

챗엑사원은 LG 그룹사를 대상으로 오픈 베타 서비스로 제공되며, 기업 사용자들에게 업무 효율성을 높이고 전문가 수준의 인사이트를 제공하는 데 중점을 두고 있다. 이 AI 에이전트는 기업 내 다양한 데이터베이스와 외부 도구와 연결돼 사용자들에게 보다 직관적이고 유용한 정보를 제공하는 기능을 갖추고 있다.

구글 클라우드는 LG AI연구원이 AI 모델 경량화 기술 연구개발과 비용 효율화 목표를 달성하는 데 중요한 역할을 했다. 엑사원 3.0 모델은 온디바이스 AI에 들어갈 초경량 모델부터 범용 목적의 경량 모델, 전문 분야에 특화된 고성능 모델까지 다양한 사이즈로 구성돼 있다.

이화영 LG AI연구원 상무는 “엑사원 3.0 7.8B 모델을 오픈소스로 공개한 것은 전 세계 AI 연구자들을 지원하기 위한 의도”라며, “구글 클라우드는 이러한 비전을 실현할 최적의 파트너”라고 설명했다.

이번 협업을 통해 LG AI연구원은 더욱 발전된 AI 생태계를 구축하며, 한국의 AI 원천 기술을 선도할 수 있는 발판을 마련했다. 엔비디아와 구글과의 협력은 LG AI연구원이 지속적으로 AI 기술의 경계를 확장하는 데 기여할 것으로 보인다.

한편 LG AI연구원은 엑사원 3.0의 다양한 활용 사례를 보여주며, LG유플러스에서는 엑사원 기반의 생성형 AI인 ‘익시젠’(ixi-GEN)을 출시한 바 있다. 이번에 공개된 7.8B 인스트럭션 튠드 모델은 오픈소스로 제공되며, 허깅페이스(Hugging Face) 리포지토리와 기술 보고서에서 자세한 정보를 확인할 수 있다.