“전자, 통신…LG계열사에 우리 LLM 심어요”
by김현아 기자
2024.10.01 06:04:00
LG AI연구원 최정규 상무
'엑사원 3.0’ 도입한 LG전자 콜센터 1위
영어 데이터가 한국어 성능에 미치는 영향으로 논문
파라미터 78억개는 산업계 니즈, 오픈소스 공개
[이데일리 김현아 IT전문기자] LG AI연구원이 자체 개발한 생성형 AI 파운데이션 모델 ‘엑사원 3.0’이 LG그룹의 전자, 화학, 통신 등 계열사에 도입될 것으로 보입니다. LG AI연구원의 최정규 상무는 이데일리와의 인터뷰에서 이같이 밝히면서 “엑사원 3.0을 오픈소스로 공개하면서 ACL 학회에 논문을 제출하고 국제 특허도 출원했다”고 말했습니다. ACL(Association for Computational Linguistics)은 세계 3대 자연어처리(NLP) 학회 중 하나입니다.
| [이데일리 이영훈 기자] LG AI연구원 최정규 상무 인터뷰 |
|
LG AI연구원이 2024년 8월 공개한 ‘엑사원(EXAONE) 3.0’은 78억 개의 파라미터를 가진 AI 모델로, LG 계열사의 AI 기술 고도화에 기여하고 있습니다. 2020년 12월 구광모 회장의 지원으로 설립된 LG AI연구원은 3년 반 만에 글로벌 수준의 AI 모델을 개발했습니다.
‘엑사원 3.0’은 외부 서비스용으로는 공개되지 않았지만, LG 계열사들은 보유 데이터를 활용해 엑사원 3.0을 최적화(파인튜닝)한 뒤 다양한 용도로 활용하고 있습니다. 최 상무는 “LG전자의 AI 콜센터(AICC)에 엑사원을 도입해 상담원 업무 보조, 요약 및 정리 기능을 지원하고 있는데, 한국표준협회가 주관하는 ‘콜센터 품질지수(KS-CQI)’ 평가에서 65개 업종, 270개 기업 및 기관 중 1위를 차지했다”면서 “LG유플러스의 U+tv에 도입된 상태이며, 조만간 다양한 온디바이스 제품군에도 탑재될 예정”이라고 했습니다. 온디바이스 AI란, 서버나 클라우드와의 연결 없이 모바일 기기 자체에서 정보를 처리하는 기술을 의미합니다.
LG AI연구원의 생성형 AI 모델 ‘엑사원(EXAONE) 3.0’은 글로벌 오픈소스 AI 생태계에서 최상위 성능을 입증했습니다. △MT-Bench △AlpacaEval-2.0 △Arena-Hard △WildBench 등 총 13개 벤치마크 중 코딩, 수학 등 실제 사용성 평가에서 모두 1위를 기록했습니다. 메타(Meta)의 ‘라마(LLaMA) 3.1’과 구글(Google)의 ‘젬마(GEMMA) 2’ 등 글로벌 오픈소스 AI와 비교해도 뛰어난 성능입니다.
한국어 처리 성능에서는 세계 최고 수준을 기록했습니다. 최 상무는 “AI 학습 데이터의 대부분이 영어로 구성되기 때문에 한국어 성능을 높이는 것이 쉽지 않다”면서 “영어 데이터가 한국어에 미치는 영향을 밝혀내, ACL 학회에 논문을 발표하고 글로벌 특허도 출원했다”고 설명했습니다. LG AI 연구원의 전체 인력은 약 300명으로, 이 가운데 240여 명이 연구 인력입니다. 대부분 석사와 박사 학위를 보유한 전문가들이라고 합니다.
최 상무는 LG AI연구원의 글로벌 인지도를 언급하며, “ACL 학회에서 논문을 발표하고 부스를 운영했을 때, 메타(Meta), 아마존, 알리바바, IBM과 같은 글로벌 IT 기업들이 옆에 있었다. 교수님들로부터 그간 외부에 공개되지 않아 많은 궁금증을 자아냈던 LG의 AI 기술이 글로벌 수준에 도달했다는 좋은 평가를 받았다”고 전했습니다.
AI 모델의 성능을 좌우하는 요소 중 하나가 바로 파라미터(매개변수) 크기입니다. ‘엑사원 3.0’은 78억 개의 파라미터를 갖고 있습니다. 최 상무는 “78억 개의 파라미터는 GPU(그래픽처리장치) 한 장에 올릴 수 있는 최대 사이즈로, 산업계에서 필요로 하는 최적의 크기를 고려해 전략적으로 설계한 것”이라고 했습니다. AI 모델의 크기를 무조건 늘리는 것이 능사가 아니라, 실제 사용 환경과 기술적 제약을 반영해 최적의 크기로 조정하는 것이 더 중요하다는 의미입니다.
‘엑사원 3.0’은 오픈소스로 공개돼 지지를 받고 있기도 합니다. 그는 “오픈소스로 공개해 우리의 기술 발전 과정을 보여주고, 이를 통해 국내외에서 LG AI 연구원의 기술력을 인정받아 더 많은 협력 기회를 창출하기를 기대한다”고 했습니다. 엑사원 3.0은 연구 용도로는 무료로 사용할 수 있으며, 상업적 용도로는 라이선스 비용이 발생합니다. 단순히 모델의 크기에 집중하기보다는 최적화된 성능과 효율적인 사용성을 강조하며, 글로벌 AI 생태계에서 새로운 입지를 다지기 위한 포석이라고 볼 수 있습니다.
한편 LG AI연구원이 출범하기까지는 약 2년간의 TF(태스크 포스) 작업이 있었다고 합니다. 그는 “AI 시대에 맞는 인재 양성을 위해 직급이 아닌 성과 중심으로 인사제도가 돼 있다”며, “기업들이 AI 개발에 전념할 수 있도록 별도의 조직을 구축하는 것이 중요하다”고 언급했습니다.