솔트룩스 AI모델 '루시아', 35B 이하 모델 평가서 1위

by임유경 기자
2024.03.15 09:15:57

허깅페이스 오픈LLM 리더보드 기록
전체 모델 중엔 4위...상식·추론 능력 최고점 경신

[이데일리 임유경 기자] 인공지능(AI) 기업 솔트룩스(304100)는 자체 거대언어모델(LLM) 루시아가 전 세계 언어모델들을 평가하는 허깅페이스 오픈 LLM 리더보드에서 35B(매개변수 350억개) 모델 부문 1위를 차지했다고 15일 밝혔다.

루시아는 이 부문에서 약 77.74점의 평균 점수를 얻어 1위에 올랐다. 루시아는 특히 상식능력(HellaSwag)과 추론능력(ARC) 테스트에서 각각 91.88점, 77.47점을 받으며 기존 기록을 경신했다.

전체 초거대 모델들을 기준으로도 매개변수 50B 이상의 대규모 모델들을 제치고 전 세계 4위를 달성했다. 적은 매개변수로도 높은 성능을 갖춰, 더 효율적인 작동이 가능한 모델임을 입증받았다.



현재 21.4B 루시아 모델은 허깅페이스 업로드 3일 만에 500회 이상의 다운로드를 기록하는 등 크게 주목받고 있다. 루시아 21.4B 모델의 베이스 버전도 추가로 공개할 계획이다.

루시아 한국어 모델은 한국지능정보사회진흥원(NIA) AI HUB 평가 데이터셋을 사용한 한국어 자체 검증에서도 GPT3.5-터보 및 오픈 모델들을 훨씬 뛰어넘는 검색 증강 생성(RAG) 및 요약 평가 점수를 달성했다. RAG 기반 질의응답 정확도 90% 이상 등 우수한 성능 평가 점수를 기반으로 여러 기관 및 기업들과 빠르게 LLM 도입 사업을 추진하고 있다.

솔트룩스 관계자는 “자체 연례 행사인 올해 솔트룩스 AI 컨퍼런스에서 현재의 루시아를 압도적으로 뛰어넘는 혁신적인 LLM을 공식적으로 선보일 것”이라며 “국내 대표 인공지능 기업으로써 글로벌 AI 시장을 선점할 초격자 경쟁력을 계속해서 확보해 나가겠다”라고 말했다.