X

알리바바클라우드, 720억개 LLM 오픈소스로 공개

김현아 기자I 2023.12.05 13:04:46

다양한 규모와 멀티모달 기능을 갖춘 LLM 오픈소스로 공개
720억개 파라미터 적용한 큐원-72B(Qwen-72B)와
엣지용 18억 개 파라미터 큐원-1.8B(Qwen-1.8B)

[이데일리 김현아 기자]



알리바바 클라우드가 자사 개발 거대언어모델(LLM) ‘통이치엔원(Tongyi Qianwen)’의 720억 개 파라미터(매개변수) 버전 ‘큐원-72B(Qwen-72B)’와 18억 개 파라미터 버전 ‘큐원-1.8B(Qwen-1.8B)’를 오픈소스로 공개했다.

720억 개라는 매개변수는 네이버 ‘하이퍼클로바X’의 이전 버전(하이퍼클로바)의 2년 전(2021년 11월 기준)숫자(2040억개)보다 적고, KT의 ‘믿음(Mi:dm)’이 최대 2000억개 이상이니, 이보다 적다. 다만, KT가 오픈소스로 허깅페이스 등에 공개할 버전(70억개)보다는 많다.



알리바바 클라우드는 최신 거대언어모델 ‘큐원-72B’와 경량 버전 ‘큐원-1.8B’를 ‘모델스코프’와 ‘허깅페이스’에 오픈소스로 제공한다고 5일 발표했다.

이외에도 오디오 이해 모델 ‘큐원-오디오(Qwen-Audio)’와 대화형 버전 ‘큐원-오디오-챗(Qwen-Audio-Chat)’도 공개했다.

알리바바 클라우드는 이러한 오픈소스 이니셔티브를 통해 멀티모달 LLM에 대한 연구와 개발을 활성화하고자 하며, 개발자들이 자유롭게 활용할 수 있도록 지원한다고 밝혔다. CTO인 징런 저우는 “오픈소스 생태계의 구축은 LLM과 AI 애플리케이션 개발에 핵심적이며, 알리바바 클라우드는 모든 사용자가 생성형 AI 역량을 활용할 수 있도록 최선의 노력을 다하고 있다”고 설명했다.

큐원-72B는 다양한 언어 작업에서 뛰어난 성능을 보이며, 롤 플레이, 언어 스타일 전환 등의 작업에서 탁월한 능력을 나타낸다.

연구 목적으로 활용하는 경우 무료로 사용 가능하며, 상업적 용도의 경우 월간 활성 사용자 수가 1억 명 미만인 기업에 한해 무료로 제공된다.

경량 버전인 큐원-1.8B는 엣지 장치에서 추론을 가능케 한다. 또, 오디오 이해 모델 ‘큐원-오디오(Qwen-Audio)’는 음성 및 오디오 데이터를 다양하게 해석하고 처리할 수 있는 모델로, 다국어 녹취록 작성, 음성 편집, 오디오 캡션 분석 등 30종류 이상의 오디오 처리 작업을 수행할 수 있다.

이번에 공개된 알리바바 클라우드의 오픈소스 모델은 ‘모델스코프’와 ‘허깅페이스’에서 제공된다.

주요 뉴스

ⓒ종합 경제정보 미디어 이데일리 - 상업적 무단전재 & 재배포 금지