MS·메타·구글 등 'SLM' 기반 AI 개발 집중…"고객 비용 부담 완화"
by방성훈 기자
2024.05.19 10:10:00
LLM 기반 생성형 AI 막대한 비용 탓에 고객 확보 난항
SLM 기반 AI 모델 잇따라 출시…“GPT-4.0 수준 성능"
특정 목적에 맞춰 내부·오프라인서도 정보 처리 가능
"저렴한 비용뿐 아니라 저작권 침해 등 법적 부담↓"
[이데일리 방성훈 기자] 마이크로소프트(MS), 메타, 구글 등이 생성형 인공지능(AI)을 통한 새로운 수익 창출을 위해 최근 ‘소규모언어모델’(SLM) 개발에 집중하고 있다.
18일(현지시간) 파이낸셜타임스(FT)에 따르면 애플, MS, 메타, 구글은 최근 ‘대규모언어모델’(LLM)보다 AI 시스템을 훈련·구동하기 위한 파라미터(매개변수)는 적지만 여전히 강력한 성능을 갖춘 새로운 AI 모델을 잇따라 출시했다. 현재 가장 인기가 높은 ‘챗GPT’ 등과 같은 생성형 AI 챗봇을 실행하려면 LLM 기술이 뒷받침해야 하는데, 비용이 너무 많이 들기 때문이다. 같은 이유로 최근 LLM 성장세도 주춤하고 있다.
메타의 글로벌 현안 부문 사장 닉 클레그는 “LLAMA3의 새 모델인 매개변수 80억개 버전은 오픈AI의 ‘GPT-4’와 성능이 비슷하다”고 자신했다. MS 역시 매개변수 70억개짜리의 ‘파이(Phi)-3’ SLM 모델이 “오픈AI의 ‘GPT-3.5’보다 성능이 뛰어나다”고 강조했다.
일반적으로 매개변수가 많을수록 AI 소프트웨어의 성능이 향상되며, 더 복잡하고 미묘한 작업도 수행할 수 있다. 최근 공개된 오픈AI의 ‘GPT-40’, 구글의 ‘제미나이 1.5 프로’는 모두 매개변수가 1조개 이상으로 추정된다. 메타는 오픈소스 LLAMA 모델 가운데 매개변수 4000억개 버전을 훈련시키고 있다.
하지만 LLM 실행을 위해선 막대한 전력과 컴퓨터 연산 능력이 필요하다. 즉 막대한 비용이 든다. 그 결과 고객사들이 LLM을 기반으로 하는 AI 시스템 구축에 소극적인 태도를 보이고 있다. 저작권 침해 등 법적인 책임에 대한 우려도 고객사들이 망설이는 주된 이유로 지목된다.
이에 따라 빅테크들은 LLM 개발과 별도로 신규 수익 창출을 위해 SLM 개발에 눈을 돌리게 된 것이다. FT는 “빅테크들이 비용 문제로 고객사 설득에 어려움을 겪으면서 대안으로 SLM 모델을 제시하고 있다”며 “이들 모델은 수십억개의 매개변수를 사용해 더 저렴하고, 훈련·실행에 필요한 전력이나 노력이 덜 들어가고, 사용자 정의 방식으로 민감한 데이터도 보호할 수 있다”고 설명했다.
이들 SLM 기반 생성형 AI는 저렴한 비용 외에도 특정 애플리케이션에 더 집중할 수 있어 목적에 따라 활용이 가능하다. 또한 정보를 클라우드로 보낼 필요 없이 고객사 내부 네트워크 장치에서 처리가 가능하다. 로펌 애들쇼고다드의 샬롯 마샬은 “생성형 AI 제품을 채택할 때 많은 고객들이 겪는 문제 중 하나가 데이터 처리 및 (클라우드) 전송에 대한 규제 요구 사항을 준수하는 것”이라며 “SLM은 이와 관련된 법적 문제와 비용 문제를 극복할 수 있는 기회를 제공한다”고 말했다.
휴대기기 등 오프라인에서 AI 모델을 실행할 수 있다는 점도 SLM의 장점으로 꼽힌다. 구글의 ‘제미나이 나노’는 이 회사의 최신 픽셀 스마트폰과 삼성전자의 S24에 내장돼 있다. 애플 역시 아이폰에서 실행 가능한 AI 모델을 개발하고 있다고 시사했다. 기업에 AI 모델을 판매하는 MS 애저 AI 플랫폼의 에릭 보이드 부사장은 “SLM은 휴대폰부터 노트북에 이르기까지 흥미로운 응용 프로그램으로 이어질 것”이라고 말했다.