이번에 발표된 라마 4는 △스카우트(Scout)△매버릭(Maverick) △베히모스(Behemoth) 세 가지로 구성된다.
이 중 스카우트와 매버릭은 라마닷컴과 오픈소스 플랫폼인 허깅페이스에서 오픈소스로 즉시 이용 가능하며, 메신저·왓츠앱·인스타그램 등 메타의 주요 플랫폼에도 적용됐다.
|
라마 4의 핵심은 텍스트 기반 인터페이스를 넘어선 ‘음성 중심 멀티모달 구조’다. 기존의 음성 입력-텍스트 변환이 아닌, 음성을 본질적 작동 기반으로 채택했으며, 컨텍스트 창 크기는 무려 1000만 토큰으로 확장돼 업계 최대 수준을 기록했다. 이는 구글 제미나이 2.0의 200만 토큰보다 5배 크다.
또한 메타는 딥시크 모델을 분석해 ‘전문가 혼합(Mixture of Experts, MoE)’ 아키텍처를 적용했다. 이를 통해 높은 성능과 효율을 동시에 구현했고, 멀티모달 기능까지 통합하며 딥시크와의 차별성을 확보했다.
AI 에이전트 시대, 음성 중심 UX로 가속
메타는 라마 4를 통해 단순 텍스트 기반을 넘어 대화형 AI 에이전트로의 진화를 강조한다. 증강현실(AR)스마트 안경 등 웨어러블 디바이스와 결합할 수 있는 음성 인터페이스는 개인 맞춤형 AI 비서의 현실화를 예고한다.
메타는 “사람들은 이제 인간처럼 반응하는 AI를 원한다”며, “라마 4는 AI 민주화의 선두에 설 가장 진보된 멀티모달 오픈소스 모델”이라고 밝혔다.
이어 “라마 4는 단일 모델이 아닌 전체 생태계 통합의 핵심 구성 요소”라며, 음성 에이전트 기능 등 추가 전략이 29일 열리는 ‘라마콘(LlamaCon)’에서 공개될 가능성도 시사했다.