메타 부사장 "AGI도 오픈소스 공개…차기 '라마'는 크로스 모달리티"

by최정희 기자
2024.10.10 13:59:27

마노하 팔루리 부사장 기자간담회
라마 파생된 AI모델 6만 5000개 이상
과학기술정보연구원도 '라마' 기반으로 과학AI 에이전트 개발
"'무비 젠', 딥페이크 악용보다 유용성 더 커"
"AI 돈 많이 들지만…근본기술→제품 확장→수익화로 이어질 것"

[이데일리 최정희 기자] “메타의 장기적인 목표는 범용 인공지능(AGI)을 구축하고 이를 책임감 있게 오픈소스로 공개해 모든 사람이 인공지능(AI) 혜택을 누릴 수 있도록 하는 것이다.”

마노하 팔루리(Manohar Paluri) 메타 생성형AI 부사장은 10일 서울 강남 센터필드 메타 오피스에서 열린 ‘AI 미디어 브리핑 행사’에서 이 같이 밝혔다.

메타는 최근 거대 언어모델(LLM)인 생성형AI 라마(Llama) 3.2를 포함해 총 네 번의 LLM모델을 오픈소스로 공개했다. 라마 모델은 4억회 이상 다운로드됐다. 이는 작년 대비 10배 이상 증가한 수치다. 팔루리 부사장은 “라마 모델은 교육, 헬스케어 분야 등 스타트업부터 대기업까지 수 많은 비즈니스에 다양한 용도로 활용되고 있다”며 “라마도 파생된 AI모델은 약 6만 5000개 이상에 달한다”고 밝혔다.

구글의 제미나이 등이 오픈소스를 공개하지 않는 것과 달리 메타는 라마 시리즈를 오픈소스로 공개하고 있다. 팔루리 부사장은 메타가 오픈소스 접근 방식을 추구하는 이유에 대해 “개방형 생태계가 기술 혁신의 속도를 가속화하고 안전성과 투명성을 높이는 데 기여할 수 있기 때문”이라며 “오픈소스 모델은 개발자로 하여금 본인만의 모델을 훈련하고 미세조정할 수 있도록 해 오랫동안 지속가능한 시스템을 구축할 수 있도록 돕는다”고 설명했다. ‘라마’ 파운데이션 모델을 기초로 개발자들이 본인들이 원하는 데이터 등을 파인튜닝(Fine tuning)해 원하는 모델을 커스터마이징(Customizing)할 수 있다.

라마 시리즈가 개발될수록 비용도 저렴해졌다. AI모델이 100만개 토큰(단어 등)을 처리할 때 사용되는 비용은 라마 3.1이 여타 모델 대비 가장 저렴하다. 2년간 비용이 절반 가량 감소했다. 팔루리 부사장은 “개발자 입장에선 100배 가량 비용이 절감된 것”이라고 짚었다.

실제로 한국과학기술정보연구원(KISTI)은 라마 모델을 기반으로 과학기술 데이터를 추가 학습시킨 ‘고니(KONI)’라는 AI모델을 만들기도 했다. 장광선 KISTI 선임연구원은 “국내 연구기관, 공공기관에 특화된 과학기술정보 서비스를 제공하는 것을 목표로 하고 있다”며 “내년 1월부터 과학기술 정보에 특화된 연구자용 AI 에이전트를 만들 것”이라고 밝혔다. 이어 “다른 파운데이션 모델도 있지만 라마를 했을 때 가장 우수한 성능을 보였고 오픈AI의 챗GPT보다 정보 유출 우려가 낮았다”고 덧붙였다. 에임인텔리전스는 라마의 오픈소스를 바탕으로 AI취약점을 탐지, 최소화하는 솔루션을 개발, ‘라마 임팩트 이노베이션 어워즈’에서 수상을 하기도 했다.

라마는 내년께 ‘gen Llama’로 긴 문장의 글을 제공하고 이미지와 오디오, 비디오, 텍스트 등 서로 다른 정보의 종류를 연관성있게 학습하는 ‘크로스 모달리티’를 가능하게끔 하고 다른 나라의 언어도 쉽게 통합할 수 있도록 하는 AI모델을 출시할 예정이다. 팔루리 부사장은 “미래 기반이 될 메타AI는 모든 앱과 웹을 포괄하는 어시스던트가 될 것”이라며 “모든 앱, 웹에서 매일 40억명의 사람들을 지원하는 엔진이 라마가 될 것”이라고 밝혔다.

다만 메타가 원하는 장기 목표인 ‘AGI’가 다가가려면 아직은 멀었다는 평가다. 팔루리 부사장은 “AGI에 도달하려면 지각, 추론능력, 계획, 실행 등을 계속 반복하는 순환구조를 만들어야 한다. 이 단계가 되면 커스터마이징이 전혀 필요가 없게 되는데 아직 멀었다”면서도 “일부에선 커스터마이징이 필요 없는 경우도 늘어나고 있기 때문에 많은 성과가 있었다”고 밝혔다.

최근 메타가 공개한 ‘동영상 생성형AI’ 뮤비 젠은 기존 이미지와의 합성이 용이해 딥페이크(허위 영상물)를 만들기 쉬워지고 그로 인해 성범죄물로 활용되는 것 아니냐는 우려도 제기된다. 팔루리 부사장은 “AI영상물을 생성하는 경우 워터마크가 삽인된다”며 “신기술이 어떤 것이든 좋은 사례도 있겠지만 나쁜 사례도 존재하기 때문에 이런 부분을 완화하는 것이 중요하다”고 설명했다.

뮤비 젠에는 메타 ‘FAIR연구팀’이 개발한 영상 속에 특정 ‘물체’를 탐색하고 추축하는 기술이나 새 소리 등 소리를 생성하고 추출하는 기술 등이 활용됐다. 특히 특정 ‘물체’를 추출하는 기술은 해양과학, 의료 분야에도 활용된다.

메타가 ‘라마’ 등 AI를 통한 수익화에 대한 질문도 나왔다. 팔루리 부사장은 “메타는 근본 기술에 투자하는데 이는 수 십년이 필요하다. 그 결과 데이터센터, 파이토치(PyTorch) 등 혁신 기술을 업계 최초로 소개해왔고 이러한 연구를 통해 일상에서 제품이 사용되도록 해 수익화를 이뤄왔다”며 “AI역시 근본 기술에서 시작해 제품 확장, 수익화로 이어질 것”이라고 밝혔다.