IBM은 메타와 협력해 소형언어모델(sLLM)을 오픈소스로 제공함으로써 생성형AI의 제왕 오픈AI를 따라잡기 위해 노력하고 있다.
이날 이은주 사장은 ‘개방성, 신뢰성, 맞춤형 솔루션, 역량 강화’가 IBM이 고객사에 AI 기술을 제공하는 차별화된 요소라고 강조했다.
그는 “최근 발표한 AI 기술인 왓슨x에서는 저희가 개발한 그래니트(Granite) AI 모델 제품군을 오픈 소스로 배포했으며, 신뢰성 향상을 위해 왓슨x 같은 거버넌스 솔루션도 별도로 출시했다. 또한, 최근 열린 서울 AI 포럼에서는 안전한 AI 사용을 위한 서울 기업 서약에 동참했다”면서, “기업용 AI 솔루션은 기업 맞춤형이어야 하며, 기업들이 AI로 추가 가치를 창출할 수 있도록 하는 기술 개발에 집중하고 있다”고 언급했다.
|
오픈소스로 제공되는 소형언어모델(sLLM)
현재 허깅페이스와 깃허브에서 아파치 2.0 라이선스로 제공되는 오픈 소스 그래니트 모델은 개발 프로세스, 품질, 투명성, 효율성 면에서 매우 뛰어나다고 평가받고 있다.
그래니트 코드 모델은 30억 개에서 340억 개의 매개변수를 가진 기본형과 명령어 추종형 모델로 제공되며, 복잡한 애플리케이션 현대화, 코드 생성, 버그 수정, 코드 설명 및 문서화, 리포지토리 유지 관리 등의 작업에 적합하다.
파이썬(Python), 자바스크립트(JavaScript), 자바(Java), 고(Go), C++, 러스트(Rust) 등 116개 프로그래밍 언어를 학습한 그래니트 코드 모델은 IBM의 테스트 결과, 두 배나 큰 다른 오픈 소스 코드 모델보다 우수한 성능을 보여 다양한 코드 관련 작업에서 오픈 소스 코드 거대언어모델(LLM) 중 최고 수준의 성능을 발휘하는 것으로 나타났다.
이 사장은 “사실 어떤 특화 태스크(업무)는 매개변수가 더 적은 모델에서 뛰어나다는 연구 결과가 있다”며, “IBM도 더 적은 모델에 포커싱하고 있다. 하나의 GPU로 사용할 수 있는 80억 개~340억 개 정도의 모델로, 일반적으로 다양한 기업 환경에서 사용하기 적합하다”고 설명했다.
기업용 AI 위해 합성데이터 활용
IBM 리서치의 케이트 소울(Kate Soule) 생성형 AI 리서치 프로그램 디렉터는 신뢰할 수 있는 AI를 위한 데이터 학습 방법과 LLM 성능을 높이기 위해 IBM과 레드햇이 함께 개발한 인스트럭트랩(InstructLab)을 소개했다.
소울 디렉터는 “일반적으로 AI 모델 학습 시 인터넷에서 얻은 범용 데이터를 많이 사용하지만, IBM은 기업 특화 LLM을 위해 합성 데이터를 생성해 이를 모델 학습에 사용한다”고 설명했다. 이어 “예를 들어 코볼(COBOL) 프로그램을 학습시키려 할 때, 오래된 프로그래밍 언어여서 데이터가 거의 없고 전문가도 적다. 그러나 저희는 코볼 프로그램 정보를 바탕으로 합성 데이터를 만들어 그래니트 모델에 업데이트시켰더니, 코볼 변환에 걸리는 시간이 9개월에서 1주로 줄었다”고 밝혔다.
인스트럭트랩 방법론은 수십 년 동안 오픈소스에서 소프트웨어 개발이 진행되어 온 것처럼 지속적이고 점진적 기여를 통해 기본 모델을 지속적으로 발전시킬 수 있는 접근 방식이다. IBM은 이 접근법을 왓슨x.ai 및 새로운 레드햇 엔터프라이즈 리눅스 AI(RHEL AI) 솔루션에 통합해 고객에게 추가적인 가치를 제공할 계획이다.
|
한국서 데이터센터 확충 여부 말 아껴
국내 시장에서 IBM이 생성형 AI로 인해 데이터 센터를 확충할 계획이 있느냐는 질문에 대해 이 사장은 명확한 답을 하지 않았다.
그는 “한국 사람들은 기술에 매우 민감하여 생성형 AI를 빨리 도입하려고 하지만, 동시에 이 기술이 투자할 만큼의 ROI(투자수익률)를 제공하는지, OPEX(운용비용)관점에서 TCO(총소유비용)가 나오는지에 대해 고민하기 시작한 것 같다”면서, “IBM의 클라우드 전략은 하이브리드 클라우드로, AWS나 마이크로소프트와 매우 친밀한 관계를 유지하고 있다. IBM 클라우드를 사용하고 싶은 고객에게는 해당 데이터 센터를 제공하고, 그렇지 않은 경우에는 멀티 클라우드 전략을 활용할 수 있도록 방향성을 잡고 있다”고 답했다.