“3년뒤 1천억대 매출…‘믿음’ 있으니 AI사업 효율적"(일문일답)

by김현아 기자
2023.10.31 13:25:57

KT, 70억개~2천억개 이상 매개변수 초거대AI '믿음' 4종
“자체 LLM 보유는 도약 위한 준비”
“클라우드 팜 으로 30% 비용 절감…과금 단위 개선”
“KT 파운데이션 모델 1종 개방, 한국어 서비스에 기회”
“4세 연령에 괜찮은 서비스 만들겠단 마음으로”

[이데일리 김현아 기자]“자체 거대모델(LLM)이 있으니 파급력과 영향력이 좋고, 정말 효율적으로 사업할 수 있죠. 정말 다음 단계로 도약하기 위한 확실한 준비라고 생각합니다.”(배순민 KT AI2XL연구소장)

“3년뒤 1천억 원대 매출이 예상됩니다. 향후 5년 동안 1.5조 원 투자 계획은 유효하죠.(최준기 KT AI·빅데이터 본부장)”

KT(030200)(대표이사 김영섭)가 31일 온라인 기자설명회를 열고, 거대언어모델(LLM)AI ‘믿음(Mi:dm)’의 출시를 발표했다.

다음은 일문일답이다.

KT AI/BigData사업본부 최준기 본부장이 기자설명회에서 KT 초거대AI 믿음에 대해 설명하고 있다.(왼쪽 두번째부터 KT AI/BigData 사업본부 최준기 본부장, KT AI2XL 연구소 배순민 소장, ‘매스프레소’ 이용재 대표, ‘업스테이지’ 김성훈 대표, KT SW개발본부 조성은 본부장)

-KT는 자체 LLM(거대언어모델)을 가지고 있는데 어떤 의미라고 보는가

▲배순민AI2XL연구소장)KT는 텔코에서 디지코(디지털플랫폼기업)로 전환을 선언했는데 그전에도 많은 AI서비스를 제공하고 있었다.

그런데, 저희가 파운데이션 모델 ‘믿음’을 가진 후에 좋은 점은 모델이 한 번 업데이트가 되면 같은 모델을 AICC(AI콜센터)에도 주고, 기가지니에도 주고, 기업문서에도 주고, 정부에서 요청이 오면 드리고 등 이렇게 파급력과 영향력이 좋았다. 아주 효율적인 일이다.

KT에는 AI연구 개발자들이 몇 백분 계신데, 이렇게 AI연구 개발자들이 많이 모여 있다니 하고 (외부에서도) 놀랄 정도다. 그런데 파운데이션 모델 개발 이전에는 할 수 있는 일이 사실은 몇 십 가지밖에 안 됐다. 하지만, 이번에는 몇 백가지, 글로벌까지 노릴 수 있게 됐다. KT가 이 LLM 파운데이션 모델을 가졌다는 건 정말 다음 단계로 도약이 대한 확실한 준비라고 생각한다.

-빅테크와의 경쟁이 두렵지 않나. SKT나 LG유플러스처럼 앤트로픽이나 구글 같은 곳과 제휴할 의향은

▲최준기 KT AI·빅데이터 본부장)아시다시피 어마어마한 기업들이고 자본이 많이 드니 당연히 두렵죠. 그래서 저희가 1대 1 경쟁을 하겠다는 거는 아니다.

다만, LLM을 만들어본 경험이 있는 기술진과 그걸 만들어보지 못하고 만져보지 못한 기술진의 차이는 굉장히 크다고 본다. 전문 영역이 있는 LLM을 가지고 만들 수 있는 시장도 분명히 존재할 것이다라고 본다. 그러니까 (외국 빅테크들과의) 제휴의 가능성은 일정 부분 열려 있다.

-‘믿음’ 매출 목표와 투자 계획은

▲최준기)앞으로 3년 뒤에는 약 천억 대를 왔다갔다 하는 목표를 가지고 있다. 약간 보수적인 얘기일 수도 있지만 그렇다.

투자 계획은 향후 5년 동안 초거대 AI 관련 1.5조 투자를 하겠다고 예전에 발표했는데, 아직까지 유효하다.

▲김성훈 업스테이지 대표)무엇보다 구글, 오픈 AI, 엔트로픽의 못지 않는 세계 1위 회사인 업스테이지와 이미 KT는 계약하고 계신다.

왼쪽부터 ‘매스프레소’ 이용재 대표, ‘업스테이지’ 김성훈 대표, KT SW개발본부 조성은 본부장

-KT가 기업고객을 위해 쉽게 생성AI를 쓸 수 있는 ‘믿음 스튜디오’를 오픈했는데 타사와 차별성이 뭔가

▲조성민 SW개발본부 본부장) KT 믿음 스튜디오는 멀티 LLM(여러개의 언어모델)을 손쉽게 사용할 수 있도록 제공한다. 프리 트레이닝 된 모델도 사용할 수가 있고 그다음에 다양한 파트너사의 모델도 손쉽게 선택을 할 수가 있다.

두 번째로는 합리적인 가격으로 이런 서비스를 제공하고자 한다. KT클라우드 HAC(Hyperscale AI Computing) 서비스를 기반으로 다양한 인프라 기반으로 클릭만으로 이런 모델들을 학습하고 배포하고 또 운영할 수 있도록 이렇게 손쉬운 환경을 제공을 할 수 있다.

또, 사용한 만큼 과금을 할 수 있는 인프라도 제공한다. 알다시피 기업의 다양한 데이터 연결이라든지 그다음에 기업 내부 시스템과의 연결도 중요한데, 이런 환경을 제공할 수 있도록 믿음 스튜디오에서 고도화하고 있다.

-타사 서비스와 비교할 때 비용은

▲최준기)AI풀스택을 통해 비용 절감이 가능한데, 통상 30% 이상 절감된 금액을 저희가 제공을 해드리려고 하고 있다.

과금 단위도 현재 (챗GPT 등은) 토큰 단위로 과금되는데, 이런 형식에 대해 부담을 갖는 경우가 있더라. 왜냐하면 서비스가 어떻게 될지 모르기 때문이다. 그래서 저히가 인스턴스 과금 체계를 좀 제공을 한다든지 해서 기업 고객들이 느끼셨을 때 이게 어느 정도 사용량이 어느 정도 올라온다라고 생각했을 때에는 KT클라우드와 KT믿음을 조합해 쓰실 때 가장 저렴하게 느껴질 수 있도록 노력한다. 20~30%는 좀 더 싸게 제공을 해드리려고 노력한다.

-‘믿음’ 파라미터 규모는

▲최준기) 모델별로 라인업이 다르다. 텐빌리언 언더(70억개) 그다음에 수십 빌리언 대 수백 빌리언 대까지 돼 있다. 크게는 200빌리언(2천억개)넘는 모델 라인업도 좀 준비가 돼 있어서 고객분들이 컴퓨팅 환경에 맞게끔 그리고 내가 쓰고자 하는 용도에 따라 다르게 선택 가능하다.

-B2B를 타깃한 이유는

▲최준기)B2B 시장에서 즉각적인 수익화가 가능한 부분이 있고, 빅테크의 모델을 쓰지 않고 내 데이터를 써서 내 바운더리 내 모델을 가지고 가겠다는 기업의 니즈가 분명히 있어서다. 저희가 BEP(손익분기점) 달성 시점에 대해서는 당장 말하기 어렵다. 대략 한 3년 뒤에는 우리나라 전체로 봤을 때 한 3천억 이상의 시장이 열릴 것으로 본다. 글로벌로는 훨씬 더 큰 시장이 빠르게 열릴 것 같다.

KT AI2XL 연구소 배순민 소장과 매스프레소’ 이용재 대표

-글로벌 교육 플랫폼 콴다에서 KT와 제휴한 이유는? GPT-4와 붙였을 때 Korea SAT sets Accuracy에서 95%였는데

▲매스프레소 이용재 대표)믿음 모델로는 지금 연구 개발을 하고 있는 상황이다. 사실 성능이 기존에 저희가 쓰던 것(LLM)보다 더 낫다라고 판단을 하고 있는데 실제 서비스에 도입할 때까지는 시간이 좀 걸리기 때문에 아직은 기존 상용 모델을 사용하고 있는 상황이다.

추가적으로 설명드리면 저희가 이제 모델을 경량화하고 그다음에 이제 쓸 수 있도록 이제 지금 준비를 해나가는 과정 중인데 이게 참 AI가 한편으로는 무섭다는 생각이 뭐냐 하면은 데이터를 가지고 있으면 그걸 파인튜닝하는데 시간이 그렇게 오래 걸리지가 않더라는 것이다. 데이터가 잘 준비가 되면 믿음을 이용해 서포트해 드릴 수 있도록 하겠다.

KT AI/BigData 사업본부 최준기 본부장, KT AI2XL 연구소 배순민 소장, ‘매스프레소’ 이용재 대표

-‘믿음’ 파운데이션 모델(LLM) 개방의 의미는

▲최준기) 믿음을 개방한다라는 것 아까 전에 잠깐 말씀드렸던 것처럼 허깅 페이스와 리더 보드에 올렸고 허깅 페이스와 리더 보드에 올린다는 얘기는 즉각 다운로드 받아서 사용해보실 수 있다는 얘기다. 지금 다운로드 받아서 한번 질문을 던져보거나 다른 70억개 파라미터(매개변수)모델과 비교해 보시고 써보시면 된다는 얘기다. 컨설팅 없이도 필요한 기업 그다음에 역량 있는 기업이라면 그냥 써보실 수 있을 것이다.

저비용에 대해서도 여쭤보셨는데 아까 전에 말씀드렸던 것처럼 기본적으로 다른 일반적으로 볼 수 있는 비용보다 한 30% 정도 목표로 그런 비용을 책정을 좀 하려고 있고 이건 사용량에 따라서 왔다 갔다 해서 상황마다 다르기는 하다.

▲김성훈 업스테이지 대표) 현재 KT가 오픈한 것은 굉장히 큰 결단이었고 또 아마 국민 생태계에 큰 영향을 미칠 것이라고 저는 개인적으로 생각하고 굉장히 감사하다.

LLM 시장에서 오픈 소스 오픈 영역이 지금 미친 영향이 굉장히 크다. 정말 많은 어플리케이션들을 이미 만들고 있다. 그런데 딱 한가지, 한국어가 안 된다.

근데 이제 믿음이 나와서 그게 이제 메타의 오픈소스 LLM ‘라마’보다 훨씬 더 좋은 베이스라인 모델을 만들어준다면 한국어로 된 서비스, 한국어로 된 모델들이 굉장히 많이 나오게 될 것 같다. 물론 이걸 어떻게 사업할 거냐 하는데 있어, 저희들도 추가적으로 도움을 많이 드릴 수 있을 것으로 생각된다.

-믿음의 ‘편향성’을 극복하기 위한 노력은 어떤가

▲배순민) 저희 연구소 안에는 파운데이션 모델을 개발하는 분이 물론 엄청 많지만 이 외에도 저희의 모델을 계속 테스트하면서 어떤 데이터에 문제가 있는지 아니면 결과에 문제가 있는지 보시는 정말 전문화된 여러 팀이 있다. 일단은 한국어 차원에서 테스트 케이스를 나름대로 만들어 나가고, 버전마다 계속 테스트를 해가면서 문제가 있는지 없는지, 그리고 타사 모델과도 계속 비교해 나가고 있다.

일반적으로 보편적으로 완전한 답변을 하려고 노력한다. 최근에 4세 연령의 지니버스라는 서비스를 냈는데 지니버스가 저희에게는 AI를 사용자에게 제공할 수 있는 채널의 역할을 했다. 4세가 봐도 괜찮은 영상인지, 4세가 들어도 괜찮은 단어인지 보는 것이다. 그런 마음으로 AI를 만들고 있다.

특히 대화에 있어서는 사회적으로 용납이 가능한 AI를 위해 노력 중이다. 이번 달에도 차이나 모바일이나 NTT도코모와 윤리적 규범을 함께 논의하기도 했다.

또 하나 부탁드리고 싶은 것은 사회적으로 이런 기술적인 오류나 실패에 대해서 좀 용납을 해주셨으면 좋겠다.

이것(LLM)이 블랙박스인 게 맞고, 완벽하게 저희가 정말 노력을 하고 99.9% 괜찮겠지 괜찮아야지 하고 노력을 했지만. 마지막 0.1%에서 저희가 생각지도 못한 이탈을 할 수가 있다. 이것이 우리가 함께 AI가 발전해 나가는 시대를 살고 있는 세대의 책임이 아닌가 한다. 좀 따뜻하고 긍정적인 시선으로 봐주셨으면 좋겠다.

(그래픽=문승용 기자)