|
|
구글이 인공지능(AI) 챗봇 ‘바드(Bard)’를 세계 180개국에서 출시하면서, 영어를 제외한 언어로 한국어와 일본어만 우선 지원해 이유가 궁금하다.
순다르 피차이 구글 CEO는 지난달 11일(현지시각) 미국 캘리포니아주 서니베일의 구글클라우드 사옥에서 열린 글로벌 기자간담회에서 “(한국어와 일본어는)기존 언어와 매우 다르고 새로운 것을 시도하는데 큰 도움이 된다”면서 “한국과 일본은 기술 채택에 있어 최첨단을 달리는 매우 역동적이고 흥미로운 지역이다. 이 두 시장에 (진출을) 확대하는 건 큰 가치가 있다”고 말했다.
피차이 CEO의 언급은 신기술을 받아들이는데 거부감이 덜한 한국을 ‘바드’ 고도화를 위한 전초기지로 삼겠다는 말로 들린다.
그런데, 한국어를 우선 지원하는 이유는 다른 것도 있을 것이라는 게 국내 IT 기업들 얘기다.
왜냐면, ‘챗GPT’를 만든 오픈AI의 경우 초거대(Large Language Model)AI를 학습시키는데 사용한 인터넷 데이터 중 영어가 60%라면 한국어는 0.6%에 불과했고, 학습 비중은 영어는 92.7%, 한국어는 0.016%에 불과하기 때문이다. 이는 2020년 출시된, GPT-3기준이나, 같은 미국업체인 오픈AI와 구글이 크게 다를 것이란 이유를 찾기는 어렵다.
그렇다면, 구글 ‘바드’는 왜 한국어에 꽂혔을까.
IT 전문가들은 ① 초거대AI 자체 개발하는 한국서 검색 1위를 노리고 ②K-한류의 글로벌 확산에 따른 한국어에 대한 흥미 ③시차 차이로 그래픽처리장치(GPU) 효율적 사용(추가 비용 불필요)때문이 아닐 까라고 예상했다.
글로벌 검색 시장의 강자 구글은 사회주의 국가인 중국과 러시아를 빼고, 전 세계 모든 국가에서 검색엔진 점유율 1위다. 하지만, 우리나라에선 네이버의 검색 점유율이 하락추세임에도 네이버에 밀린다. 올해 4월 30일 기준 네이버 55.99%, 구글 34.03%(인터넷트렌드)다. 여기에 우리나라는 미국, 중국과 함께 초거대(Large Language Model)AI모델을 자체 개발 중인 유일한 나라다. 챗GPT 개발사인 오픈AI의 샘 알트만 CEO가 각국을 돌면서 AI를 규제해 달라고 하는 것도 후발 주자들을 의식한 것이라는 게 IT 전문가들 얘기다.
한국어에 대한 학문적인 관심은 피차이 CEO의 언급과 유사하다. “기존 언어와 매우 다르고 새로운 것을 시도하는데 도움 된다”는 그의 언급과, 한국어 우선 서비스로 한국어 데이터를 모아 학문적인 관심사를 해결하겠다는 시도는 연결지을 만하다.
그런데, 가장 현실적인 이유는 초거대AI를 돌리기 위해 들어가는 막대한 그래픽장치(GPU·AI반도체, AI가속기)때문이 아닌가 한다.
한국과 일본은 시차가 미국과 13시간 정도 차이가 난다. 낮과 밤이 바뀌어 구글이 바드 서비스를 위해 구입한 어마어마한 양의 GPU를 밤에 놀리지 않고 그대로 한국과 일본 서비스를 위해 사용할 수 있다는 의미다.
IT 업계 관계자는 “생성형AI 열풍을 타고 얼마 전 엔비디아 시총이 1조 달러를 돌파할 정도로, ‘바드’나 ‘챗GPT’ 같은 서비스를 하려면 굉장히 많은 양의 GPU가 필요하다”면서 “그런데 바드가 한국어와 일본어를 지원해 이들 국가에서 서비스를 강화하면, GPU를 새로 사지 않아도 된다. 무료 배송이 가능한 셈”이라고 말했다.