AI 음성비서 시장 '각축전'…목소리로 감정 표현까지

by최연두 기자
2024.09.25 18:41:22

오픈AI, 챗GPT 감정 인지하고 반응 기능 공개
삼성전자·구글·애플, 이통3사 참전
인간과 교감하는 AI, KETI 국책 연구중

[이데일리 최연두 기자] 국내외 정보기술(IT)업계가 인공지능(AI) 음성비서 서비스 시장에서 주도권을 선점하기 위한 경쟁에 본격 나섰다.

AI가 이용자의 감정을 파악하는 것에서 나아가 최근 자체적으로 감정 표현이 가능한 방식으로 서비스가 고도화되는 추세다.

인공지능 비서 관련 이미지(사진=픽사베이)


오픈AI가 챗GPT에 실시간 음성 대화를 지원하는 ‘어드밴스드 보이스 모드(AVM)’를 도입했다. AVM은 9월 24일(현지시간) 공개됐으며, 기존 GPT-4 기반 버전(5월 출시)에서 크게 개선된 소통 역량을 자랑한다. 특히 영어, 한국어, 일본어를 포함한 50개 언어의 소통 능력이 향상됐다.

오픈AI는 이 새로운 기능을 통해 사용자들이 챗GPT와 더 자연스럽게 대화할 수 있을 것이라고 강조했다. AVM은 사용자의 감정을 감지해 이에 따른 반응을 제공하며, 총 9개의 음성을 지원해 실제 사람과 대화하는 듯한 몰입감을 제공한다.

특히 한국어의 경우, 사투리까지 이해할 수 있도록 개발되었으며, 한국인 성우와 오픈AI 내부 한국인 직원들의 피드백을 적극 반영해 한국어 사용자를 위한 맞춤형 경험을 제공한다는 점도 주목할 만하다.



이미 구글과 애플, 삼성전자(005930)와 SK텔레콤 등은 AI 음성비서 시장에 뛰어든 상황이다. 구글은 지난달 10가지 음성이 탑재된 AI 음성 기반 채팅 서비스인 ‘제미나이 라이브’를 선보였다. 삼성전자는 AI 스피커 빅스비가 이용자의 음성 명령을 더 잘 알아들을 수 있도록 기능을 개선했고, 애플은 AI폰 ‘아이폰16’ 시리즈에 GPT-4o를 적용한 AI 음성비서 ‘시리’를 탑재했다. 아마존은 내달 AI 비서 알렉사를 개편할 예정이다.

이동통신 3사도 AI 스피커를 시작으로 AI 에이전트(비서)를 잇따라 출시하며 시장 경쟁이 격화하고 있다. SK텔레콤(017670)(SKT)은 에이닷 서비스를 사용자 업무 보조, 정보 탐색 등 지원이 가능하도록 지난달 개편했다. AI 통화 녹음과 요약, 통역콜 등 기능으로 개인 비서로서의 핵심 역할을 제공하고 있으며 내달 T전화를 에이닷 전화로 브랜드를 바꾼다. KT(030200)는 AI 에이전트 개발을 진행 중이고, LG유플러스(032640)도 지난 4월 AI 에이전트 서비스 ‘챗 에이전트’를 출시했다.

IT기업들이 지능형 가상 비서(IVA) 시장에 눈독 들이는 이유는 향후 성장 기대감이 높아서다. 시장 조사기관 모도어인텔리전스에 따르면 글로벌 IVA 시장 규모는 올해 147억7000만 달러(19조7000억원)에서 오는 2029년 608억3000만 달러(80조9000억원)로 증가할 것으로 예상된다. 같은 기간 연평균 성장률(CAGR)은 32.7%나 된다.

관건은 AI가 이용자의 감정을 얼만큼 이해하고 답변할 수 있는지 여부다. 국내 AI 스타트업 스캐터랩이 개발한 ‘제타’는 AI가 텍스트 답변에서 감정을 알아챌 수 있는 핵심 기능을 탑재했다. 이러한 기능이 인기를 보이면서 어린 연령층으로부터 인기를 보이고 있는데, 와이즈앱·리테일·굿즈에 따르면 지난 한달 간 20세 미만 국내 이용자의 제타 사용 시간은 4.1억 분으로 조사됐다.

AI가 상담원의 역할을 대체하기 시작한 상황이다. AI 업계 관계자는 “AI가 사람을 전부 대체할 수는 없겠지만 간단한 수준의 상담 업무 등 영역에서는 AI가 사람을 대신할 날이 머지 않았다”고 말했다.

인간과 자연스럽게 교감하는 AI는 국내도 활발히 연구가 진행 중이다. 한국전자기술연구원(KETI)은 국내 산학연 컨소시엄과 프랑스 국책 연구기관 INRIA, 일본 세이케이 대학 등과 함께 지난해 9월부터 AI에 개성을 부여한 ‘페르소나 AI’를 개발중이다. 이 연구는 ‘사람중심 인공지능 핵심 원천기술 개발’이란 이름으로 정부 출연금 총 100억 원에, 2022년부터 5년 과제로 진행되고 있다.