李 대통령 ‘영어’ 취임식 영상?…대체 누가 만들었나 봤더니[AI침투보고서]

김세연 기자I 2025.10.18 07:35:00

허드슨에이아이의 더빙 AI ‘팀버’
원작 콘텐츠와 톤, 속도, 억양까지 유사
소음 환경에서도 목소리만 정확히 더빙
실시간 번역 더빙…21개 언어 적용 가능

챗GPT, 딥시크 대란에 다들 놀라셨나요? 이처럼 세상을 떠들썩하게 만드는 기술 외에도 우리가 모르는 사이 주변에는 수많은 인공지능(AI) 기술이 침투해 있습니다. 음식도 AI가 만들고 몸 건강도 AI가 측정하는 시대입니다. ‘AI침투보고서’는 예상치 못한 곳에 들어와 있는 AI 스타트업 기술들을 소개합니다.<편집자주>
이재명 대통령이 17일 경기도 성남시 스타트업 스퀘어에서 AI 기술을 이용해 영어로 더빙된 취임식 영상을 관람하고 있다.(사진=연합뉴스)
[이데일리 김세연 기자] ‘영어로 취임식 하는 대한민국 대통령’

참으로 이질적인 단어의 조합이다. 국가 수장이 새로 탄생하는 자리에서 명백한 국가의 언어가 있음에도 다른 나라 언어로 말하다니. 제1대 이승만 대통령부터 현직인 이재명 대통령까지 모두 한국말로 취임식을 했다.

지난달 ‘청년 창업 상상콘서트’에 참여했던 이 대통령은 자신이 한 적 없는 영어 취임식 영상에 놀라움을 감추지 못했다. 목소리 톤도 자연스럽고 이 대통령의 감정선까지 생생했다. 이 대통령을 놀라게 했던 이 영상은 인공지능(AI) 스타트업 허드슨에이아이의 더빙 AI ‘팀버’가 더빙한 영상이다.

허드슨에이아이의 더빙AI ‘팀버’가 작동하는 장면이다.(사진=허드슨에이아이)
톤·속도·억양까지…격정적 감정 장면도 구현

팀버는 먼저 사람의 목소리를 주변 소음과 분리한다. 배경음악, 다른 사람의 목소리, 생활소음까지 완벽하게 분리해낸다. 이후 말하는 사람의 전반적인 목소리를 인식하고 음성을 텍스트로 변환한다. 변환된 텍스트를 다른 언어로 변경한 후 이를 음성 오디오로 생성한다. 특히 팀버는 목소리를 인식하는 과정에서 톤이나 속도, 억양 등을 학습한다. 덕분에 격정적 감정을 표출하는 장면도 무리 없이 더빙한다.

음성 오디오를 생성하는 과정은 배우가 연기하는 것과 다르지 않다. ‘다정하게’, ‘분노하는 목소리로’ 등 어떤 분위기로 목소리를 만들어야 하는지 지문까지 달아준다. 단순 문장을 음성으로 변환하는 수준을 넘어섰다.

등장인물 간의 애칭이나 업계의 은어(특정 집단만 아는 암호 같은 말)도 알아낸다. 반복적으로 언급되는 단어가 무엇인지 인식하고 해당 단어가 대화 속에서 어떤 의미가 있는지 분석한다.

21개국 언어 커버…실시간 중계 더빙도

팀버는 영어 뿐만이 아니라 베트남어, 프랑스어, 스페인어 등 21개국 언어를 커버한다. 사용자는 영상을 팀버에 입력하기만 하면 원하는 언어로 더빙된 영상을 얻을 수 있다. 또한 한국어로 중계되는 한국 프로야구 생중계를 실시간으로 다른 언어로 더빙된 버전으로 볼 수도 있다. 더빙 시 한국 야구 중계 스타일을 미국 프로야구 중계 스타일로 바꿔주는 것도 관전포인트다.

신현진 허드슨에이아이 대표는 아역 더빙 등 사람 성우로 하기 어려운 일을 팀버가 해낼 수 있다고 자신한다. 신 대표는 “어린이 성우는 통제가 어렵기 때문에 녹음 난이도가 높고 고용 비용이 비싸다. 그렇다고 성인이 어린이 목소리를 내기는 어렵다”며 “팀버가 이런 문제를 해결할 수 있을 것”이라고 했다. 이어 “음성의 맛을 살리는 데 집중하고 있다. 번역은 문맥을 최대한 살려서 하고 구어체로 말하며 사투리 등 말투도 살리고 있다”고 말했다.

주요 뉴스

ⓒ종합 경제정보 미디어 이데일리 - 상업적 무단전재 & 재배포 금지