다음, 국내 최초 음성 합성 엔진 '뉴톤 톡' 공개

by이유미 기자
2014.06.26 11:42:01

[이데일리 이유미 기자] 다음커뮤니케이션(035720)은 국내 최초로 음성 합성 애플리케이션 프로그래밍 인터페이스(API)를 26일 공개했다.

자체 개발한 음성 합성 엔진 ‘뉴톤 톡(Newtone Talk)’의 API로 입력된 글자를 사람처럼 자연스럽게 읽어 주는 것이 특징이다. 지난 2월 공개한 음성 인식 엔진 ‘뉴톤(NewTone)’의 API에 음성 합성 기능이 더했다. 뉴톤 톡은 2012년 말 다음이 인수한 음성 인식 전문기업 ‘다이알로이드’의 기술을 바탕으로 제작됐다.

음성 합성이란 글자를 입력했을 때 이를 음성으로 변환해 들려주는 것으로 운율, 높낮이 등 사람의 발성을 그대로 재현해내는 것이 이 기술의 완성도를 가름한다. 이를 위해 다음은 한국어 운율 모델을 자체 개발했으며 대용량·자동화 처리 기술에 의해 빠르게 모델을 학습할 수 있도록 했다.



뉴톤 톡의 활용 범위는 무한하다. 예를 들어 현재 ‘100미터 앞에서 우회전입니다’라는 형태로 음성 안내하는 내비게이션 앱을 ‘100미터 앞에서 다음커뮤니케이션 본사를 끼고 우회전입니다’ 수준까지 안내 가능하도록 만들 수 있다. 뉴스나 문자, 책 구절 등을 읽어주거나 각종 안내 방송을 대신할 수 있고, 시각 장애인을 위한 생활형 앱 등을 개발할 때도 유용하다.

이상호 다음 검색부문 부사장은 “개발자 누구나 음성 인식 및 합성 기술을 자유롭게 활용해 혁신적인 모바일 서비스를 만들 수 있도록 완성된 엔진을 API로 먼저 공개했고 이런 시도가 장기적으로 음성 기술 영역 전반의 발전을 이끌 것이라 기대한다”고 말했다.

뉴톤과 뉴톤 톡은 안드로이드와 iOS 버전 모두를 지원한다. 다음 개발자 네트워크(http://dna.daum.net)에서 제휴 신청을 하면 발급 받을 수 있으며 일 1만회까지 자유롭게 사용 가능하다.