네이버 음성인식, 회의록 수준까지 가능해져..속기사 사라지나

김현아 기자I 2020.04.13 11:00:22

새 기술 ‘NEST’ 공개
성남시 코로나 격리자 관리, 방송뉴스 자동 자막에 활용중
동영상 검색 품질 향상, 블로그 등에도 적용 예정
일반인 무료 체험, 기업들은 제휴 통해 이용가능

[이데일리 김현아 기자]음성인식 인공지능(AI)으로 속기사 없이 회의록을 정리할 수 있는 길이 멀지 않았다. 네이버가 제한된 데이터 학습만으로 정형화되지 않은 장문의 음성을 인식할 수 있는 진화된 음성인식 엔진 ‘NEST’(Neural End-to-end Speech Transcriber)를 13일 공개한 것이다.

현재 ‘NEST’는 성남시와 제휴해 코로나19 능동감시자 확인 서비스인 ‘클로바케어콜’에 적용돼 있고, 지난 1월에는 네이버 동영상 뉴스의 자동 자막 서비스에도 도입된 바 있다.

‘클로바케어콜’은 공무원이 아닌 인공지능(AI)이 자가 격리자 등에게 전화를 걸면 그와 통화한 내용을 텍스트로 바꿔준다. 정형화되지 않은 답변을 AI가 인식해 글로 정리해주는 것이다.

네이버 동영상 뉴스의 경우 아래처럼 방송뉴스가 흐르는 가운데 AI가 자막을 자동으로 만들어준다. 편집자가 아닌 AI가 보여주는 자막이다. 현재 지상파, 종편 등 9개 매체에만 우선 적용돼 있다.

네이버 동영상 뉴스 자동자막서비스에 도입된 ‘NEST’기술


여기에 NEST는 이번에 ‘장문 음성 인식’이 가능해졌다. 대량의 정제된 데이터를 사전에 학습하지 않고도, 예상치 못한 표현에 대해 정확한 음성인식이 가능한 것이 장점이다.

음향 정보와 언어 정보를 별도로 학습하는 기존의 모델링 방식을 통합 모델링 방식(end-to-end)으로 개선해, 학습에 필요한 데이터의 양과 시간은 기존의 10분의 1 수준으로 줄였으면서도 인식의 정확도는 오히려 높였다고 네이버는 설명했다.

동영상 검색 품질 향상, 블로그 등에도 적용 예정

네이버는 ‘NEST’ 기술을 적용한 자동 자막을 다양한 동영상 및 오디오 서비스로 확대하고, 동영상 검색 및 블로그·카페에도 해당 기술을 활용할 예정이다.

이를테면 이용자가 영화 이름이나 배우가 기억나지 않을 때 어떤 키워드만 떠오를 때에도 생각나는 키워드를 치면, 이미 영상의 내용을 음성인식으로 판단한 AI가 딱맞는 검색 결과를 찾아주는 식이다. 블로그나 카페에 올라오는 동영상도 자동 자막서비스가 가능해진다.

일반인 무료 체험, 기업들은 제휴 통해 이용가능

일반 사용자들은 클로바 스피치 홈페이지에서 ‘NEST’ 기술을 무료로 체험해볼 수 있다. 기업 및 단체는 제휴 제안(유료)을 통해 사용 가능하다.

네이버는 현재 한글로만 서비스되는 음성인식 텍스트 변환 기술을 하반기 일본어 출시를 시작으로, 영어, 중국어 등으로 제공 언어도 확대한다는 계획이다.

네이버 한익상 리더는 “‘NEST’는 동영상 및 오디오 콘텐츠의 자막 제작이나 아카이빙, 고객센터의 통화 데이터 관리 등 다양한 분야에서 활용 가치가 높을 것으로 기대된다”며 “앞으로도 AI 핵심 기술 연구에 더 집중하며 음성인식의 품질과 효율을 더욱 고도화해 나가겠다”고 밝혔다.

주요 뉴스

ⓒ종합 경제정보 미디어 이데일리 - 상업적 무단전재 & 재배포 금지