네이버 웨일, ‘외국인 한국어 음성 데이터’ 수집·활용 나선다

이대호 기자I 2022.04.01 09:24:51

과기정통부-NIA ‘인공지능 데이터 구축사업’ 컨소시엄 참여
“외국인의 발음체계를 고려한 맞춤형 교육자료 만들자” 취지

네이버 웨일 이미지
[이데일리 이대호 기자] 네이버(035420)(대표 최수연) 웨일이 자체 웹 기술 경쟁력을 바탕으로 과학기술정보통신부(장관 임혜숙)와 한국지능정보사회진흥원(NIA, 원장 문용식)이 진행하는 ‘인공지능 학습용 데이터 구축 지원사업’에 참여한다고 1일 밝혔다.

네이버 웨일은 엔에스데블(대표 이언주)과 서울대학교, 한국음성학회 등 다양한 기업과 연구기관으로 구성된 ‘엔에스데블 컨소시엄’의 구성사로서 사업에 참여한다. 컨소시엄은 언어교육용 데이터셋을 구축하며, 구체적으로는 외국인이 발음하는 한국어 음성 데이터를 수집하고 가공한다. 4월 1일부터 11월 30일까지 진행되는 사업기간 동안 4000시간 분량의 발음 데이터를 확보하고, 이를 인공지능 학습에 적합한 형식으로 다듬겠다는 계획이다.

엔에스데블 컨소시엄은 △나라지식정보 △네이버 △넥타르소프트 △서강대학교 △서울대학교 △성균관대학교 △엔에스데블 △테리뉴 △한국음성학회(가나다순)로 구성됐다.

발음 데이터셋은 향후 국내서 다양한 한국어 교육평가 솔루션이 개발, 고도화 되는 과정에 높은 활용성을 보일 것으로 기대된다. 네이버는 “세계적으로 한국어 교육에 대한 인기가 높아지는 상황에서, 효과적인 교육 솔루션 개발에 도움을 주는 데이터셋을 만들겠다는 취지를 갖고 각 사가 힘을 모았다”며 “외국인의 발음체계를 고려한 맞춤형 교육자료가 부족한 점을 고려해 이를 해결하기 위한 계획을 수립하게 됐다”고 사업 참여의 배경을 밝혔다.

네이버는 ‘웨일 스페이스 플랫폼’과 ‘웨일북’을 통해, 데이터를 편리하게 수집ㆍ관리 할 수 있는 환경을 조성한다. 웨일 스페이스는 다양한 프로그램을 웹 상에 모아두고, 로그인만 하면 어디서나 프로그램을 활용해 업무를 이어갈 수 있게 돕는 플랫폼이다.

특히 외국인의 한국어 발음을 녹음할 기기로는 ‘웨일북’이 활용된다. 웨일북은 웨일 스페이스와 연동되는 기능설계가 특징이다. 관리자는 웨일 스페이스를 활용해 현재 사용 중인 웨일북을 일괄 제어하고, 각 웨일북에서 생성되는 데이터도 통합 관리할 수 있다. 또, 웨일북으로 접근할 수 있는 프로그램 및 인터넷 환경 역시 관리할 수 있어, 보안상 안전한 환경을 조성할 수 있다.

네이버 웨일 김효 책임리더는 “그간 웨일이 연구ㆍ개발해 온 기술력을 인정받아, 이를 바탕으로 국내 인공지능 기술의 역량증진과 경쟁력 강화를 위한 사업에 참여할 수 있어 기쁘다”면서 “웨일의 웹 기술력은 분야를 가리지 않고 다양한 환경에 적용될 수 있는 범용성이 특장점이며, 이를 바탕으로 활용처의 폭을 넓혀 나갈 것”이라고 말했다.

주요 뉴스

ⓒ종합 경제정보 미디어 이데일리 - 상업적 무단전재 & 재배포 금지