[이데일리 이윤정 기자] 마인즈랩은 자사 브레인팀 김강욱, 이준혁 연구원의 논문이 ‘NeurIPS Workshop on ML for Creativity and Design 2021’에 Oral presentation으로 선정되었다고 2일 밝혔다.
| (사진제공=마인즈랩) |
|
이번 논문은 마인즈랩이 개발한 voice conversion(음성 변환) 모델 ‘Assem-VC’ 를 노래하는 목소리에 응용하여, 목소리를 수정하는 연구다. 이 모델을 적용할 경우 악보에 대한 별다른 지식 없이 이미 부른 노래의 가사, 피치, 목소리를 바꿀 수 있다. 또한, 데모에는 사용자의 목소리를 입력받아 다른 사람의 목소리와 듀엣을 하는 내용이 포함되어 있다.
학회 발표는 오는 13일 원격으로 진행될 예정이며 논문은 아카이브에서 볼 수 있다.
한편 지난 9월 발표된 이준혁, 한승우 연구원의 ‘NU-Wave’ 연구는 음원을 고해상도로 만드는 방식에 관한 것으로, 세계 최고의 음성신호 처리학회인 INTERSPEECH 2021에 선정된 바 있다. 이 연구는 diffusion probabilistic model을 적용, 저주파수 음원을 48kHz까지의 고주파수까지 포함한다. 이로 인해 마인즈랩은 자체 기술인 TTS를 더 좋은 음질로 제공할 수 있고, 오래된 저음질의 음원도 고음질로 만들 수 있게 됐다.