|
음성 인증 기술은 사용자의 자유 발화를 기반으로 성문 정보를 추출·저장하고, 이후 통화 시 등록된 정보와 비교해 본인 여부를 확인하는 방식이다. 이는 기존의 질문-답변 방식보다 더 빠르고 편리한 인증을 제공한다. AI 기술의 발전으로 음성이 주요 인터페이스로 자리 잡으며, 금융·공공 등 다양한 분야에서 음성 기반 인증 및 식별 기술의 활용이 확대될 것으로 기대된다.
숭실대 AI보안연구센터가 개발한 딥보이스 탐지 시스템은 음성 파일을 입력받아 고급 딥러닝 기술을 활용해 인간 음성과 합성 음성을 구별한다. 또한, 웹·모바일·PC 등 다양한 환경에서 지원되며, 가짜 음성 데이터 세트(ASVspoof 2021 DF)에서 97% 이상의 탐지 성능, 실제 환경에서 수집된 데이터 세트(In-The-Wild)에서 94%의 탐지 성능을 기록했다. 이는 현재 공개된 최고 수준(SOTA, State-of-the-art) 모델보다도 뛰어난 성능이다.
송상엽 한컴위드 대표는 “딥보이스 기술이 AI 발전과 함께 더욱 정교해지면서, 진짜와 가짜를 구별할 수 있는 기술의 중요성이 커지고 있다”라며 “높은 보안성과 신뢰성을 갖춘 딥보이스 탐지 및 음성 인증 기술을 통해 보안 시장에서 경쟁력을 확대해 나갈 것”이라고 밝혔다.