금융 특화 한글 말뭉치 제공 시작…AI 서비스 개발 본격 지원
by최정훈 기자
2025.03.30 12:00:00
금융 법규·가이드라인, 금융정책·제도 설명자료 등 활용
금융 공통분야 말뭉치 총 1만2600건, 약 45GB 이상 제공
[이데일리 최정훈 기자] 금융당국이 오는 31일부터 금융권의 생성형 인공지능(AI) 활용을 위한 중요한 후속조치로 ‘금융 특화 한글 말뭉치’를 제공한다고 30일 밝혔다.
‘금융 특화 한글 말뭉치’는 금융 분야에 필요한 다양한 전문지식을 포함한 대규모 한국어 언어자료로, AI 모델이 금융 관련 업무를 수행하는 데 필요한 학습 데이터를 제공한다.
그간 금융업계는 해외에서 개발된 상용 AI 서비스를 사용해 금융 관련 일반 서비스를 제공해 왔다. 그러나 한국어로 된 금융 용어와 금융 법규에 대한 데이터 부족으로 인해, AI 모델이 금융 관련 전문적 업무를 처리하는 데 어려움이 있었다. 금융위는 금융권 AI의 신뢰성 및 전문성을 높이기 위해 금융 특화 말뭉치 구축을 결정했다.
이번에 제공되는 금융 특화 한글 말뭉치는 크게 세 가지 용도로 나뉘어 제공된다. 우선 AI 모델의 금융 전문지식 습득을 위한 학습용 말뭉치가 제공된다. 이 말뭉치는 금융감독원, 은행연합회, 금융연수원 등에서 제공한 금융용어 사전 및 일반 금융 지식 자료를 바탕으로 구성됐다.
이어 AI가 최신 법률 및 규제를 반영할 수 있도록 하는 ‘검색증강생성(RAG)용’ 말뭉치가 제공된다. 이 말뭉치는 최신 금융소비자보호법, 전자금융거래법 등 관련 법규와 참고 자료를 포함하고 있어, AI가 실시간으로 최신 정보를 반영할 수 있도록 한다.
또 AI 모델의 성능과 공정성을 평가할 수 있는 평가지원용 말뭉치도 제공된다. AI가 생성하는 허구의 정보나 편향 문제를 해결하기 위한 데이터로, 생성형 AI의 객관적인 성능을 평가하는 데 중요한 역할을 한다.
이번에 제공되는 금융 특화 한글 말뭉치는 총 1만2600건, 약 45GB 규모로, 사전학습용 6700건, 추가학습용 1100건, 검색증강생성용 3800건, 평가지원용 1000건 등 다양한 형태로 제공된다. 금융회사들은 금융결제원의 데이터 공유 플랫폼을 통해 해당 말뭉치를 다운로드하고 활용할 수 있다.
이번 시범사업은 내년 6월까지 진행되고, 금융기관들은 말뭉치를 무료로 제공받을 수 있다. 금융위는 이를 통해 금융권의 AI 학습 및 평가 데이터 확보를 지원하고, 국내 금융 제도 및 서비스에 최적화된 AI 서비스를 개발할 수 있는 기반을 마련할 예정이다. 아울러 이번 시범사업을 통해 금융기관들의 피드백을 수집하고, 내년 하반기에는 말뭉치의 유형과 규모를 확대할 계획이다. 또 2026년부터는 금융 업권별 특화된 말뭉치도 제공할 예정이다.
금융위는 “이번 말뭉치 제공을 통해 금융업계는 AI 학습에 필요한 데이터 확보에 소요되는 시간과 비용을 절감할 수 있고, 금융 분야에 특화된 혁신적인 AI 서비스가 개발될 것으로 기대된다”고 전했다.