금융 특화 한글 말뭉치 제공 시작…AI 서비스 개발 본격 지원

by최정훈 기자
2025.03.30 12:00:00

금융 법규·가이드라인, 금융정책·제도 설명자료 등 활용
금융 공통분야 말뭉치 총 1만2600건, 약 45GB 이상 제공

[이데일리 최정훈 기자] 금융당국이 오는 31일부터 금융권의 생성형 인공지능(AI) 활용을 위한 중요한 후속조치로 ‘금융 특화 한글 말뭉치’를 제공한다고 30일 밝혔다.

자료=금융위원회 제공
‘금융 특화 한글 말뭉치’는 금융 분야에 필요한 다양한 전문지식을 포함한 대규모 한국어 언어자료로, AI 모델이 금융 관련 업무를 수행하는 데 필요한 학습 데이터를 제공한다.

그간 금융업계는 해외에서 개발된 상용 AI 서비스를 사용해 금융 관련 일반 서비스를 제공해 왔다. 그러나 한국어로 된 금융 용어와 금융 법규에 대한 데이터 부족으로 인해, AI 모델이 금융 관련 전문적 업무를 처리하는 데 어려움이 있었다. 금융위는 금융권 AI의 신뢰성 및 전문성을 높이기 위해 금융 특화 말뭉치 구축을 결정했다.

이번에 제공되는 금융 특화 한글 말뭉치는 크게 세 가지 용도로 나뉘어 제공된다. 우선 AI 모델의 금융 전문지식 습득을 위한 학습용 말뭉치가 제공된다. 이 말뭉치는 금융감독원, 은행연합회, 금융연수원 등에서 제공한 금융용어 사전 및 일반 금융 지식 자료를 바탕으로 구성됐다.

이어 AI가 최신 법률 및 규제를 반영할 수 있도록 하는 ‘검색증강생성(RAG)용’ 말뭉치가 제공된다. 이 말뭉치는 최신 금융소비자보호법, 전자금융거래법 등 관련 법규와 참고 자료를 포함하고 있어, AI가 실시간으로 최신 정보를 반영할 수 있도록 한다.



또 AI 모델의 성능과 공정성을 평가할 수 있는 평가지원용 말뭉치도 제공된다. AI가 생성하는 허구의 정보나 편향 문제를 해결하기 위한 데이터로, 생성형 AI의 객관적인 성능을 평가하는 데 중요한 역할을 한다.

이번에 제공되는 금융 특화 한글 말뭉치는 총 1만2600건, 약 45GB 규모로, 사전학습용 6700건, 추가학습용 1100건, 검색증강생성용 3800건, 평가지원용 1000건 등 다양한 형태로 제공된다. 금융회사들은 금융결제원의 데이터 공유 플랫폼을 통해 해당 말뭉치를 다운로드하고 활용할 수 있다.

이번 시범사업은 내년 6월까지 진행되고, 금융기관들은 말뭉치를 무료로 제공받을 수 있다. 금융위는 이를 통해 금융권의 AI 학습 및 평가 데이터 확보를 지원하고, 국내 금융 제도 및 서비스에 최적화된 AI 서비스를 개발할 수 있는 기반을 마련할 예정이다. 아울러 이번 시범사업을 통해 금융기관들의 피드백을 수집하고, 내년 하반기에는 말뭉치의 유형과 규모를 확대할 계획이다. 또 2026년부터는 금융 업권별 특화된 말뭉치도 제공할 예정이다.

금융위는 “이번 말뭉치 제공을 통해 금융업계는 AI 학습에 필요한 데이터 확보에 소요되는 시간과 비용을 절감할 수 있고, 금융 분야에 특화된 혁신적인 AI 서비스가 개발될 것으로 기대된다”고 전했다.