[단독]금융권 공동 ‘AI 플랫폼’ 선보인다…‘말뭉치’ 프로젝트 추진

by김나경 기자
2024.10.29 16:26:23

생성형AI 활용도 높이이기 위해 각종 금융용어 모으는
‘말뭉치’ 프로젝트, 내년 상반기 금융결제원서 추진해
신용정보원, 오픈소스 AI 플랫폼 제공…"AI서비스 개선"

[이데일리 김나경 기자] 내년 금융권이 생성형 AI(인공지능) 활용도를 높이기 위해 각종 금융용어를 모으는 ‘말뭉치’ 프로젝트를 추진한다. 금융사가 다양한 AI 소프트웨어를 이용할 수 있도록 공동 AI 플랫폼도 구축할 계획이다. 개별 금융사가 가진 데이터만으로는 한계가 있는 만큼 금융권이 공동으로 나서는 것이다. 당국이 주도하는 AI 협의회에서 논의한 내용은 앞으로 관련 정책과제에 포함할 것으로 보인다.

[이데일리 문승용 기자]
29일 금융권에 따르면 금융위원회 주재 ‘금융권 AI 협의회’는 최근 이 같은 내용의 생성형 AI 활성화 방안을 논의했다. 우선 내년 상반기 금융 말뭉치(corpus) 데이터를 구축하기로 가닥을 잡았다. 금융 말뭉치는 각 업권에서 쓰이는 금융 전문용어를 모은 것으로 생성형 AI 학습에 필요한 데이터다. 외국 회사가 개발한 AI 모델을 활용하면 ‘차주’를 자동차 소유주라고 해석하는 때도 있는데 한글 기반 금융 말뭉치를 통해 오역을 줄일 수 있다.

금융권 공동 말뭉치 데이터와 AI 플랫폼 구축은 지난 3월 발족한 ‘금융권 AI 협의회’에서 꾸준히 논의해 온 내용이다. 금융당국 관계자는 “양질의 데이터 확보 측면에서 말뭉치 프로젝트 등을 진행할 예정이다”며 “현재 검토하고 있는 단계다. 각 기관 역할 등을 고려해 최종 의사결정을 해야 한다”고 말했다.

구체적으로 금융업계 전반이 공유할 수 있는 금융에 대한 일반적 상식·법·제도 등의 공통 데이터, 대출 심사·보험약관 용어 등 각 업권에 특화한 전문 데이터를 각각 구축할 예정이다. 말뭉치 구축 프로젝트는 금융결제원에서 맡을 예정이다. 금융결제원은 말뭉치 데이터뿐 아니라 AI 평가지원 데이터, 공익 목적 데이터도 마련할 계획이다. 평가지원 데이터는 생성형 AI 활용 과정에서 나타날 수 있는 특정 인종과 성별에 대한 ‘편향’의 문제를 검증할 수 있는 데이터다. 금융사기, 신용평가, 금융보안 등 각 금융사가 공익 목적으로 활용할 수 있는 데이터도 쌓는다.



이를 활용할 수 있는 금융권 공동 AI 플랫폼도 나온다. 신용정보원에서는 외부에 공개된 오픈소스 AI 모델 중 금융권에서 활용도가 높은 모델들을 제공하는 플랫폼을 추진 중이다. 금융결제원이 구축한 말뭉치 또한 공동 AI 플랫폼을 통해 제공된다. AI 활용에 공을 들이고 있는 금융업계에서도 긍정적인 반응이다.

금융권 관계자는 “AI 시대 양질의 데이터는 다다익선이다”며 “생성형 AI 학습에 워낙 대량의 데이터가 필요하다. 개별 금융사가 데이터를 계속 축적하고 업데이트하기 어려워서 금융권 공동으로 데이터를 조성하면 금융사 편의가 커진다”고 말했다.

다른 금융권 관계자는 “금융사 AI는 대고객 서비스, 직원 업무 효율성 강화의 두 축으로 나뉘는데 두 가지 측면에서 가장 중요한 것이 데이터다”며 “예를 들어 은행이 신용평가를 할 때 과거의 대출, 부도 이력만 보는 것이 아니라 특정 대출마다 차주 유형과 수요를 반영해 새 여신심사 시스템을 만들 수 있다”고 말했다. 금융규제도 말뭉치 데이터에 들어가기 때문에 각종 법규에 맞게 보험 약관을 만들기에도 유용하다.