정부 전용 초거대 AI 도입하고, 1500여 종 공공 서비스 통합(종합)

by김국배 기자
2023.04.14 18:27:49

'디지털플랫폼정부' 청사진
첨부 서류 제로화로 연 2조원 절감
초거대 AI 위한 텍스트 데이터 200종, SaaS 기업 1만개 육성
6월까지 'AI 데이터 안전 활용' 정책 마련

[이데일리 김국배 기자] 정부가 민간의 초거대 인공지능(AI)에 정부 문서, 보도자료 등을 학습시켜 정부 전용 초거대 AI를 만든다. 홈택스, 위택스 같은 1500여 종의 공공 서비스를 하나로 통합한다. 윤석열 정부의 국정과제인 디지털플랫폼정부의 청사진을 내놓은 것이다.

대통령 직속 디지털플랫폼정부위원회는 14일 과학기술정보통신부, 개인정보보호위원회와 함께 ‘디지털플래포멍부 실현계획 보고회’를 열고 이런 내용을 발표했다. 고진 디지털플랫폼정부위 위원장은 “정부 전용 초거대 AI는 직접 구축하는 것이 아니라 민간의 초거대 AI를 활용할 것”이라며 “정부의 내부 정보로 훈련시킨 초거대AI는 민간 클라우드를 이용하더라도 따로 분리시켜 구축할 계획”이라고 말했다.

디지털플랫폼 정부 실현 계획 발표. (사진=연합뉴스)


이날 정부는 정부 전용 초거대 AI 도입 외에도 1500여 개의 공공 서비스를 오는 2016년까지 단계적으로 통합하겠다는 계획을 보고했다. 국세, 지방세, 복지 신청 등을 한 곳에서 하나의 ID로 이용할 수 있도록 하는 것이다. 고 위원장은 “국민들이 이곳저곳 찾아다닐 필요없이 한 곳에서 민원을 해결할 수 있도록 하겠다”고 했다.

정부 서비스에 필요한 첨부서류를 모두 없애는 ‘관공서 제출서류 제로화’를 통해 연간 2조원을 아끼고, 공공 부문 종이 사용량도 50% 아낄 계획이다. 바쁘거나 잘 몰라서 놓치기 쉬운 정부 지원 서비스들을 AI가 알려주는 국민 맞춤형 ‘혜택 알리미’도 2026년까지 구현한다. 중앙부처가 제공하는 1021종의 수혜성 서비스가 대상이다.

공장을 지으려는 기업이 후보지 추천, 인허가 여부 등을 사전에 확인할 수 있는 ‘공장 간편 인허가 서비스’를 추진하며, 민간과 공공의 데이터·서비스를 연결해 활용할 수 있는 통합 플랫폼 ‘DPG허브(가칭)’도 구축한다. 정부 시스템에 민간 서비스형 소프트웨어(SaaS)가 우선 활용될 수 있도록 지원해 2026년까지 1만개의 SaaS 기업을 육성한다.

초거대 AI 개발에 필요한 텍스트 데이터도 대규모로 늘린다. 과기정통부는 분야별 특화 학습용 데이터, 비영어권 시장 공략을 위한 동남아·중동 등 언어 데이터 200종(책 15만권 분량)을 2027년까지 구축할 계획이다. 초거대 AI 한국어 성능 향상을 위해 고품질 말뭉치, 한국어 응용 말뭉치도 130종을 마련한다.

최신 정보를 반영하지 못하고, 거짓 답변을 내놓은 초거대 AI의 한계를 극복하기 위한 기술 개발도 추진된다. 기존 딥러닝의 학습 능력·신뢰성 등을 개선하기 위한 기초 연구에 더해 인과관계 이해, 편향성 필터링, 모델 경량화 등의 기술 개발이 이뤄진다. 초거대 AI에 필요한 막대한 컴퓨팅 자원을 지원하고자 AI 반도체 소프트웨어, 데이터 가속처리 하드웨어 등도 개발·실증하게 된다. 초거대 AI 경쟁력을 강화하기 위한 정책 과제에 올해 3901억원의 예산이 투입될 전망이다.

이종호 과기정통부 장관은 “우리나라는 독자적 초거대 AI 플랫폼을 보유한 4개국 중 하나”라며 “우리가 강점이 있는 한국어 플랫폼을 토대로 비영어권부터 글로벌 시장 공략을 시작하고, 혁신적 초거대 AI 응용 서비스로 전문 특화 세계 1위에 도전해 나가려 한다”고 했다.

개인정보보호위는 데이터 수집부터 AI 학습, 서비스 제공까지 AI 전 과정에서 지켜야 할 보호 원칙과 데이터 처리 기준 등을 제시하는 ‘AI 데이터 안전 활용’ 정책 방향을 오는 6월까지 마련한다. 특히 AI 학습을 위해 공개돼 있는 정보나 사용자가 생성한 데이터가 빈번하게 수집되는 만큼 명확한 원칙을 정립할 계획이다.

실제로 최근 챗GPT에서 결제정보 등이 일부 유출되는 사건이 발생했는데, 개인정보보호위는 오픈AI 측과 접촉해 한국의 데이터가 쓰였는지 등 상황을 파악 중이다. 오픈AI는 챗GPT에 어떤 데이터를 활용했는지 구체적으로 밝히지 않고 있다. 현재까지 개인정보보호위가 오픈AI에 확인한 바에 따르면 국내 챗GPT 이용자는 220만명에 달한다.

고학수 개인정보보호위 위원장은 “오픈AI 측과 소통 창구가 개설됐다”며 “한국인 이용자가 많이 있으니 앞으로 어떤 상황인지에 관해 조금 더 구체적으로 알아볼 예정”이라고 했다. 그는 “AI가 성장하면서 큰 기대가 형성되고 있지만 한편으론 프라이버시 침해 우려 등도 나타나고 있다”며 “개인정보보호위는 AI의 전 과정에서 개인정보보호 원칙을 제시해서 균형된 데이터 활용 기준을 정립해 나가도록 하겠다”고 했다.