AI 학습용 데이터 2배로 늘어난다, 과기정통부 추가 개방

by김국배 기자
2022.07.12 14:00:37

자율주행, 헬스케어 등 6대 분야 190종
AI 데이터 활용 협의회 열어 데이터 활용 확산 논의

[이데일리 김국배 기자] 과학기술정보통신부는 국내 인공지능(AI) 기술 발전을 견인할 AI 학습용 데이터 190종(5억8000만건)을 추가 개방한다고 12일 밝혔다.

앞서 과기정통부는 지난해 6월 170종(4억8000만건)의 데이터를 개방한 바 있다. 이번 조치로 개방된 데이터 규모는 총 381종에 달하게 됐다.

올해 추가로 개방되는 데이터는 한국어 음성·자연어(아동, 다화자 음성 등 44종), 영상·이미지(스포츠 동작, 반려동물 등 39종), 교통·물류(로봇 주행, 교통사고 등 22종), 헬스케어(심장 질환, 정신건강 등 32종), 재난·안전·환경(과적 차량, 물류창고 등 27종), 농축수산(정밀 농업, 스마트 양식 등 26종) 등 6개 분야에 걸쳐 있다.





산학연 전문가와 데이터 활용 기업 등이 참여해 산업 파급 효과가 크고 민간에서 대규모로 구축하기 어려운 데이터를 선정했으며, 데이터 구축 과정에는 AI·데이터 전문 기업은 물론 대학, 병원 등과 국민들이 참여했다. 실제 데이터 수요자 요구하는 품질 수준을 확보하고자 네이버·카카오·LG·KT·현대차 등 대기업과 스타트업, 대학·연구기관 등의 추가 보완을 거쳤다.

과기정통부와 한국지능정보사회진흥원은 데이터 개방 이후에도 품질 관련 의견 수렴 창구를 상시 운영할 계획이다. 또 연말까지 한국정보과학회와 연계한 데이터 품질 개선 연구를 지원할 예정이다. 과기정통부는 이날 ‘제3회 AI 데이터 활용협의회’를 열어 AI·데이터 산업, 연구 현장의 의견도 수렴했다. AI 서비스를 개발·활용하고 있는 주요 대기업, 스타트업 등 14곳의 관계자가 참석했다.

이날 협의회를 주재한 박윤규 2차관은 “앞으로도 다양한 분야에서 의미 있는 활용 성과가 나타날 수 있도록 데이터의 양적·질적 가치를 계속해서 높여 나가는 것이 협의회를 통해 모색할 중요한 과제”라며 “정부도 AI 허브 데이터가 대한민국의 디지털 전환을 선도하는 중요한 밑거름이 될 수 있도록 계속 노력하겠다”고 말했다.