美스타트업은 훨훨 나는데…데이터규제가 발목잡는 韓

by김현아 기자
2024.09.10 06:00:00

국가AI위원회 출범 임박에도 데이터 규제 경직성 여전
CCTV 영상 원본도 개인정보…재난대응AI 개발 불가능
의료AI·법률AI도 제한적 접근 가능…AI G3국가 먼 길

[구태언 법무법인 린 변호사·이데일리 김현아 기자] 인공지능(AI) G3 국가 도약을 위해 대통령 직속 ‘국가AI위원회’가 이달 말 출범을 앞두고 있지만 데이터 규제의 경직성이 AI 강국으로 가는 데 걸림돌이 되고 있다. 이로 인해 오픈AI와 앤트로픽, 캐릭터닷AI 같은 혁신 글로벌 스타트업이 한국에서 나오기 어렵다는 지적이 나온다.

구태언 법무법인 린 변호사.(사진=이데일리DB)
현재 우리나라는 CCTV 영상 원본을 활용해 ‘재난 대응 AI’를 개발하는 것이 불가능하다. 이는 개인정보보호위원회가 차량등록번호 포함 CCTV 영상을 개인정보로 간주하고 있기 때문이다. 개인정보위는 차량등록번호 자체로는 특정인을 식별할 수 없지만, 차량등록원부와 결합하면 특정인을 식별할 수 있다는 이유에서 이같이 보고 있다.

문제는 일반인이 타인의 차량등록원부를 쉽게 입수할 수 없다는 데 있다. 자신의 차량등록원부는 쉽게 발급받을 수 있지만 타인 소유 차량의 등록원부를 발급받으려면 차량번호 외에 차량 소유자의 이름까지 알고 있어야 발급받을 수 있어 제한적이다.



CCTV 영상이라고 해서 전부 등장인물을 식별할 수 있는 것도 아니다. 하천의 강우량 등을 측정하는 공공CCTV는 근접 촬영을 통해 안면인식이 가능한 CCTV가 아니다. 그런데도 국내 개인정보보호법과 개인정보보호위원회는 ‘CCTV=개인정보=AI 활용 불가’라는 경직된 정책을 유지하고 있다. 따라서 개인정보보호법 규정 제 2조 제 1호 나목 2문을 들어 차량등록번호 자체를 개인정보로 해석하는 것이 아니라 경찰관이나 구청 직원 등 조회 권한이 있는 사람에게만 개인정보로 해석할 수 있게 해야 한다. 아울러 사람이 나오는 모든 CCTV 영상을 개인정보로 간주하는 대신 안면인식 가능 여부를 기준으로 명확한 판별 기준을 마련해야 한다.

의료 AI나 법률 AI도 상황은 비슷하다. 의료 AI를 개발하려면 대학병원과 제휴해야 하는데, 이들 병원은 윤리위원회의 심사를 받은 후에만 비식별화된 영상정보를 연구용으로 제공한다. 법률 AI를 개발하는 경우에는 대법원 홈페이지에서 판례 하나당 1000원을 들여 구입해야 하는데 100만개 판례를 학습하려면 10억원, 1000만개 판례를 학습하려면 100억원이 든다. 스타트업이 접근하기 힘든 수준이다. 그나마도 1억개에 달하는 대법원 판례 중 공개되는 것은 0.1%도 되지 않는다. 저작권이 있는 경우는 그렇다해도 공공 데이터조차 구하기 어렵다.

미국에서는 의료정보의 경우 HIPAA(Health Insurance Portability and Accountability Act)에 규정된 18개의 속성을 삭제하면 비개인정보로 간주하고 AI 학습 데이터 활용을 허용해 의료 AI 산업 발전에 기여하고 있다. 한국의 개인정보보호법상 ‘처리’의 범위에 관한 개정이 필요한 부분이다.