개인정보위, 데이터 안전 활용 '합성데이터 안내서' 발간

by김범준 기자
2024.12.19 16:06:36

합성데이터 생성 절차·관련 법령 준수사항 등 수록

[이데일리 김범준 기자] 개인정보보호위원회는 ‘합성데이터(Synthetic data) 생성·활용 안내서’를 발간했다고 19일 밝혔다. 최근 주목받는 개인정보 보호 강화 기술인 합성데이터의 안전한 생성과 활용을 지원하기 위해서다.

합성데이터 생성·활용 세부 절차.(자료=개인정보보호위원회)
합성데이터란 컴퓨터 시뮬레이션 또는 알고리즘에 의해 특정 목적을 위해 원본 데이터의 형식과 구조 및 통계적 분포 특성과 패턴을 학습해 생성한 모의(simulated) 또는 가상(artificial) 데이터를 말한다. 때문에 원본 데이터에 있는 개인 식별 또는 민감 정보를 노출하지 않고 데이터를 자유롭게 공유하고 활용할 수 있다.

개인정보위는 지난 5월 관련 실증사례를 담은 ‘합성데이터 생성 참조모델’을 발표한 데 이어, 이번에 해당 사례를 바탕으로 합성데이터 생성 절차와 관련 법령 준수사항을 수록한 안내서를 발간했다. 안내서는 각계 전문가가 참여한 연구반에서 안을 만들고, 외부 전문가의 추가 의견수렴을 거쳐 완성했다.

안내서에서는 개인정보 식별 가능성에 실질적으로 대응할 수 있도록 합성데이터 생성·활용 단계를 △사전준비 △합성데이터 생성 △안전성 및 유용성 검증 △심의위원회 평가 △활용 및 안전한 관리로 제시했다.



아울러 합성데이터 생성·활용 주체와 관련한 적법 절차, 원본 데이터의 전처리 방식, 안전성·유용성 검증 방법과 지표 등 생성·활용 단계별 세부 절차를 안내했다. 생성과정 전반에 대한 체크리스트와 문서 예시를 함께 제시해 쉽게 이해할 수 있도록 했다.

또한 최근 수요가 증가하는 이미지 등 비정형 합성데이터에 대해서도 절차와 유의사항을 안내한다. 특히 불특정 다수 등 일반대중 공개를 위한 합성데이터는 안전성에 중점을 두어 생성·검증하고, 심의위원회 평가 등을 거쳐 익명 정보로 활용할 수 있다는 점도 밝혔다.

따라서 앞으로 산업 현장과 연구소 등에서 합성데이터 관련 절차나 서식, 방법론, 법령 준수사항 등을 참고하고자 할 때 안내서를 활용할 수 있을 전망이다. 정형·비정형 합성데이터별 세부 사례는 ‘합성데이터 생성 참조모델’에서 확인할 수 있으며, 참조모델의 합성데이터는 ‘가명정보 지원 플랫폼’에서 다운로드할 수 있다.

양청삼 개인정보위 개인정보정책국장은 “프라이버시 강화 기술로서 합성데이터의 잠재력에도 불구하고 활용 기준, 방법, 절차 관련 내용이 체계화돼 있지 않아 산업·연구현장에서 느껴왔던 애로사항이 이번 안내서를 통해 해소되길 바란다”고 전했다.