프로젝트 소개
본 과제는 데이터 보호를 위한 재현자료 생성 기반 기술을 확보하여 데이터 경제의 안전한 활용 기반을 마련하는 연구임. 통계청과 예비 수요처의 요구를 반영해 재현자료 평가 지표, 생성 기법, 자동 추천 알고리즘을 개발하고, 공개 SW 개선과 가이드라인·교육·홍보를 통해 시장 안착과 확산 토대를 조성하는 과제임.
연구 목표는 재현자료의 유용성과 안전성을 함께 높이는 데 있음. 핵심 연구 내용은 Membership Collision Attack 노출 위험도, 유용성 지표, 불확실성 지표 등 평가체계 구축, Score-based Generative Model과 Bayesian multiple imputation 등 5건 기법 고도화, 추천 알고리즘의 Cohen`s kappa 0.5 이상 검증, 기계학습 기반 consistency 향상 연구, R `synthpop` 등 4건 공개 SW 개발·적용임. 기대 효과는 K-통계시스템 확산, 정보 노출 없는 데이터 공개·활용 확대, 공공·민간의 데이터 분석 활성화 및 국가 경쟁력 제고임.