국가통계데이터에 적용 가능한 차등정보보호 개념을 도출하고 통계분석의 유용성을 보장해야 하는 문제 해결
국가통계데이터에 적용 가능한 차등정보보호 개념을 도출하고 통계분석의 유용성을 보장해야 하는 문제 해결
2022과학기술정보통신부데이터프라이버시글로벌선도기술연구개발(R&D)
프로젝트 소개
본 과제는 국가통계데이터를 안전하게 활용하기 위해 차등정보보호를 보장하는 통계 분석 및 통계적 추론 기법을 개발하는 연구임.
연구 목표는 기초통계 15종, 통계기법 15종, 기계학습법 10종과 적용 가이드라인을 마련하고 국가통계데이터에 실증·검증하는 데 있음. 연구 내용은 수요기관 요구사항 분석, 국가통계시스템 데이터 분류와 기법 선정, BSCA 알고리즘 고도화, 히스토그램 기반 기초통계와 기초 기계학습 기법 개발, 검증 환경 설계 및 운영으로 구성됨. 기대 효과는 개인정보 유출 위험 감소, 데이터의 유용성·신뢰성 확보, 중·소규모 업체의 비식별화 기술 활용 확대, 데이터 마켓과 공공서비스 활성화에 기여함.