생성형 모델 기반 비식별화·프라이버시 보장 연구

Generative Privacy-Preserving De-identification

연구 내용

타깃 속성을 유지하면서 개인정보 노출을 줄이는 비식별화 생성 모델과 클라우드·클라이언트 제공 절차를 함께 설계하는 연구

의료 및 이미지 데이터처럼 개인 식별 가능성이 높은 데이터에서 프라이버시와 유틸리티의 균형을 목표로 연구합니다. 생성 모델 기반 합성 데이터의 프라이버시 보장을 위해 원본 클래스 정보를 유지하는 프레임워크를 구성하고, 역공학 위험을 낮추는 방향으로 학습·배포 구조를 설계합니다. 또한 이미지에서 특정 target 속성을 보존하면서 비식별화를 수행하기 위해 학습 단계의 선택 전략을 제안하고, 분포 유지 관점에서 성능을 비교합니다. 특허에서는 타깃 특성 고정 기반 생성 학습과, 클라이언트 전처리 및 응답 후처리를 결합하여 개인 정보에 해당하는 단어를 대체·복원하는 제공 방법을 다룹니다.

관련 프로젝트

2건

연구 흐름

초기에는 클라우드 추론 환경에서 개인 의료 데이터가 노출될 수 있다는 문제를 전제로, 합성 데이터가 원본과의 상호정보를 줄이도록 생성 프레임워크를 구축하고 예측 정확도 손실을 관리하는 연구를 수행했습니다. 이후 이미지 비식별화로 확장하여, target 속성을 유지하면서도 식별 가능 신호를 제거하기 위한 생성형 모델 고도화와 학습 단계 선택 전략을 적용했습니다. 2023년에는 타깃 특성 보존형 비식별화 방법과 개인 정보 노출을 막는 클라이언트-서버 처리 절차가 특허로 정리되었습니다. 동시에 2022~2024년에는 차등정보보호 개념 도출 및 통계 분석 유용성 확보를 수행하고, 2025년 이후에는 데이터 비접근 기반 멀티모달 생성과 차등정보보호를 결합하는 방향으로 연구를 확장하고 있습니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

타깃 속성 보존형 비식별화 생성 파이프라인
개인정보 노출 최소화 클라우드 의료 서비스
역공학 위험 저감형 합성 데이터 생성
차등정보보호 기반 통계 공개 절차
데이터 비접근 멀티모달 생성 기술
프라이버시-유틸리티 트레이드오프 최적화
비식별화 성능 검증용 평가 지표 설계
민감 데이터 기반 ML 배포 가이드
개인 정보 대체·복원 처리 아키텍처
보안 준수를 위한 생성형 모델 운영 체계