Universal Image Immunization against Diffusion-based Image Editing via Semantic Injection | 전해곤 교수 연구실 | 연세대학교 인공지능학과

전해곤 교수 연구실

홈

기본 정보

연구 분야

프로젝트

논문

구성원

article|

인용수 0

·2026

Universal Image Immunization against Diffusion-based Image Editing via Semantic Injection

Chanhui Lee, Seunghyun Shin, Donggyu Choi, Hae‐Gon Jeon, Jeany Son

arXiv (Cornell University)

초록

최근 확산(diffusion) 모델의 발전은 자연어 프롬프트에 의해 유도되는 강력한 이미지 편집 기능을 가능하게 하여 새로운 창의적 가능성을 열었다. 그러나 이러한 기술은 딥페이크와 저작권이 있는 시각 콘텐츠의 무단 사용과 같은 중대한 윤리적·법적 위험을 함께 초래한다. 이러한 위험에 대응하기 위해 이미지 면역화(image immunization)는 AI 기반 의미론적 조작에 대한 유망한 방어책으로 부상하였다. 그럼에도 불구하고 대부분의 기존 접근법은 이미지별 맞춤 최적화를 필요로 하는 이미지 특화 적대적 교란(image-specific adversarial perturbations)에 의존하므로, 확장성과 실용성에 한계가 있다. 본 논문에서는 확산 기반 편집 파이프라인을 위해 특별히 설계된 단일의 보편적 적대적 교란( UAP )을 생성하는 최초의 범용 이미지 면역화 프레임워크를 제안한다. 표적 공격에서 사용되는 범용 적대적 교란(universal adversarial perturbation, UAP) 기법에서 영감을 받아, 본 방법은 보호 대상 이미지에 의미론적 표적(semantic target)을 내재시키는 UAP를 생성한다. 동시에 원본 콘텐츠를 억제하여 편집 과정에서 모델의 주의(attention)를 효과적으로 오도한다. 그 결과, 본 접근법은 UAP를 통해 이미지의 원본 의미론적 콘텐츠를 덮어씀으로써 악의적 편집 시도를 효과적으로 차단한다. 또한 본 방법은 학습 데이터나 도메인 지식에 대한 접근 없이도 요구하지 않는 데이터-프리(data-free) 설정에서도 효과적으로 작동하여, 실제 환경에서의 실용성과 광범위한 적용 가능성을 더욱 향상시킨다. 광범위한 실험 결과, 본 방법은 최초의 범용 면역화 접근으로서 UAP 설정에서 여러 기준 방법(baseline)보다 유의미하게 우수한 성능을 보인다. 더 나아가, 범용 교란의 내재적 어려움에도 불구하고, 본 방법은 보다 제한된 교란 예산 하에서 이미지 특화 방법과 동등한 수준의 성능을 달성하며, 서로 다른 확산 모델 간에서도 강한 블랙박스 전이성(transferability)을 보여준다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Adversarial systemImage editingTransferabilityLimitingScalabilityImage (mathematics)Visualization

타입

article

IF / 인용수

- / 0

원문

http://arxiv.org/abs/2602.14679

게재 연도

2026

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)