확산 기반 생성 모델은 이미지 합성 분야를 크게 발전시켜 왔으며, 디지털 이미지의 무결성과 진정성에 관한 추가적인 과제를 제기하고 있다. 그 결과, AI 생성 이미지를 식별하는 문제는 영상 포렌식 분야에서 핵심적인 과제가 되었다. 그러나 확산 모델로 생성된 이미지를 탐지하는 데 관한 문헌은 부족한 실정이다. 본 논문에서는 GAN 기법과 확산 모델을 모두 통해 생성된 이미지를 탐지할 수 있는 모델을 개발하는 데에 초점을 둔다. 우리는 AI 생성 이미지를 식별하기 위한 새로운 탐지 방법인 DiffCoR을 제안한다. DiffCoR은 두 가지 주요 모듈로 구성된다: Stable Diffusion Processing (SDP)과 Image Representation Learning (IRL)이다. SDP 모듈은 사전 학습된 Stable Diffusion 모델을 사용하여 역확산을 통해 입력 이미지를 복원하고, 복원 불일치를 통해 미세한 조작을 포착한다. IRL 모듈은 Latent Consistency Loss (LCL)를 이용한 자기지도 학습을 적용하여 견고하고 불변적인 특징을 추출함으로써, 증강된 뷰 전반에서 일관된 잠재 표현을 보장한다. 또한 조작 탐지를 향상시키기 위해 Discrete Fourier Transform (DFT)을 사용한 주파수 영역 분석을 포함한다. 더 나아가, LSUN-Bedroom, CelebA-HQ, CelebDFv2 및 다양한 확산 모델로부터 수집된 400,000건 이상의 실제 및 AI 생성 이미지를 포함하는 공개 데이터셋인 ForensicsImage를 제안한다. ForensicsImage 및 GenImage에 대한 실험 결과, DiffCoR은 최첨단 성능을 달성하였으며 강력한 교차 데이터셋 일반화 성능을 보였다. 이는 디지털 포렌식, 콘텐츠 검증 및 소셜 미디어 조절 등 실제 환경에서의 활용에 적합함을 의미한다. 우리의 코드와 데이터셋은 https://github.com/nhantran214/diffcor 에서 제공된다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.