DiffCoR: Exposing AI-Generated Image by Using Stable Diffusion Model Based on Consistent Representation Learning | 최필주 교수 연구실 | 국립부경대학교 컴퓨터·인공지능공학부

최필주 교수 연구실

홈

기본 정보

연구 분야

프로젝트

논문

구성원

article|

인용수 2

·2025

DiffCoR: Exposing AI-Generated Image by Using Stable Diffusion Model Based on Consistent Representation Learning

Van-Nhan Tran, Piljoo Choi, Hoanh-Su Le, Suk‐Hwan Lee, Ki‐Ryong Kwon

IF 8.2 (2025) IEEE Open Journal of the Computer Society

초록

확산 기반 생성 모델은 이미지 합성 분야를 크게 발전시켜 왔으며, 디지털 이미지의 무결성과 진정성에 관한 추가적인 과제를 제기하고 있다. 그 결과, AI 생성 이미지를 식별하는 문제는 영상 포렌식 분야에서 핵심적인 과제가 되었다. 그러나 확산 모델로 생성된 이미지를 탐지하는 데 관한 문헌은 부족한 실정이다. 본 논문에서는 GAN 기법과 확산 모델을 모두 통해 생성된 이미지를 탐지할 수 있는 모델을 개발하는 데에 초점을 둔다. 우리는 AI 생성 이미지를 식별하기 위한 새로운 탐지 방법인 DiffCoR을 제안한다. DiffCoR은 두 가지 주요 모듈로 구성된다: Stable Diffusion Processing (SDP)과 Image Representation Learning (IRL)이다. SDP 모듈은 사전 학습된 Stable Diffusion 모델을 사용하여 역확산을 통해 입력 이미지를 복원하고, 복원 불일치를 통해 미세한 조작을 포착한다. IRL 모듈은 Latent Consistency Loss (LCL)를 이용한 자기지도 학습을 적용하여 견고하고 불변적인 특징을 추출함으로써, 증강된 뷰 전반에서 일관된 잠재 표현을 보장한다. 또한 조작 탐지를 향상시키기 위해 Discrete Fourier Transform (DFT)을 사용한 주파수 영역 분석을 포함한다. 더 나아가, LSUN-Bedroom, CelebA-HQ, CelebDFv2 및 다양한 확산 모델로부터 수집된 400,000건 이상의 실제 및 AI 생성 이미지를 포함하는 공개 데이터셋인 ForensicsImage를 제안한다. ForensicsImage 및 GenImage에 대한 실험 결과, DiffCoR은 최첨단 성능을 달성하였으며 강력한 교차 데이터셋 일반화 성능을 보였다. 이는 디지털 포렌식, 콘텐츠 검증 및 소셜 미디어 조절 등 실제 환경에서의 활용에 적합함을 의미한다. 우리의 코드와 데이터셋은 https://github.com/nhantran214/diffcor 에서 제공된다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Representation (politics)Artificial intelligenceDiffusionImage (mathematics)Computer sciencePattern recognition (psychology)Computer visionPhysicsPolitical science

타입

article

IF / 인용수

8.2 / 2

원문

https://doi.org/10.1109/ojcs.2025.3575507

게재 연도

2025

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)