오늘날의 디지털 시대에서 이미지는 가짜 뉴스 확산과 같은 악의적 목적을 위해 조작되기 쉬우며, 이에 따라 이미지 위조 탐지에 대한 활발한 연구가 진행되고 있다. 딥러닝(DL)의 발전과 더불어 합성곱 신경망(convolutional neural network, CNN) 및 Transformer 모델이 이 분야의 주요 도구로 부상하였다. 그러나 개별 모델은 특정 이미지에서는 뛰어난 성능을 보일 수 있는 반면 다른 이미지에서는 성능이 저하되어 모델 성능의 변동성이 발생한다. 이러한 문제를 해결하기 위해 본 논문에서는 여러 모델의 예측을 결합하는 앙상블 접근법을 제안하여 시스템 성능과 견고성을 향상시키고자 한다. 먼저, CNN 기반 모델, Transformer 기반 모델, 그리고 이러한 아키텍처를 결합하는 융합(fusion) 모델을 포함한 사전학습(pretrained) DL 모델의 집합을 활용하고, 성능이 가장 우수한 모델을 선택한다. 그 다음, 선택된 모델들을 하드 보팅(hard voting)과 소프트 보팅(soft voting)을 이용한 앙상블 방식에 적용하여 이들의 집단 성능을 평가한다. 특히 ConvNeXt, SwinV2, CAFormer로 구성된 선택된 앙상블에서 하드 보팅 기법은 정확도 97.42%를 달성하였으며, 이는 기준(baseline) 모델 대비 약 6.34%의 향상을 의미한다. 이러한 결과는 제안된 앙상블 접근법이 위조 탐지에 효과적임을 확인해준다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.