X-ray 보안 영상 데이터의 분포가 내재적으로 불균형하다는 점은, 이 분야에 적용되는 컴퓨터 비전 알고리즘에서 가장 어려운 측면 중 하나이다. 이 분야의 기존 연구 대부분은 이러한 특성을 간과하여, 실제 환경에서의 적용을 제한해 왔다. 본 논문은 불균형 X-ray 데이터셋에서 컴퓨터 비전 알고리즘의 성능을 향상시키기 위해, 생성적 적대 신경망(Generative Adversarial Networks, GAN) 기반 이미지 증강, 즉 이미지 합성을 사용하는 것이 미치는 영향을 조사한다. 우리는 위협 물체의 새로운 X-ray 영상을 생성하기 위해 Deep Convolutional GAN(DCGAN)을 사용하였고, 위협 물체의 카메라 영상을 X-ray 영상으로 변환하기 위해 Cycle-GAN을 사용하였다. 또한 데이터셋 증강에 활용되는 배경 X-ray 영상에 위협 물체를 결합하여 새로운 X-ray 보안 영상을 합성하였다. 이후 다양한 Faster (Region Based Convolutional Neural Network) R-CNN 모델을 서로 다른 증강 접근법을 사용하여 학습하고, 대규모의 실무용 X-ray 영상 데이터셋에서 성능을 평가하였다. 실험 결과는 이미지 합성이 거짓양성률(False Positive Rate, FPR)을 최대 15.3%까지 유의미하게 감소시켜 불균형 문제를 대응하는 데 효과적인 접근임을 보여준다. 또한 이미지 합성과 기존의 이미지 증강을 결합하면 FPR이 최대 19.9%까지 추가로 개선된다. 한편, 사용한 증강 방법과 무관하게 약 94% 수준의 비교적 높은 진양성률(True Positive Rate, TPR)이 유지되었다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.