X-ray 보안 영상에서 위협을 탐지하는 것은 공공 안전을 보장하기 위해 매우 중요하다. 최근 딥러닝 알고리즘이 X-ray 보안 영상의 위협 탐지 과제에 도입되기 시작했다. 그러나 이 분야의 대부분 선행 연구는 주로 영상 수준 분류 및 객체 수준 탐지 접근법에 초점을 맞추어 왔다. X-ray 보안 영상을 화소 수준의 접근으로서 객체 분리를 채택해 분석하면 자동 위협 탐지가 크게 향상될 수 있다. 본 논문에서는 대규모의 불균형 X-ray 데이터셋의 위협 탐지 파이프라인에 분할(deep learning) 딥러닝 모델을 통합하는 것이 미치는 영향을 조사하였다. 진양성(true positives)의 탐지를 극대화하기 위해 균형 잡힌 데이터셋에서 X-ray 보안 영상 내 가능한 위협 영역을 국소화(localize)하기 위한 Faster R-CNN(region-based convolutional neural network) 모델을 학습하였다. 다음으로 DeepLabV3+ 모델을 학습하여 위협 영역 내의 각 화소를 분류함으로써 예비 탐지를 검증하였고, 그 결과 거짓양성(false positives)이 억제되었다. 두 모델은 하나의 탐지 파이프라인에서 결합되어 최종 탐지 결과를 생성한다. 실험 결과, 제안 방법은 이전 기준선 방법 및 엔드투엔드 인스턴스 분할 방법을 유의미하게 능가하였으며, 실제 데이터셋에서 불균형의 규모가 증가함에 따라 각각 94.88%, 91.40%, 89.42%의 평균 정밀도(mean average precisions, mAP)를 달성하였다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.