정상 이미지의 전경 영역에 합성 이상을 삽입함으로써 이상 탐지와 분할 성능을 향상시키기 위한, 오토인코더와 분할 모델을 결합한 자기지도 학습 프레임워크를 제안한다. 합성 이상은 새로운 패치 셔플 슈퍼픽셀 이상 삽입 방법(Patch Shuffle Superpixel Anomaly Insertion Method, PSSAIM)을 통해 생성하였으며, 두 단계로 구성된다. 첫째, 정상 이미지를 서로 겹치지 않는 패치들로 분할한 다음 이를 셔플하고 회전시켜 원본 이미지의 왜곡된 버전을 생성한다. 둘째, 왜곡된 이미지에 대해 Simple Linear Iterative Clustering (SLIC) 슈퍼픽셀 추출 기법을 적용하여 실제 이상을 모사하는 비정상 세그먼트를 생성함으로써, 다양한 종류의 합성 이상을 포괄하도록 한다. 실제 결함이 주로 발생하는 관심 영역(RoI)을 식별하기 위해, 우리는 각 데이터셋 클래스마다 경량 오토인코더(AE) 모델을 개발하여 실제 결함이 흔히 나타나는 RoI를 찾아내었다. AE는 Structural Similarity Index Measure(SSIM)를 사용하여 패치 단위의 유사도를 계산함으로써 배경 영역을 지도화하고, 이를 비유사도 맵(dissimilarity map) (1-SSIM)을 통해 전경 영역으로 역변환한다. 문턱값 기반 정제와 영역 기반 분석을 통해 마스크를 정교화하여 노이즈 및 불필요한 작은 블롭을 제거하였다. 실제 테스트 시의 이상에 대해서는, 인코더-디코더 네트워크와 어텐션 블록, 멀티스케일 컨텍스트 집계를 포함하는 향상된 분할 모델(EnSeg)을 설계하였다. PSSAIM으로 증강된 이미지로 학습한 EnSeg는 유망한 결과를 달성하였다. 영상 수준 탐지에서 수신자 조작 특성 곡선 하 면적(area under the receiver operating characteristic curve, AUROC)이 98.9%였고, MVTec 이상 탐지(MVTec AD) 데이터셋에서 픽셀 수준 국소화의 평균 정밀도(average precision, AP)가 77.1%였다. 또한 Kolektor SDD2 벤치마크 데이터셋에서는 AUROC 94.9% 및 AP 67.8%를 보였다. EnSeg는 200 frames per second(fps)의 빠른 추론 속도를 보장하여 정확성과 효율성을 동시에 제공한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.