충분한 라벨 데이터를 확보하기 어렵기 때문에, 자기지도학습(SSL)은 최근 시계열 이상 탐지 분야에서 많은 연구자들의 큰 관심을 받고 있다. SSL 모델 중 하나인 생성적 적대 신경망(GAN) 기반 오토인코더 모델은 이상 탐지에서 우수한 성능을 보이지만, 지나치게 민감한 경향이 있어(즉, 정상 데이터를 작은 이상값으로 비정상으로 예측) 문제를 일으킬 수 있다. 본 논문에서는 일부 센서에서 평균으로부터 크게 벗어난 값을 갖는, 잘못 예측된 정상 데이터가 존재함을 확인하였다. 우리는 이러한 데이터를 이상치(outlier)라고 명명한다. 이러한 데이터는 학습 데이터셋 내에서 소수이기 때문에, 모델이 이를 재구성하는 데 어려움을 겪고 결과적으로 비정상으로 잘못 예측한다. 이러한 발견을 바탕으로, 상관 특징에 기반한 클러스터링을 통해 이상치를 찾아내고 이를 효율적인 학습에 활용하는 견고한 자기지도 이상 탐지 프레임워크를 제안한다. 본 방법의 성능을 평가하기 위해 실제 환경의 펌프 데이터셋에서 다양한 딥러닝 기반 이상 탐지 방법들과 비교한다. 그 결과, 제안한 방법이 우수함을 입증하였다. 본 방법을 통해 우리는 이상 데이터에 대한 민감도는 유지하면서, 작은 이상값을 갖는 정상 데이터에 대한 민감도는 낮출 수 있다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.