연구 영역
기본 정보
논문·특허
과제
구성원
Article|
인용수 1
·2025
Anomaly Detection in Industrial Machine Sounds Using High-Frequency Features and Gate Recurrent Unit Networks
Thi-Thu-Huong Le, Andro Aprila Adiputra, J. C. Yun, Howon Kim
IF 3.6 (2025) IEEE Access
초록

산업 소리에서 이상(anomaly)을 탐지하는 것은 운영 효율을 유지하고, 비용이 많이 드는 설비 고장을 예방하며, 작업장 안전을 확보하는 데 핵심적이다. 그러나 산업 환경의 복잡성과 변동성으로 인해 배경 소음 및 작동 조건의 변동을 포함하는 상당한 어려움이 존재한다. 본 논문은 이러한 문제를 해결하기 위해 기계학습(ML) 및 딥러닝(DL) 기법을 활용하는 포괄적인 접근법을 제안한다. 세 가지 데이터셋, 즉 도메인 일반화를 위한 고장난 산업 기계 조사 및 점검 2022(Malfunctioning Industrial Machine Investigation and Inspection for Domain Generalization 2022, MIMII DG 2022), 음향 장면 및 사건의 탐지와 분류(Detection and Classification of Acoustic Scenes and Events, DCASE) 2022, DCASE 2024를 사용하여 서로 다른 실험 조건 하에서 다양한 ML 및 DL 모델의 성능을 평가한다. 본 연구는 멜-스펙트로그램(Mel-spectrograms)과 멜-주파수 켑스트럼 계수(Mel-frequency Cepstral Coefficients, MFCCs)와 같은 특징 추출 방법을 활용하여 산업용 기계의 핵심 음향 특성을 포착하는 데 초점을 둔다. 효과적인 이상 탐지 전략을 탐색하기 위해 지도학습(supervised) 기반 ML 및 DL 기법을 모두 사용한다. 혼동 행렬(confusion matrix), 정확도(accuracy), 정밀도(precision), 재현율(recall), F1 점수(F1 score)와 같은 지표를 활용한 광범위한 실험과 평가는 실제 산업 환경에서 본 접근법의 효과를 보여준다. 실험 결과는 ML 접근법에서 eXtreme Gradient Boosting(XGBoost)이 두 가지 특징 세트 모두에서 서포트 벡터 머신(Support Vector Machine, SVM)과 의사결정트리(Decision Tree, DT) 모델보다 우수함을 입증한다. DL 접근법에서는 순환신경망(RNN)과 장단기메모리(Long Short-Term Memory, LSTM) 네트워크보다 MFCC 특징에서 게이티드 순환 유닛(Gated Recurrent Units, GRU)이 더 나은 성능을 보인다. GRU는 테스트 데이터셋에서 최우수 모델로 나타났으며, DCASE 2024 데이터셋에서 정밀도 99.56%, F1 점수 99.55%를 달성하고, DCASE 2022 데이터셋에서 정밀도 94%, F1 점수 93.95%를 달성하며, MIMII DG 2022 데이터셋에서 정밀도 92.2%, F1 점수 92.06%를 달성한다. 이러한 결과는 예지보전(predictive maintenance)을 위한 실시간 산업 소리 분석에서 딥러닝의 잠재력을 강조하며, 기존의 전통적 방법에 비해 상당한 개선을 제공한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Anomaly detectionComputer scienceUnit (ring theory)Anomaly (physics)Speech recognitionElectrical engineeringPattern recognition (psychology)Artificial intelligenceEngineeringPhysics
타입
Article
IF / 인용수
3.6 / 1
게재 연도
2025