산업 소리에서 이상(anomaly)을 탐지하는 것은 운영 효율을 유지하고, 비용이 많이 드는 설비 고장을 예방하며, 작업장 안전을 확보하는 데 핵심적이다. 그러나 산업 환경의 복잡성과 변동성으로 인해 배경 소음 및 작동 조건의 변동을 포함하는 상당한 어려움이 존재한다. 본 논문은 이러한 문제를 해결하기 위해 기계학습(ML) 및 딥러닝(DL) 기법을 활용하는 포괄적인 접근법을 제안한다. 세 가지 데이터셋, 즉 도메인 일반화를 위한 고장난 산업 기계 조사 및 점검 2022(Malfunctioning Industrial Machine Investigation and Inspection for Domain Generalization 2022, MIMII DG 2022), 음향 장면 및 사건의 탐지와 분류(Detection and Classification of Acoustic Scenes and Events, DCASE) 2022, DCASE 2024를 사용하여 서로 다른 실험 조건 하에서 다양한 ML 및 DL 모델의 성능을 평가한다. 본 연구는 멜-스펙트로그램(Mel-spectrograms)과 멜-주파수 켑스트럼 계수(Mel-frequency Cepstral Coefficients, MFCCs)와 같은 특징 추출 방법을 활용하여 산업용 기계의 핵심 음향 특성을 포착하는 데 초점을 둔다. 효과적인 이상 탐지 전략을 탐색하기 위해 지도학습(supervised) 기반 ML 및 DL 기법을 모두 사용한다. 혼동 행렬(confusion matrix), 정확도(accuracy), 정밀도(precision), 재현율(recall), F1 점수(F1 score)와 같은 지표를 활용한 광범위한 실험과 평가는 실제 산업 환경에서 본 접근법의 효과를 보여준다. 실험 결과는 ML 접근법에서 eXtreme Gradient Boosting(XGBoost)이 두 가지 특징 세트 모두에서 서포트 벡터 머신(Support Vector Machine, SVM)과 의사결정트리(Decision Tree, DT) 모델보다 우수함을 입증한다. DL 접근법에서는 순환신경망(RNN)과 장단기메모리(Long Short-Term Memory, LSTM) 네트워크보다 MFCC 특징에서 게이티드 순환 유닛(Gated Recurrent Units, GRU)이 더 나은 성능을 보인다. GRU는 테스트 데이터셋에서 최우수 모델로 나타났으며, DCASE 2024 데이터셋에서 정밀도 99.56%, F1 점수 99.55%를 달성하고, DCASE 2022 데이터셋에서 정밀도 94%, F1 점수 93.95%를 달성하며, MIMII DG 2022 데이터셋에서 정밀도 92.2%, F1 점수 92.06%를 달성한다. 이러한 결과는 예지보전(predictive maintenance)을 위한 실시간 산업 소리 분석에서 딥러닝의 잠재력을 강조하며, 기존의 전통적 방법에 비해 상당한 개선을 제공한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.