Spectrogram-based contrastive representation learning and CNN classification for sensing and detection
연구 내용
멜-스펙트로그램을 입력으로 하는 대조학습 기반 기침 소리 분류를 수행하고, 진동 신호의 푸리에-멜 필터뱅크 변환 후 CNN 학습을 통해 CNC 공작기계 공구 마모도 측정을 지원하는 연구
본 연구는 시간 신호를 스펙트로그램 형태로 변환하고, 대조학습 및 CNN 기반 모델로 분류 성능을 높이는 데 초점을 둡니다. 기침 소리 분류에서는 mel-spectrogram이 표현에 적합한 입력임을 확인하고, positive/negative 쌍을 구성하는 대조학습이 라벨 의존성과 데이터 크기 민감도를 낮추는 방향을 제시합니다. 성능 고도화를 위해 채널 수, 2D-CNN 구조, time shift 및 block masking 조합을 비교·분석합니다. 또한 산업 신호에서는 진동 데이터를 푸리에 변환 후 멜 필터뱅크 에너지로 스펙트로그램을 생성하고, 툴카운터 값과 연계된 CNN 학습으로 공구 마모도 측정을 구성하는 기술을 보유합니다.
관련 연구 성과
관련 논문
1편
관련 특허
1건
관련 프로젝트
0건
연구 흐름
기침 소리 분야에서는 라벨이 제한된 상황에서 self-supervised learning 관점으로 접근하여 스펙트로그램 입력 설계와 대조학습 적용 가능성을 탐색하는 연구를 수행했습니다. 이후 모델 성능을 개선하기 위해 단일 채널 및 2D-CNN 구조가 적합하다는 점을 비교하고, time shift와 block masking의 조합으로 분류 정확도를 끌어올리는 방향으로 확장했습니다. 병행하여 제조 분야에서는 진동 신호를 푸리에 변환과 멜 필터뱅크를 거쳐 스펙트로그램으로 표현하고, CNN 학습으로 CNC 공작기계 공구 마모도 측정을 수행하는 흐름으로 연계됩니다.
활용 가능성
활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.
관련 논문
구분
제목
Analysis of Cough Sound Classification Model based on Contrastive Learning
관련 특허
구분
제목
진동데이터에 기초한 CNC 공작기계의 공구 마모도 측정 장치 및 방법