음향 비시선(Non-Line-of-Sight, NLOS) 영상화는 음향파의 반사를 분석함으로써 가려진 장면을 재구성하는 것을 목표로 한다. 이 분야의 최근 발전에도 불구하고, 기존 방법들은 물리적 모델에서의 잡음에 대한 민감성 및 딥러닝 모델에서의 보이지 않는 물체 재구성의 어려움과 같은 한계를 여전히 지닌다. 이러한 한계를 해결하기 위해, 우리는 음향 NLOS 영상화를 위한 새로운 교차 양식 지식 증류(Cross-Modal Knowledge Distillation, CMKD) 접근법을 제안한다. 본 방법은 잘 학습된 이미지 네트워크로부터 오디오 네트워크로 지식을 전달함으로써 두 양식의 강점을 효과적으로 결합한다. 그 결과, 본 방법은 잡음에 대해 견고하며 보이지 않는 물체를 재구성하는 성능이 우수하다. 또한 실제 환경 데이터셋을 평가하고, 제안된 방법이 음향 NLOS 영상화에서 최신(state-of-the-art) 방법들보다 더 뛰어남을 보인다. 실험 결과는 CMKD가 현재의 음향 NLOS 영상화 방법들의 한계를 해결하기 위한 효과적인 해결책임을 시사한다. 우리의 코드는 https://github.com/shineh96/Acoustic-NLOS-CMKD 에서 확인할 수 있으며, 모델과 데이터도 함께 제공된다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.