우울증의 조기 발견은 우울증 증상이 인지되지 않거나 치료되지 않은 채 방치될 경우 자살로 이어질 수 있으므로 매우 중요하다. 병원에서는 우울증 진단을 위해 자기기입형 설문지와 면담이 사용된다. 의사들이 환자의 상태를 이해하기 위해 상당한 시간을 면담에 할애하더라도, 우울증은 이질적인 증후군이어서 정확한 진단이 어렵다. 따라서 전통적인 진단 방법의 한계를 보완하기 위해 우울증의 생물학적 측면을 조사할 필요가 있다. 오디오 데이터는 일상생활에서 용이하게 수집할 수 있다. 이에 본 연구는 오디오와 텍스트를 적용하는 다중모달 융합 교차-양식(cross-modality) 모델을 제안하여 우울증을 탐지한다. 제안된 모델은 Distress Analysis Interview Corpus, Emotional Audio and Textual Depression Corpus, 그리고 Korean Depression 데이터셋에서 각각 F1-score 0.67, 0.81, 0.61을 달성하였다. 본 모델은 경량화되어 파라미터 수를 줄이면서도 더 적은 파라미터로 모델 정확도를 유지하도록 설계되었으며, 이를 통해 보편적(pervasive) 기기에서 활용될 수 있다. 본 연구에서는 영어, 중국어, 한국어 우울증 데이터셋을 사용하여 언어 전반에 걸친 제안 모델의 성능을 평가하였다. 교차언어 실험 결과, 모델이 동일한 어휘로 학습되지 않았더라도 다른 언어에 적용 가능함을 확인하였다. 이러한 결과는 비언어적 음성 특징과 언어적 텍스트 특징을 결합함으로써 모델이 구별되는 우울증 특성을 학습했음을 시사한다. 따라서 본 연구는 언어와 기기에 관계없이 일상생활 전반에서 우울증을 탐지하는 데 기여할 것으로 기대된다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.