본 연구는 턱관절장애(temporomandibular joint disorder, TMD) 환자의 자기공명영상(magnetic resonance imaging, MRI)에서 전방 원판 변위(anterior disc displacement, ADD)를 딥러닝 기반 자동 검출로 파악하는 데의 유용성을 조사하였다. 총 861명의 남성과 399명의 여성을 대상으로, 2520개의 TMJ(temporomandibular joint)에 대한 시상면(sagittal) MRI 영상을 수집하였다(평균 연령 37.33 ± 18.83세). 합성곱 신경망(convolutional neural network, CNN)을 사용하는 딥러닝 알고리즘을 개발하였다. 과적합 위험을 줄이기 위해 데이터 증강(data augmentation)과 Adam 옵티마이저를 적용하였다. 예측 성능은 곡선 아래 면적(area under the curve, AUC) 기준으로 모델과 사람 전문가 간에 비교하였다. 파인튜닝(fine-tuning) 모델은 우수한 예측 성능(AUC = 0.8775)과 허용 가능한 정확도(약 77%)를 보였다. 반면, 처음부터 학습(from-scratch) 모델(0.8269)과 고정(freeze) 모델(0.5858)의 AUC 값을 비교하면, 파인튜닝 모델에 비해 다른 모델들의 성능이 낮게 나타났다. Grad-CAM 시각화에서 파인튜닝 방식은 ADD를 판단할 때 TMJ 원판에 더 집중하였으며, 희소성(sparsity)은 처음부터 학습 방식보다 더 높았다(84.69% vs. 55.61%, p < 0.05). 서로 다른 데이터 증강 기법을 사용한 세 가지 파인튜닝 앙상블 모델은 예측 정확도를 83%로 나타냈다. 또한 TMD 환자를 연령으로 나누었을 때 ADD의 AUC 값은 0.8549-0.9275였고, 성별로 나누었을 때는 남성 0.8483, 여성 0.9276으로 AUC 값이 더 높았다. 앙상블 모델의 정확도는 사람 전문가보다 높았으나, 차이는 유의하지 않았다(p = 0.1987-0.0671). 사전 학습 가중치로부터 학습(pre-trained weights)하면 파인튜닝 모델이 처음부터 학습 모델보다 더 나은 성능을 보였다. 또한 Grad-CAM 분석에서 ADD 진단을 위한 파인튜닝 모델의 또 다른 이점은, 처음부터 학습 모델에 비해 원치 않는 그라디언트 값의 비활성화(deactivation)를 통해 더 명확한 시각화를 제공한다는 점이었다. Grad-CAM 시각화는 관절 원판 영역의 중요한 특징을 통해 학습된 모델과도 일치하였다. 정확도는 다양한 데이터 증강을 사용한 세 가지 파인튜닝 모델의 앙상블로 추가로 향상되었다. 이 모델의 주요 이점은 사람 전문가에 비해 더 높은 특이도(specificity)로서, 이는 진정 음성(true negative) 사례를 예방하는 데 유용할 수 있으며, 성별과 연령 전반에 걸쳐 예측 정확도가 유지되어 전반적인(generalized) 예측을 시사한다는 점이다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.