목적: 본 연구는 구강편평세포암 환자에서 전이성 림프절을 분류하기 위해 B-mode 및 D-mode 초음파 영상을 통합하는 심층 합성곱 신경망 모델을 제안한다. 방법: 이중 입력 초음파 영상 간의 특징 수준 상호작용을 향상시키기 위해 교차-주의(cross-attention) 메커니즘을 포함한 공유 백본 네트워크를 사용하였다. 최적의 성능을 탐색하기 위해 공유 백본 프레임워크 내에 총 6개의 합성곱 신경망 아키텍처(VGG16, SqueezeNet, ResNet50, EfficientNet B3, ConvNext, DenseNet121)를 구현하였다. 각 네트워크에 대해 이중 입력과 단일 입력 초음파 간 진단 성능을 비교하였다. 또한 모델 성능을 서로 다른 경험 수준의 인간 관찰자와 비교하여 평가하였다. 결과: 교차-주의 계층이 통합된 공유 백본으로 DenseNet121을 사용한 모델(LNM-Net)은 이중 입력 영상을 활용할 때 분류 정확도 85.3%로 가장 높은 성능을 달성하였으며, 레지던트의 진단 성능을 능가하였다. 교차-주의 모듈은 양식(모달리티) 특이적 잡음을 억제하여 오탐(거짓 양성)을 감소시키고 특징 융합을 개선하였다. 결론: LNM-Net은 구강편평세포암에서 수술 전 림프절 전이 평가를 위한 임상 의사결정 보조 도구로서 높은 잠재력을 보여준다. 데이터셋 크기 및 기관 간 변동성과 같은 현재의 제한점에도 불구하고, 특히 방사선학적 전문성이 제한된 환경에서 유망한 보조적 지원 수단을 제공한다. 지식의 향상(ADVANCES IN KNOWLEDGE): 본 연구는 구강편평세포암의 전이성 림프절을 분류하기 위해 이중 입력 B- 및 D-mode 초음파 영상을 사용한 새로운 교차-주의 네트워크를 개발하였다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.