마스킹 이미지 모델링(masked image modeling, MIM)을 활용하는 자기지도학습 기반의 최근 접근법들은 높은 성능을 보여주었다. 그러나 MIM을 소규모 데이터셋에 그대로 적용할 경우, 하위 과제에 대한 일반화 성능이 저하된다. 본 연구는 데이터셋 부족이 야기하는 한계를 상세한 해부학적 구조의 포착이 보완할 수 있다고 가정하며, 의료 영상 과제에서의 일반화를 향상시키도록 설계된 Spectral Distance Scaling Loss(SDSL)를 제안한다. 전통적인 픽셀 기반 방법과 달리, SDSL은 저주파 및 고주파 상세 정보에 대한 균형 잡힌 학습을 보장하기 위해 인코더 표상을 강화하는 주파수 영역 정보를 포함한다. 또한 사전학습 모델이 여러 단계에 걸쳐 주파수 정보를 재구성할 수 있도록 하기 위해 웨이블릿 다중 해상도 분해(wavelet multi resolution decomposition)를 활용하였다. 종합적인 실험 결과, SDSL 사전학습은 기존 방법들보다 더 선명한 재구성 결과와 더 정확한 분할 성능을 제공함이 확인되었다. 제안된 접근법은 Beyond the Cranial Vault 데이터셋에서 평균 Dice 점수 84.17%, Medical Segmentation Decathlon Spleen 데이터셋에서 98.20%, Multimodality Whole Heart Segmentation 데이터셋에서 90.38%의 최고 평균 Dice 점수를 달성하였다. 이러한 결과는 스펙트럼 변이를 효과적으로 처리하고 모델의 일반화를 개선함으로써 의료 영상 기술을 발전시킬 SDSL의 잠재력을 강조한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.