흉부 X선 촬영(Chest radiography, CXR)은 심장 관련 또는 기타 흉부 질환을 진단하는 데 유용하므로 의료 영상 처리 분야에서 가장 널리 연구된 분야이다. 그러나 라벨이 부재한 데이터의 부족으로 인해 완전 지도학습에 기반한 접근을 사용하는 데 제약이 있다. 라벨이 없는 데이터로부터 의미 있는 표현을 획득할 수 있는 자기지도학습(Self-supervised learning, SSL)은 이러한 문제를 해결하기 위한 효과적인 방법이다. 불행히도 기존의 대부분 자기지도학습 인스턴스 판별(instance discrimination) 방법은 전역적 불변 표현(global invariant representations)을 학습하는 데 초점이 맞춰져 있는 반면, CXR 도메인에서 질병 진단을 위해서는 국소적 공간 표현(local spatial representations)이 중요하다. 또한 자연 영상과 CXR 영상 사이에는 색 분포와 텍스처(texture)와 같은 주목할 만한 차이가 존재하므로, SSL 방법이 CXR 데이터에 대해 얼마나 잘 수행되는지 불명확하다. 이러한 문제를 완화하기 위해, 우리는 CXR 데이터로부터 적절한 표현을 학습하여 다양한 하위 과제(downstream tasks)에 대해 보다 세분화되고 구별력 있는 특징을 제공하는 새로운 단위인 Recalibrating and Importance Scaling Layer(RS-Layer)를 제안한다. RS-Layer는 압축된 특징(squeezed features)으로부터 일반적 특징을 추출하는 재조정(recalibrating) 모듈과, 각 특징의 중요도를 결정하는 중요도 스케일링(importance scaling) 모듈로 구성된다. 계산된 중요도에 따라 특징의 핵심 부분을 강조하고 필수적이지 않은 특징을 억제함으로써, RS-Layer는 유용한 부분을 학습하여 가치 있는 표현을 명시적으로 포착할 수 있도록 SSL 방법을 가능하게 한다. RS-Layer의 효능을 다음 세 관점에서 체계적으로 분석하였다: 1) 다양한 하위 과제에 대한 일반화 가능성과 전이 가능성의 증명, 2) 특징 공간 분석, 3) RS-Layer를 구성하는 구성 요소들에 대한 광범위한 절제(ablation) 연구. 또한 RS-Layer는 기존 SSL 인스턴스 판별 방법에 적용될 수 있다는 장점이 있다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.