약지도 학습 기반 의미 분할(WSSS) 방법은 종종 분류기로부터 얻은 픽셀 수준 локализ이션 맵(pixel-level localization maps)에 기반하여 구성된다. 그러나 클래스 라벨만으로 학습할 경우, 분류기는 전경과 배경 단서 사이의 허위 상관(spurious correlation)(예: train과 rail)으로 인해 본질적으로 WSSS의 성능을 근본적으로 제한받는다. 이러한 문제를 해결하기 위해 추가적인 감독을 사용하는 선행 연구들이 있었다. 본 연구는 전경과 배경을 구분하기 위한 새로운 정보의 원천으로, 분포 밖(Out-of-Distribution, OoD) 데이터 또는 전경 객체 클래스가 없는 이미지에 주목한다. 특히 우리는 분류기가 오탐(false-positive) 예측을 할 가능성이 높은 하드 OoD(hard OoDs)를 활용한다. 이러한 샘플은 일반적으로 배경에 핵심적인 시각적 특징(예: rail)을 포함하며, 분류기는 이를 종종 전경(예: train)으로 혼동한다. 따라서 이러한 단서들은 분류기가 허위의 배경 단서를 올바르게 억제하도록 돕는다. 이와 같은 하드 OoD를 획득하는 데에는 방대한 주석 작업이 필요하지 않으며, 클래스 라벨을 수집하기 위한 원래의 노력에 더해 소수의 추가적인 이미지 수준 라벨링 비용만이 소요된다. 우리는 하드 OoD를 활용하기 위한 방법인 W-OoD를 제안한다. W-OoD는 Pascal VOC 2012에서 최신(state-of-the-art) 성능을 달성한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.