약지도 의미 분할(WSSS) 방법은 종종 분류기에서 얻은 픽셀 수준의 위치 정보 지도(pixel-level localization maps)를 기반으로 구축된다. 그러나 클래스 라벨만으로 학습할 경우 분류기는 전경과 배경 단서 사이의 우연적 상관(spurious correlation) (예: train과 rail)으로 인해 본질적으로 WSSS의 성능이 제한된다. 이러한 문제를 해결하기 위해 추가적인 감독을 도입하려는 선행 연구들이 있었다. 본 연구는 전경과 배경을 구분하기 위한 새로운 정보의 원천으로, 즉 전경 객체 클래스가 없는 이미지로 이루어진 Out-of-Distribution(OoD) 데이터 또는 OoD 데이터를 제안한다. 특히, 분류기가 오탐( false-positive ) 예측을 할 가능성이 큰 하드(hard) OoD를 활용한다. 이러한 표본은 일반적으로 배경(예: rail)에 핵심 시각적 특징을 포함하며, 분류기들은 이를 전경(예: train)으로 오인하는 경우가 많다. 따라서 이러한 단서들은 분류기가 우연적 배경 단서를 올바르게 억제하도록 돕는다. 이와 같은 하드 OoD의 확보는 광범위한 주석(annotation) 노력이 필요하지 않으며, 클래스 라벨을 수집하기 위한 기존 노력에 더해 소수의 추가적인 이미지 수준 라벨링 비용만이 소요된다. 본 연구는 하드 OoD를 활용하기 위한 방법인 W-OoD를 제안한다. W-OoD는 Pascal VOC 2012에서 최첨단 성능을 달성한다. 코드는 다음에서 제공된다: https://github.com/naver-ai/w-ood.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.