약지도 객체 위치추정(weakly supervised object localization)은 이미지 수준 라벨(image-level labels)과 같은 약한 감독만으로 주어진 이미지에서 목표 객체 영역을 찾는 것을 목표로 한다. 대부분의 기존 방법은 위치화 맵(localization map)을 생성하기 위해 클래스 활성화 맵(class activation map, CAM)을 사용한다. 그러나 CAM은 목표 객체의 전체 영역이 아니라, 목표 객체를 가장 구별해 주는 일부(discriminative parts)만을 식별한다. 본 연구에서는 입력 특징(input feature)과 클래스 특이적 가중치(class-specific weight) 사이의 방향(directions)이 일치하지 않는 점과 관련하여, 분류(classification)와 위치추정(localization) 간의 간극(gap)을 규명한다. 우리는 이러한 방향 불일치가 덜 구별적이지만 목표 객체에 속하는 영역에서 CAM의 활성화를 억제함을 보인다. 이 간극을 해소하기 위해, 우리는 특징 방향을 클래스 특이적 가중치와 정렬(align)시키는 방법을 제안한다. 제안된 방법은 CUB-200-2011 및 ImageNet-1K 벤치마크에서 최첨단(state-of-the-art) 수준의 위치추정 성능을 달성한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.