클래스 레이블로부터 픽셀 수준의 정확한 위치를 획득하는 과정은 약지도 의미 분할 및 객체 위치 추정에서 핵심적인 절차이다. 학습된 분류기에서 생성된 어트리뷰션 맵은 픽셀 수준의 위치 지정을 제공하기 위해 널리 사용되지만, 그 초점은 대체로 표적 객체의 작은 판별적 영역으로 제한되는 경향이 있다. AdvCAM은 최종 softmax 또는 sigmoid 층 이전에 분류기가 산출하는 분류 점수를 증가시키도록 입력 이미지를 조작한 어트리뷰션 맵이다. 이러한 조작은 안티-어드버서리얼(anti-adversarial) 방식으로 구현되어, 원본 이미지는 적대적 공격(adversarial attack)에서 사용된 방향과는 반대 방향의 픽셀 그라디언트(pixel gradients)를 따라 교란된다. 이 과정은 비판별적이지만 클래스와 관련된 특징을 강화하며, 이는 기존 어트리뷰션 맵들이 충분히 기여하지 못했던 영역이므로 결과적으로 AdvCAM은 표적 객체의 더 많은 영역을 식별하게 한다. 또한 우리는 표적 객체와 무관한 영역의 잘못된 어트리뷰션을 억제하고, 표적 객체의 작은 영역에 어트리뷰션이 과도하게 집중되는 현상을 방지하는 새로운 정규화 절차를 제안한다. 우리의 방법은 PASCAL VOC 2012 및 MS COCO 2014 데이터셋에서 약지도 및 준지도 의미 분할에 대해 새로운 최신 성능을 달성한다. 약지도 객체 위치 추정에서는 CUB-200-2011 및 ImageNet-1K 데이터셋에서 새로운 최신 성능을 달성한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.