다중표지 원격탐사 이미지 분류는 한 장의 이미지 내에서 여러 객체와 토지 피복을 분류하는 기본 과제이다. 그러나 이러한 과제를 위해 딥러닝 모델을 학습시키는 데에는 라벨링 비용이 상당히 많이 소요된다. 라벨링 비용을 줄이기 위한 여러 노력들이 이루어졌지만, 그 결과 라벨 품질이 저하되고 잘못된(즉, 노이즈가 포함된) 라벨이 포함되는 경우가 흔하다. 이러한 문제를 해결하기 위해, 다중표지 노이즈에 강인하도록 딥러닝 모델을 학습시키는 알고리즘들이 문헌에서 제안되어 왔다. 그럼에도 불구하고, 이러한 알고리즘들의 효능은 각 원격탐사 이미지의 개별 특성과 특징과 무관하게 노이즈가 생성되는 인스턴스 비독립적(instance-independent) 다중표지 노이즈 하에서만 평가되어 왔다. 본 논문에서는 다중표지 원격탐사 이미지 데이터셋에 대해 최초로 인스턴스 의존적(instance-dependent) 다중표지 노이즈를 생성하는 방법을 제안한다. 우리는 제로샷 예측 기능을 갖춘 비전-언어 모델을 활용하여 각 이미지에 대한 범주별 예측 점수를 계산하고, 이를 바탕으로 인스턴스에 의존하는 방식으로 다중표지 노이즈를 생성한다. 제안하는 인스턴스 의존적 다중표지 노이즈는 전통적인 인스턴스 비독립적 다중표지 노이즈에 비해 개별 이미지에 대해 보다 용이하게 생성됨을 보여준다. 또한 더 어려운 노이즈 시나리오가 생성되어, 그에 따라 보다 복잡한 결정 경계와 딥러닝 모델 학습 시 더 강한 과적합이 유발됨을 확인한다. 마지막으로, 생성된 인스턴스 의존적 다중표지 노이즈 하에서 기존의 노이즈 강인 학습 알고리즘들을 재평가한 결과, 여러 알고리즘이 인스턴스 의존적 다중표지 노이즈에 대해 제한적인 강인성만을 보이는 것으로 관찰된다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.