인간은 모든 것을 기억하지는 않는다. 따라서 인간은 과거 이미지를 탐색함으로써 장면 변화를 인식한다. 그러나 이용 가능한 과거(즉, 기준) 이미지는 대체로 현재(즉, 질의) 장면의 인접한 관점들을 나타내며, 동일한 시점을 나타내지는 않는다. 이러한 실무적 제약에도 불구하고, 기존의 장면 변화 감지(Scene Change Detection, SCD)는 모든 질의에 대해 관점이 일치하는 기준 이미지가 이용 가능한 이상화된 환경에서 정식화되어 왔다. 본 논문에서는 이 문제를 보다 실용적인 과제로 확장하여 환경 변화 감지(Environmental Change Detection, ECD)를 제안한다. ECD의 핵심 측면은 비현실적으로 정렬된 질의-기준 쌍을 피하고, 환경적 단서에만 의존하는 것이다. 실제 환경에서의 관행에 영감을 받아, 이러한 단서를 선별되지 않은 대규모 이미지 데이터베이스를 통해 제공한다. 이 새로운 과제를 다루기 위해, 공간 환경을 함께 이해하고 변화를 탐지하는 새로운 프레임워크를 제안한다. 핵심 아이디어는 질의와 기준 사이에서 동일한 공간 위치에서의 매칭을 수행하더라도, 관점 불일치 및 제한된 화각(FOV) 커버리지로 인해 차선의 해에 도달할 수 있다는 점이다. 우리는 복수의 기준 후보를 활용하고, 변화 감지를 위해 의미적으로 풍부한 표현을 집계함으로써 이 한계를 극복한다. 우리의 프레임워크는 ECD를 위해 재구성된 세 가지 표준 벤치마크 세트에서 평가되었으며, 최신 기법들의 단순한 결합에 비해 유의미하게 더 나은 성능을 보이면서도 오라클(oracle) 설정과 비교 가능한 성능을 달성한다. 코드는 심사 승인 시 공개될 예정이다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.