시각 항법(Visual Odometry, VO)의 효율성은 특징 추출, 특징 매칭, 견고한 변위 추정 등 다양한 순차적 구성 요소로부터 구축된다. 최근에는 이러한 구성 요소들을 대체하는 방안으로 학습 기반 솔루션을 선호하는 연구들이 다수 등장하였다. 한편, 이러한 솔루션은 모듈형 향상에 대한 특정 요구를 충족시키기 위해 연구자들에게 유연성을 제공한다. 이를 위해 본 설문 논문은 학습 기반 방법의 발전 양상을 탐색하고, 그것들이 전통적인 VO 파이프라인에 어떻게 관여할 수 있는지를 고찰한다. 이러한 접근은 딥러닝의 관점을 통해 개별 VO 구성 요소를 단계적으로 발전시키고 더 깊이 탐구할 수 있게 하며, 또한 기준(baseline)에 모듈 방식으로 적용될 때 새로이 등장하는 추가 알고리즘을 가능하게 한다. 더 나아가 본 설문은 카메라 운동을 영상으로부터 직접 학습하여 VO 과정을 간소화하는 엔드-투-엔드(end-to-end) 방법까지 확장한다. 이러한 전체론적 접근은 VO 파이프라인을 단순화하면서, 데이터 내 복잡한 관계를 암묵적으로 모델링하기 위해 DNN의 장점을 활용한다. 궁극적으로 본 논문은 엔드-투-엔드 VO 모델이나 파이프라인 성능을 향상시키는 데 핵심적인 다양한 공통 최적화 함수와 일반화된 방법을 다룬다. 이 두 접근을 서로 대비함으로써, 본 논문은 주요 기준에 대한 DVO 접근 및 이를 지지하는 보조 과업 전반에 대한 포괄적 개관을 제공하는 것을 목표로 한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.