본 연구에서는 가우시안 장면 표현(Gaussian scene representation)을 활용하는 실시간 단안(monocular) 조밀 SLAM 시스템인 GSO-SLAM을 제안한다. 기존 방법들과 달리, 추적과 맵핑을 하나의 장면으로 결합하여 계산 비용을 유발하는 방식이거나, 잘 정립된 추적 프레임워크와 느슨하게 통합하여 중복성을 도입하는 방식이 있다. 우리의 방법은 Visual Odometry(VO)와 Gaussian Splatting(GS)을 양방향으로 결합한다. 구체적으로, 본 접근은 Expectation-Maximization(EM) 프레임워크 내에서 공동 최적화를 정식화하여, 추가적인 계산 오버헤드 없이 VO로부터 도출된 준-조밀(semi-dense) 깊이 추정치와 GS 표현을 동시에 정교화할 수 있다. 또한, 이미지 정보, 키프레임 포즈, 그리고 VO로부터의 픽셀 연관(pixel associations)을 이용하는 Gaussian Splat Initialization을 제시한다. 이를 통해 최종 가우시안 장면에 대한 근접한 근사치를 생성하며, 따라서 휴리스틱 방법의 필요성을 제거한다. 광범위한 실험을 통해 본 방법의 유효성을 검증하였으며, 실시간으로 동작할 뿐 아니라 재구성된 장면의 기하/광도 충실도 및 추적 정확도에서 최신 수준의 성능을 달성함을 확인하였다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.