3D 초해상도는 저해상도(LR) 다중 시점 이미지로부터 고충실도의 3D 모델을 재구성하는 것을 목표로 한다. 초기 연구들은 주로 단일 이미지 초해상도(SISR) 모델을 활용하여 LR 이미지를 고해상도 이미지로 업샘플링하는 데 초점을 맞추었다. 그러나 이러한 방법들은 각 이미지를 독립적으로 처리하기 때문에 종종 시점 간 일관성이 부족하다. 이러한 불일치를 완화하기 위해 다양한 후처리 기법들이 광범위하게 탐색되어 왔음에도, 문제를 완전히 해결하지는 못했다. 본 논문에서는 비디오 초해상도(VSR) 모델을 활용하여 3D 초해상도에 대한 포괄적인 연구를 수행한다. VSR 모델을 이용함으로써 더 높은 수준의 공간 일관성을 확보할 수 있으며, 주변의 공간 정보를 참조할 수 있어 보다 정확하고 상세한 재구성이 가능해진다. 우리의 결과는 정밀한 공간 정렬이 결여된 시퀀스에서도 VSR 모델이 매우 우수하게 성능을 발휘할 수 있음을 보여준다. 이러한 관찰에 근거하여, 미세 조정이나 학습된 3D 모델로부터 LR 이미지에 대해 `smooth' 궤적을 생성하는 과정 없이, LR 이미지를 정렬하는 간단하면서도 실용적인 접근법을 제안한다. 실험 결과는 놀라울 정도로 단순한 알고리즘들이 NeRF-synthetic 및 Mip-NeRF 360과 같은 표준 벤치마크 데이터셋에서 3D 초해상도 과제의 최신(state-of-the-art) 결과를 달성할 수 있음을 보여준다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.