인간 이미지 완성(human image completion)에 대한 최근의 방법들은 그럴듯한 신체 형태를 복원할 수는 있지만, 명시적인 참고 이미지(explicit reference images) 없이 특정 의복 패턴이나 독특한 액세서리와 같은 고유한 세부 정보를 종종 보존하지 못한다. 최신 수준의 참고 기반(in reference-based) 인페인팅 접근법 역시 참고 이미지로부터의 미세한(granular) 디테일을 정확히 포착하고 통합하는 데 어려움을 겪는다. 이러한 한계를 해결하기 위해, 우리는 CompleteMe라는 새로운 참고 기반 인간 이미지 완성 프레임워크를 제안한다. CompleteMe는 Region-focused Attention(RFA) Block과 결합된 이중 U-Net 아키텍처를 사용하며, 이는 참고 이미지에서 관련된 영역에 대해 모델의 주의를 명시적으로 유도한다. 이 방식은 미세한 디테일을 효과적으로 포착하고 정확한 의미적 대응(semantic correspondence)을 보장하여, 완성된 이미지의 충실도와 일관성을 크게 향상시킨다. 또한, 참고 기반 인간 이미지 완성 과제를 평가하기 위해 특별히 설계된 도전적인 벤치마크를 도입한다. 광범위한 실험을 통해, 제안한 방법이 기존 기술들에 비해 우수한 시각적 품질과 의미적 일관성을 달성함을 확인하였다. 프로젝트 페이지: https://liagm.github.io/CompleteMe/
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.