비디오 확산 모델에서의 급속한 발전은 사실적인 비디오의 생성을 가능하게 하였으나, 무단 사용에 대한 우려를 불러일으키며 모델 소유권을 보호하기 위한 기법에 대한 수요를 촉진하고 있다. 기존 워터마킹 방법은 두 가지 주요 한계를 가진다. 즉, 기존의 워터마크 디코더로 인해 시간적 일관성을 간과하며, 생성된 비디오의 시각적 품질을 저하시킨다는 점이다. 이러한 문제를 해결하기 위해 잠재 비디오 확산 모델을 위한 강건한 워터마킹 방법인 Latent Video Diffusion Watermarking (LVMark)를 제안한다. 우리는 인접 프레임 간의 일관성을 학습함으로써 생성 비디오에 특화된 새로운 워터마크 디코더를 제안한다. 이는 3차원 웨이블릿(wavelet) 도메인의 저주파 성분과 비디오의 색상 특징을 결합하여, 악의적인 공격 하에서도 정확한 메시지 디코딩을 보장한다. 또한 생성된 비디오의 시각적 충실도를 유지하기 위해 잠재 디코더를 학습한다. 워터마크는 시각적 외관에 대한 영향이 최소가 되도록 중요도 기반 가중치 변조(importance-based weight modulation) 전략을 사용하여 층(layer)에 삽입한다. 우리는 확산 모델의 워터마크 디코더와 잠재 디코더 모두를 최적화함으로써 시각적 품질과 비트 정확도 간의 상충 관계를 효과적으로 균형 있게 조절한다. 실험 결과, 본 방법은 비디오 확산 모델에 보이지 않는 워터마크를 삽입하면서 왜곡(distortions) 하에서도 512비트 용량으로 강건한 디코딩 정확도를 보장함을 확인하였다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.