본 논문에서는 비디오 코딩을 위한 효율적인 참조 기반 딥 인-루프 필터링 방법을 제안한다. 기존의 참조 기반 인-루프 필터는 참조 프레임으로부터 관련 텍스처를 포착하는 데 어려움이 있어 코딩 효율을 향상시키는 데 한계가 있는 경우가 많다. 우리의 방법은 참조 블록의 텍스처를 정확히 예측하고, 이를 이용하여 현재 블록을 복원한다. 이를 위해 우리는 특징 영역에서 이전에 코딩된 프레임으로부터 고품질 정보를 전달하는 참조-대-현재 특징 추정 모듈을 개발하여 부정확한 예측으로 인한 세부 손실을 방지한다. 신경망은 코딩된 비디오 프레임을 현재 프레임과 유사하게 복원하도록 학습되지만, 다양한 양자화 파라미터(QP)와 서로 다른 수준의 왜곡을 처리할 때 그 성능이 크게 저하될 수 있다. 이러한 문제는 QP 값이 비디오 프레임에 서로 다르게 적용되는 참조-대-현재 특징 추정에서도 더욱 심각해진다. 우리는 적은 수의 학습 가능한 파라미터로 신뢰할 수 있는 특징을 생성하고, 연속 프레임 간의 세분화된 적응 QP에 적응하기 위해 QP-인지 합성곱 레이어를 개발함으로써 이 문제를 해결한다. 제안된 방법은 다용도 비디오 코딩(versatile video coding, VVC) 참조 소프트웨어인 VTM 버전 10.0에 구현하였다. 실험 결과, 제안된 방법은 VVC에서 코딩 성능을 유의미하게 향상시키는 것으로 나타났다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.