GAN inversion과 확산모델 등 생성형 모델의 잠재공간 및 생성 메커니즘을 정리하고, 얼굴 속성 편집·이미지 변환 같은 시각 편집 문제에 적용 가능성을 제시하는 연구
비디오의 비균일 블러 성질과 시간 샤프니스 정보를 활용해 CNN을 설계하고, 비국소 유사도 제약으로 프레임 복원 성능과 경량성을 함께 달성하는 연구
비디오 캡션·지시 표현 이해·의미 대응 정렬에서 시각과 언어 간 의미 정합을 대조 학습과 모듈형 구조로 강화하고, 특징 공간 분포를 정규화해 견고성을 높이는 연구