연세대학교 인공지능학과 양밍쉬안 교수
양밍쉬안 연구실은 딥러닝 기반 컴퓨터비전에서 생성 모델과 시각 복원, 시각-언어 의미 정렬을 함께 연구합니다. 생성형 모델 측면에서는 diffusion models, GAN inversion, 얼굴 속성 조작, 이미지-to-이미지 변환의 관점에서 방법론을 정리하고 적용 방향을 도출합니다. 비전 복원에서는 비디오의 시간 샤프니스와 비국소 공간-시간 유사도 같은 도메인 지식을 활용해 경량 CNN 디블러링을 수행합니다. 또한 비디오 캡션과 지시 표현 이해에서 대조 특징 학습과 특징 공간 분포 정규화를 결합해 시각과 언어 의미 정합을 강화합니다.