시각 및 기하지능 연구실
컴퓨터공학부 박재식
시각 및 기하지능 연구실은 컴퓨터공학부에 소속된 연구실로, 주로 3D 형상 조립, 이미지-텍스트 정렬, 생성적 적대 신경망 (GANs), 비주얼 SLAM 및 포인트 클라우드 매칭 등의 연구를 수행하고 있습니다. 최근 3년간 'Distilling Diffusion Models into Conditional GANs', '3D Geometric Shape Assembly via Efficient Point Cloud Matching', 'Extending CLIP's Image-Text Alignment to Referring Image Segmentation' 등 다수의 논문을 발표하며 해당 분야에서 높은 연구 성과를 거두고 있습니다. 특히, GANs를 활용한 이미지 생성 및 텍스트-이미지 정렬 분야에서 두드러진 성과를 보이고 있으며, 다양한 기업과의 협업을 통해 실제 프로젝트에서도 성공적인 결과를 도출하고 있습니다.
3D Shape Assembly
3D 형상 조립
Image-Text Alignment
이미지-텍스트 정렬
Generative Adversarial Networks (GANs)
조건부 GAN을 통한 디퓨전 모델 증류
시각 및 기하지능 연구실은 최신 디퓨전 모델을 조건부 생성적 적대 신경망(GAN)으로 증류하는 연구를 선도하고 있습니다. 이 연구는 디퓨전 모델의 뛰어난 성능을 유지하면서도, 계산 복잡도를 크게 감소시키는 것을 목표로 합니다. 이를 통해 다양한 이미지 생성 및 변환 작업에서 실시간 성능에 가까운 결과를 도출할 수 있습니다. 이러한 기술은 이미지 합성, 사진 실감화, 영상 편집 등 다양한 산업 분야에서 응용 가능성이 높습니다.
1
Distilling Diffusion Models into Conditional GANs
Minguk Kang, Richard Zhang, Connelly Barnes, Sylvain Paris, Suha Kwak, Jaesik Park, Eli Shechtman, Jun-Yan Zhu, Taesung Park
arXiv, 2024
2
3D Geometric Shape Assembly via Efficient Point Cloud Matching
Nahyuk Lee, Juhong Min, Junha Lee, Seungwook Kim, Kanghee Lee, Jaesik Park, Minsu Cho
Int. Conf. on Machine Learning (ICML), 2024
3
3Doodle: Compact Abstraction of Objects with 3D Strokes
Changwoon Choi, Jaeah Lee, Jaesik Park, Young Min Kim
SIGGRAPH, 2024