RnDCircle Logo
arrow left icon

POSTECH Computer Vision Lab

포항공과대학교 컴퓨터공학과

조민수 교수

Vision Transformers

Semantic Segmentation

GANs for Image Synthesis

POSTECH Computer Vision Lab

컴퓨터공학과 조민수

POSTECH Computer Vision Lab은 컴퓨터 비전과 머신러닝 분야에서 세계적인 연구를 선도하는 연구실입니다. 본 연구실은 시각적 의미 정합, 대칭성 분석, 객체 발견, 동작 인식, 최소 지도 학습 등 다양한 컴퓨터 비전의 핵심 문제를 다루고 있으며, 최신 딥러닝 기술을 바탕으로 혁신적인 알고리즘과 시스템을 개발하고 있습니다. 특히, 시각적 의미 정합 분야에서는 이미지 및 비디오 내에서 의미적으로 유사한 부분을 정확하게 대응시키는 기술을 연구하고 있습니다. 이를 통해 객체 인식, 장면 이해, 이미지 검색 등 다양한 응용 분야에서 높은 성능을 달성하고 있으며, 자기지도학습 및 약지도 학습 기법을 적극적으로 도입하여 데이터 효율성을 극대화하고 있습니다. 대칭성 분석 연구에서는 그룹-등변 신경망 등 첨단 딥러닝 모델을 활용하여 2D 및 3D 데이터 내의 다양한 대칭 구조를 효과적으로 검출하고 해석하는 방법을 개발하고 있습니다. 이러한 연구는 3D 재구성, 객체 분할, 데이터 증강 등 다양한 실제 문제 해결에 기여하고 있습니다. 또한, 객체 발견 및 동작 인식 분야에서는 최소한의 라벨 정보만으로도 다양한 객체와 인간의 행동을 자동으로 탐지하고 분류하는 기술을 연구하고 있습니다. 제로샷 및 소수 샷 학습, 시공간적 특징 추출, 트랜스포머 기반 모델 등 최신 기법을 도입하여, 복잡한 환경에서도 높은 정확도를 보장합니다. POSTECH Computer Vision Lab은 이론적 연구와 실용적 응용을 모두 아우르며, 자율주행, 로봇공학, 의료 영상, 증강현실 등 다양한 산업 분야와의 협력을 통해 인공지능 기반의 차세대 시각 인식 기술 발전에 앞장서고 있습니다. 앞으로도 본 연구실은 컴퓨터 비전 분야에서의 혁신과 도전적인 연구를 지속적으로 이어갈 것입니다.

Vision Transformers
Semantic Segmentation
GANs for Image Synthesis
시각적 의미 정합(Visual Semantic Correspondence)
시각적 의미 정합은 서로 다른 이미지나 비디오 내에서 의미적으로 유사한 부분을 정확하게 대응시키는 기술입니다. 이 연구는 컴퓨터 비전 분야에서 매우 중요한 역할을 하며, 객체 인식, 장면 이해, 이미지 검색 등 다양한 응용 분야에 활용됩니다. POSTECH Computer Vision Lab에서는 신경망 기반의 딥러닝 모델을 활용하여 복잡한 시각적 패턴과 구조를 효과적으로 분석하고, 다양한 환경에서의 정합 성능을 극대화하는 방법을 연구하고 있습니다. 특히, 본 연구실은 최소한의 지도(supervision)만으로도 높은 성능을 달성할 수 있는 의미 정합 알고리즘 개발에 집중하고 있습니다. 이를 위해 대규모 웹 비디오, 이미지 데이터셋을 활용한 자기지도학습(self-supervised learning) 및 약지도 학습(weakly-supervised learning) 기법을 적극적으로 도입하고 있으며, 다양한 도메인 간의 일반화 성능을 높이기 위한 새로운 네트워크 구조와 손실 함수 설계에도 힘쓰고 있습니다. 이러한 연구는 실제 환경에서의 객체 탐지, 로봇 비전, 자율주행, 증강현실 등 다양한 산업적 응용에 직접적으로 기여할 수 있습니다. 또한, 시각적 의미 정합의 정확도를 높임으로써 인공지능 시스템의 해석력과 신뢰성을 향상시키고, 인간과 기계 간의 상호작용을 더욱 자연스럽고 효율적으로 만드는 데 중요한 역할을 하고 있습니다.
대칭성 분석(Symmetry Analysis)
대칭성 분석은 이미지나 3차원 데이터 내에서 대칭 구조를 자동으로 탐지하고 해석하는 연구 분야입니다. 대칭성은 자연 및 인공 환경에서 빈번하게 나타나는 중요한 시각적 특성으로, 객체 인식, 장면 분할, 3D 재구성 등 다양한 컴퓨터 비전 문제에서 핵심적인 역할을 합니다. 본 연구실은 그룹-등변 신경망(group-equivariant neural networks) 등 최신 딥러닝 기법을 활용하여, 축 대칭, 회전 대칭, 반사 대칭 등 다양한 형태의 대칭성을 효과적으로 검출하고 분석하는 방법을 개발하고 있습니다. 최근에는 2D 이미지뿐만 아니라 3D 포인트 클라우드, 메쉬 데이터 등 다양한 데이터 유형에 대한 대칭성 분석 연구도 활발히 진행되고 있습니다. 이를 통해 복잡한 구조의 객체나 장면에서도 대칭성을 정밀하게 파악할 수 있으며, 대칭성을 활용한 데이터 증강, 객체 분할, 3D 모델링 등 다양한 응용이 가능해집니다. 이러한 연구는 컴퓨터 비전의 근본적인 문제 해결뿐만 아니라, 로봇공학, 자율주행, 의료 영상 분석 등 실제 산업 현장에서의 활용 가능성을 높이고 있습니다. 대칭성 분석을 통해 얻어진 정보는 인공지능 시스템의 해석력과 일반화 능력을 크게 향상시키며, 더욱 정교하고 신뢰성 있는 시각 인식 시스템 구축에 기여하고 있습니다.
객체 발견 및 동작 인식(Object Discovery & Action Recognition)
객체 발견은 지도 정보가 부족한 환경에서 이미지나 비디오 내의 의미 있는 객체를 자동으로 탐지하고 분류하는 기술입니다. POSTECH Computer Vision Lab에서는 약지도 및 비지도 학습 기반의 객체 발견 알고리즘을 개발하여, 최소한의 라벨 정보만으로도 다양한 객체를 효과적으로 식별할 수 있는 방법을 연구하고 있습니다. 이러한 기술은 대규모 데이터셋 구축 비용을 절감하고, 새로운 환경이나 도메인에 빠르게 적응할 수 있는 인공지능 시스템 개발에 필수적입니다. 동작 인식 분야에서는 비디오 내에서 인간의 행동이나 객체의 움직임을 자동으로 분석하고 분류하는 연구가 이루어지고 있습니다. 본 연구실은 시공간적 특징 추출, 메모리 기반 트랜스포머, 대규모 비디오 데이터셋을 활용한 딥러닝 모델 등 다양한 최신 기법을 도입하여, 복잡한 환경에서도 정확한 동작 인식이 가능하도록 하고 있습니다. 또한, 제로샷(zero-shot) 및 소수 샷(few-shot) 학습 등 데이터 효율적인 학습 방법론도 적극적으로 연구 중입니다. 이러한 객체 발견 및 동작 인식 연구는 자율주행, 감시 시스템, 스마트 시티, 스포츠 분석 등 다양한 실제 응용 분야에서 큰 파급 효과를 지니고 있습니다. 더불어, 인간-컴퓨터 상호작용, 증강현실, 로봇 비전 등 차세대 인공지능 서비스의 핵심 기반 기술로 자리매김하고 있습니다.
1
Axis-level Symmetry Detection with Group-equivariant Representation
Wongyun Yu, Ahyun Seo, Minsu Cho
, 2025
2
Combinative Matching for Geometric Shape Assembly
Nahyuk Lee*, Juhong Min*, Junhong Lee, Chunghyun Park, Minsu Cho
, 2025
3
Few-Shot Pattern Detection via Template Matching and Regression
Eunchan Jo, Dahyun Kang, Sanghyun Kim, Yunseon Choi, Minsu Cho
, 2025