연구실에서 최근에 진행되고 있는 관심 연구 분야
1
시각적 의미 정합(Visual Semantic Correspondence)
시각적 의미 정합은 서로 다른 이미지나 비디오 내에서 의미적으로 유사한 부분을 정확하게 대응시키는 기술입니다. 이 연구는 컴퓨터 비전 분야에서 매우 중요한 역할을 하며, 객체 인식, 장면 이해, 이미지 검색 등 다양한 응용 분야에 활용됩니다. POSTECH Computer Vision Lab에서는 신경망 기반의 딥러닝 모델을 활용하여 복잡한 시각적 패턴과 구조를 효과적으로 분석하고, 다양한 환경에서의 정합 성능을 극대화하는 방법을 연구하고 있습니다. 특히, 본 연구실은 최소한의 지도(supervision)만으로도 높은 성능을 달성할 수 있는 의미 정합 알고리즘 개발에 집중하고 있습니다. 이를 위해 대규모 웹 비디오, 이미지 데이터셋을 활용한 자기지도학습(self-supervised learning) 및 약지도 학습(weakly-supervised learning) 기법을 적극적으로 도입하고 있으며, 다양한 도메인 간의 일반화 성능을 높이기 위한 새로운 네트워크 구조와 손실 함수 설계에도 힘쓰고 있습니다. 이러한 연구는 실제 환경에서의 객체 탐지, 로봇 비전, 자율주행, 증강현실 등 다양한 산업적 응용에 직접적으로 기여할 수 있습니다. 또한, 시각적 의미 정합의 정확도를 높임으로써 인공지능 시스템의 해석력과 신뢰성을 향상시키고, 인간과 기계 간의 상호작용을 더욱 자연스럽고 효율적으로 만드는 데 중요한 역할을 하고 있습니다.
2
대칭성 분석(Symmetry Analysis)
대칭성 분석은 이미지나 3차원 데이터 내에서 대칭 구조를 자동으로 탐지하고 해석하는 연구 분야입니다. 대칭성은 자연 및 인공 환경에서 빈번하게 나타나는 중요한 시각적 특성으로, 객체 인식, 장면 분할, 3D 재구성 등 다양한 컴퓨터 비전 문제에서 핵심적인 역할을 합니다. 본 연구실은 그룹-등변 신경망(group-equivariant neural networks) 등 최신 딥러닝 기법을 활용하여, 축 대칭, 회전 대칭, 반사 대칭 등 다양한 형태의 대칭성을 효과적으로 검출하고 분석하는 방법을 개발하고 있습니다. 최근에는 2D 이미지뿐만 아니라 3D 포인트 클라우드, 메쉬 데이터 등 다양한 데이터 유형에 대한 대칭성 분석 연구도 활발히 진행되고 있습니다. 이를 통해 복잡한 구조의 객체나 장면에서도 대칭성을 정밀하게 파악할 수 있으며, 대칭성을 활용한 데이터 증강, 객체 분할, 3D 모델링 등 다양한 응용이 가능해집니다. 이러한 연구는 컴퓨터 비전의 근본적인 문제 해결뿐만 아니라, 로봇공학, 자율주행, 의료 영상 분석 등 실제 산업 현장에서의 활용 가능성을 높이고 있습니다. 대칭성 분석을 통해 얻어진 정보는 인공지능 시스템의 해석력과 일반화 능력을 크게 향상시키며, 더욱 정교하고 신뢰성 있는 시각 인식 시스템 구축에 기여하고 있습니다.
3
객체 발견 및 동작 인식(Object Discovery & Action Recognition)
객체 발견은 지도 정보가 부족한 환경에서 이미지나 비디오 내의 의미 있는 객체를 자동으로 탐지하고 분류하는 기술입니다. POSTECH Computer Vision Lab에서는 약지도 및 비지도 학습 기반의 객체 발견 알고리즘을 개발하여, 최소한의 라벨 정보만으로도 다양한 객체를 효과적으로 식별할 수 있는 방법을 연구하고 있습니다. 이러한 기술은 대규모 데이터셋 구축 비용을 절감하고, 새로운 환경이나 도메인에 빠르게 적응할 수 있는 인공지능 시스템 개발에 필수적입니다. 동작 인식 분야에서는 비디오 내에서 인간의 행동이나 객체의 움직임을 자동으로 분석하고 분류하는 연구가 이루어지고 있습니다. 본 연구실은 시공간적 특징 추출, 메모리 기반 트랜스포머, 대규모 비디오 데이터셋을 활용한 딥러닝 모델 등 다양한 최신 기법을 도입하여, 복잡한 환경에서도 정확한 동작 인식이 가능하도록 하고 있습니다. 또한, 제로샷(zero-shot) 및 소수 샷(few-shot) 학습 등 데이터 효율적인 학습 방법론도 적극적으로 연구 중입니다. 이러한 객체 발견 및 동작 인식 연구는 자율주행, 감시 시스템, 스마트 시티, 스포츠 분석 등 다양한 실제 응용 분야에서 큰 파급 효과를 지니고 있습니다. 더불어, 인간-컴퓨터 상호작용, 증강현실, 로봇 비전 등 차세대 인공지능 서비스의 핵심 기반 기술로 자리매김하고 있습니다.