시각 추적 및 동적 장면 이해
이 연구 주제는 비디오와 연속 영상에서 객체의 위치와 상태를 안정적으로 추적하고, 시간에 따라 변화하는 장면의 구조와 맥락을 이해하는 컴퓨터 비전 기술에 초점을 둔다. 연구실은 단순한 검출을 넘어 가림, 배경 혼잡, 조명 변화, 형태 변형 등 실제 환경에서 빈번히 발생하는 어려운 조건에서도 강건하게 동작하는 추적 알고리즘을 개발해 왔다. 특히 객체 추적 벤치마크 구축과 정량 평가 체계 정립에 기여함으로써, 개별 알고리즘의 성능을 공정하게 비교하고 향후 연구 방향을 제시하는 기반 연구도 함께 수행한다. 방법론 측면에서는 상관 필터, 딥러닝 특징, 시암 네트워크, 계층적 특징 융합 등 다양한 기술을 결합하여 추적 성능을 높이는 방향의 연구가 두드러진다. 서로 다른 CNN 계층의 특징을 상황에 따라 적응적으로 결합하는 방식은 단일 수준의 특징에 의존하는 기존 기법의 한계를 보완하며, 순간 성능과 누적 성능을 동시에 고려하는 가중 조정 전략을 통해 장기 추적의 안정성을 높인다. 또한 멀티소스 동영상에서 행동 인식과 상황 예측을 수행하는 프로젝트 경험은 추적 기술이 단순 위치 추정이 아니라 장면 이해와 예지적 시각지능으로 확장되고 있음을 보여준다. 이 연구는 자율주행, 지능형 감시, 인간-로봇 상호작용, 산업 자동화 등 다양한 응용으로 이어질 수 있다. 특히 차량 주변 정적 객체 검출, 협로 주행 안내, 위험물 및 인명 탐지와 같은 실제 특허 및 과제 성과는 연구실의 추적 기술이 현실 문제 해결로 직접 연결되고 있음을 보여준다. 앞으로는 멀티모달 센서, 대규모 비디오 학습, 생성형 모델과의 결합을 통해 더욱 장기적이고 의미론적인 추적 및 상황 이해 기술로 발전할 가능성이 크다.
3차원 재구성 및 깊이 추정
이 연구 주제는 2차원 영상으로부터 장면의 기하 구조를 복원하고, 깊이와 형태를 정밀하게 추정하여 현실 세계를 3차원적으로 이해하는 기술을 다룬다. 연구실은 전방향 카메라, 광시야각 영상, 멀티뷰 입력 등 복잡한 영상 조건에서 깊이 지도를 생성하고 공간 구조를 복원하는 문제에 지속적으로 집중해 왔다. 이는 단순한 시각 인식의 수준을 넘어, 기계가 물리적 공간을 정밀하게 해석하고 상호작용하기 위한 핵심 기반 기술이다. 대표적으로 전방향 스테레오 정합 연구에서는 초광각 카메라로 구성된 리그에서 얻은 영상을 구면 기하에 맞추어 정렬하고, 종단간 딥러닝 모델을 통해 깊이를 추정하는 접근을 제시하였다. 여기에 불확실성 사전정보를 활용해 깊이 지도의 신뢰도를 반영하고, 불안정한 영역을 정규화함으로써 실제 환경에서도 정확성과 강건성을 동시에 확보한다. 또한 이벤트 카메라와 IMU를 결합한 극한 환경용 3차원 복원 연구, 영상 기반 극사실적 환경 모델링 과제 등은 연구실이 정적 장면 복원뿐 아니라 동적이고 물리적인 특성까지 고려하는 고도화된 3차원 비전으로 확장하고 있음을 보여준다. 이러한 연구는 자율주행, 로봇 내비게이션, 디지털 트윈, XR, 스마트 제조 등에서 매우 높은 활용 가치를 가진다. 실시간 깊이 추정과 정밀한 환경 복원은 충돌 회피, 경로 계획, 객체 조작, 가상 환경 생성의 핵심 요소이기 때문이다. 향후에는 NeRF, Gaussian Splatting, 물리 기반 렌더링, 멀티센서 융합과 결합하여 더욱 사실적이며 편집 가능한 3차원 환경 모델을 구축하는 방향으로 발전할 것으로 보인다.
기하학 기반 비전과 특징점 매칭
이 연구 주제는 영상 내 특징점과 기하학적 제약을 활용하여 카메라의 움직임, 장면의 구조, 영상 간 대응 관계를 정밀하게 추정하는 분야이다. 연구실은 컴퓨터 비전의 전통적 핵심 문제인 특징점 매칭, 에피폴라 기하, 상대 카메라 운동 추정, 구조복원 등을 심도 있게 다루며, 데이터 기반 방법과 기하 기반 방법의 장점을 함께 활용하는 연구를 수행해 왔다. 이는 추적과 3차원 재구성의 토대가 되는 기초 기술이면서도, 실제 응용에서는 매우 높은 안정성과 해석 가능성을 제공한다. 점진적 특징점 매칭 연구에서는 디스크립터 거리만으로는 해결하기 어려운 반복 구조와 큰 시점 변화 문제를 해결하기 위해 위치, 스케일, 방향과 같은 기하 정보를 함께 고려하는 마르코프 랜덤 필드 기반 접근을 제안했다. 초기의 신뢰도 높은 대응점 집합에서 시작해 그래프를 점진적으로 확장하고 최적화함으로써 정확도와 계산 효율을 동시에 확보한다. 또한 antipodal-epipolar constraint를 이용한 상대 카메라 운동 추정 연구는 광시야각 카메라에서 회전과 병진을 효과적으로 분리하여 보다 안정적인 자세 추정을 가능하게 하며, RANSAC 및 투표 기반 방식과 결합해 실제 환경에서도 강건한 성능을 보여준다. 이 연구는 Visual SLAM, 자율주행 위치 추정, 로봇 내비게이션, 산업 비전 검사, 장소 인식 등 다양한 응용으로 이어진다. 특히 다중 카메라 기반 Visual SLAM, 3차원 환경지도 생성, 장소 인식 특허 등은 연구실이 이론적 기하 비전 연구를 실용 시스템으로 연결하고 있음을 보여준다. 앞으로는 딥러닝 기반 특징 표현과 고전적 기하 최적화를 통합하는 하이브리드 접근이 더욱 중요해질 것이며, 연구실의 강점도 이러한 융합 방향에서 크게 발휘될 것으로 예상된다.