기본 정보
연구 분야
프로젝트
논문
구성원
연구 영역
대표 연구 분야
연구실이 가장 잘하는 대표 연구 분야
1

컴퓨터비전 기반 객체 추적 및 재식별

이 연구 주제는 영상 속 객체를 정확하게 인식하고 시간에 따라 지속적으로 추적하는 기술에 초점을 둔다. 연구실의 논문과 학술발표를 살펴보면 비전 트랜스포머, 토큰 강조 기법, 시공간 정보 활용, 사람 재식별, 반려동물 재식별 등 다양한 응용을 통해 추적 성능을 높이는 방향의 연구가 지속적으로 수행되고 있다. 특히 단순 검출에 그치지 않고 동일 개체를 장면 간 다시 찾아내는 재식별 문제까지 다룸으로써 실제 환경에서의 활용 가능성을 높이고 있다. 방법론적으로는 딥러닝 기반 특징 추출, 글로벌·로컬 특징 강화, attention 및 transformer 계열 모델, 최근의 Mamba 기반 구조 등 최신 비전 아키텍처를 적극적으로 활용하는 흐름이 두드러진다. 이러한 접근은 복잡한 배경, 가림, 조명 변화, 시점 변화와 같은 현실적 문제를 견디는 강건한 추적 모델 설계에 적합하다. 연구실의 관련 특허인 유실 유기 반려동물 탐지 장치는 이러한 기술이 실제 사회문제 해결로 이어질 수 있음을 보여주며, 단순 학술 연구를 넘어 현장 적용형 인공지능 비전 시스템 개발 역량을 드러낸다. 이 연구는 스마트시티 감시, 공공안전, 무인 시스템, 동물 보호, 행동 분석, 인간-컴퓨터 상호작용 등 폭넓은 분야로 확장될 수 있다. 앞으로는 경량화와 실시간성, 장기 추적 안정성, 멀티모달 센서 융합, 저전력 환경 대응이 핵심 발전 방향이 될 가능성이 크다. 연구실의 최근 발표 주제를 고려하면 효율적 모델 구조와 실제 서비스 환경을 고려한 응용 지향 연구가 계속 강화될 것으로 보인다.

객체추적재식별컴퓨터비전비전트랜스포머실시간분석
2

3차원 영상 이해와 사용자 중심 인터랙션

연구실의 또 다른 핵심 축은 단안 영상 기반 3차원 공간 이해와 사용자 중심 인터랙션 기술이다. 수행 과제에서는 경량 비전 기술을 바탕으로 3차원 공간 재구성, 사용자 행동 분석, 3차원 인터랙션 구현을 목표로 하고 있으며, 이는 단순한 2차원 영상 인식을 넘어 장면의 깊이와 구조를 이해하는 고차원 시각지능 연구로 이어진다. 관련 특허에서도 라이트 필드 이미지 처리, 3차원 영상 저작, 깊이 레이어 생성, 리포커싱 등 3차원 콘텐츠 생성과 편집 기술이 구체적으로 나타난다. 기술적으로는 단안 깊이 추정, 기하학적 딥러닝, 복셀 기반 학습, 3차원 객체 검출, 가상 시점 생성, SLAM 연계 파노픽 분할 등 다양한 3차원 비전 요소기술이 포함된다. 이 연구 방향은 경량성과 실시간성을 특히 강조하는데, 이는 모바일 기기, 임베디드 시스템, 메타버스 환경, 인터랙티브 미디어와 같은 실제 응용에서 매우 중요하다. 단일 카메라만으로도 깊이와 구조를 추정하고 사용자의 행동을 이해하려는 접근은 비용과 장비 제약을 줄이면서도 넓은 활용성을 제공한다. 응용 측면에서는 메타버스, AR/VR, 3차원 콘텐츠 제작, 스마트 인터페이스, 디지털 트윈, 로봇 시각, 무인 이동체 인식 등과의 연계 가능성이 크다. 연구실이 보유한 3차원 영상 저작 및 라이트 필드 관련 특허는 이 분야에서 콘텐츠 생성과 사용자 경험을 동시에 고려하는 특징을 보여준다. 향후에는 더 정밀한 공간 이해, 상호작용 자연성 향상, 생성형 모델과의 결합, 엣지 환경에서의 경량 추론 등이 중요한 발전 방향이 될 것이다.

3차원비전공간재구성단안영상라이트필드인터랙션
3

이미지 생성·변환 및 스케치 기반 시각 검색

이 연구 주제는 사람이 직관적으로 입력한 시각 정보를 이해하고, 이를 바탕으로 검색·변환·생성 작업을 수행하는 인공지능 비전 기술을 다룬다. 대표 논문인 스케치 기반 검색 연구는 사용자의 자유곡선 드로잉을 실시간으로 보조하여 검색 정확도를 높이는 방법을 제안하였으며, 이는 인간의 표현 방식과 기계의 인식 능력을 연결하는 인터랙티브 비전 연구라고 볼 수 있다. 또한 텍스처 보존 스타일 전이 연구는 사진의 구조와 질감을 분리하여 시각적으로 자연스러운 스타일 변환을 구현함으로써 이미지 생성 및 편집 분야의 응용 가능성을 보여준다. 핵심 방법론으로는 스케치 인식, 해시 기반 유사도 검색, 구조-질감 분해, total variation 최소화, 이미지 스무딩 및 디테일 향상, 스타일 표현 학습 등이 활용된다. 이러한 기술은 단순히 이미지 분류를 수행하는 수준을 넘어서, 이미지 내부의 구조적 요소와 표현적 요소를 분리하고 재조합하는 고급 영상처리 및 시각지능 역량을 요구한다. 연구실의 기존 논문들은 전통적 최적화 기법과 딥러닝 기반 표현 학습을 균형 있게 활용하면서, 실제 사용자 경험을 개선하는 방향으로 발전해 왔다. 이 분야의 응용은 디지털 라이브러리 검색, 콘텐츠 추천, 디자인 지원, 드로잉 보조, 미디어 아트, 사진 편집, 창작 도구 개발 등 매우 다양하다. 특히 스케치 기반 검색은 전문 지식이 없는 사용자도 시각적 질의를 통해 정보를 탐색할 수 있도록 도와주며, 스타일 전이와 영상 분해 기술은 창작자 친화적 도구 개발로 이어질 수 있다. 앞으로는 생성형 인공지능, 멀티모달 검색, 사용자 의도 추론과 결합하여 더욱 직관적이고 개인화된 시각 컴퓨팅 환경으로 확장될 가능성이 높다.

스케치검색스타일전이영상처리질감보존이미지변환

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.