김인철 연구실
컴퓨터공학전공 김인철
김인철 연구실은 인공지능(AI)과 컴퓨터 비전, 로봇 지능, 멀티모달 데이터 처리 등 첨단 정보기술 분야에서 국내외적으로 선도적인 연구를 수행하고 있습니다. 연구실의 주요 연구 방향은 3차원 시각 이해, 장면 그래프 생성, 멀티모달 인공지능, 로봇 자율 행동 계획 등으로, 다양한 산업 및 사회적 요구에 부응하는 실용적이고 혁신적인 기술 개발에 집중하고 있습니다.
특히, 3차원 포인트 클라우드와 멀티-뷰 영상 데이터를 활용한 실내 환경의 의미적 분할, 객체 인식, 관계 추론, 장면 그래프 생성 등은 연구실의 대표적인 연구 분야입니다. 이러한 기술은 자율주행, 스마트 홈, 증강현실, 로봇 내비게이션 등 다양한 응용 분야에서 핵심적인 역할을 하고 있습니다. 연구실은 최신 딥러닝, 그래프 신경망, 트랜스포머 등 첨단 AI 기법을 적극적으로 도입하여, 복잡한 시각 정보를 효과적으로 처리하고 해석하는 방법을 개발하고 있습니다.
또한, 영상과 언어 정보를 통합적으로 이해하는 멀티모달 AI 기술 개발에도 많은 노력을 기울이고 있습니다. 영상 기반 상식 추론, 영상-언어 공동 임베딩, 비디오 캡션 생성, 참조 표현 분리 인코딩 등 다양한 멀티모달 과제를 수행하며, 인간과 유사한 수준의 지능적 행동을 구현하는 것을 목표로 하고 있습니다. 이러한 연구는 영상 검색, 대화형 AI, 스마트 서비스 등 다양한 산업 분야에 적용될 수 있습니다.
로봇 지능 및 자율 행동 계획 분야에서도 연구실은 강화학습, 모방학습, 뉴로-논리 강화학습 등 최신 AI 학습 기법을 활용하여, 로봇이 복잡한 환경에서 자율적으로 작업을 수행할 수 있도록 지원하고 있습니다. 클라우드 기반 로봇 작업 계획, 서비스 로봇의 물체 다루기, 다중 로봇 협력 등 실제 산업 현장과 연계된 연구를 활발히 진행하고 있습니다.
연구실은 다수의 특허, 국내외 논문, 산학협력 프로젝트, 수상 경력 등을 통해 기술적 우수성과 실용성을 인정받고 있습니다. 앞으로도 김인철 연구실은 인공지능과 로봇, 멀티모달 데이터 융합 분야의 혁신을 선도하며, 미래 사회의 다양한 문제 해결에 기여할 수 있는 연구를 지속적으로 추진할 계획입니다.
Instance Segmentation
3D Scene Graph Generation
Multimodal Feature Fusion
인공지능 기반 3차원 시각 이해 및 장면 그래프 생성
본 연구실은 인공지능 기술을 활용한 3차원 시각 이해와 장면 그래프 생성 분야에서 선도적인 연구를 수행하고 있습니다. 최근 실내 환경의 포인트 클라우드 데이터를 기반으로 한 3차원 장면 그래프 생성 시스템, 그리고 멀티-뷰 영상 및 RGB-D 데이터를 활용한 의미적 3차원 분할, 객체 인식, 관계 추론 등 다양한 주제를 다루고 있습니다. 이러한 연구는 실내 공간에서의 로봇 내비게이션, 자동 인테리어 설계, 스마트 환경 구축 등 다양한 응용 분야에 적용될 수 있습니다.
연구실에서는 3차원 객체의 위치, 형태, 관계를 효과적으로 파악하기 위해 심층 신경망, 그래프 신경망, 트랜스포머 기반의 모델 등 최신 AI 기법을 적극적으로 도입하고 있습니다. 예를 들어, 3차원 포인트 클라우드의 기하학적 특징을 반영한 초기 그래프 생성, 공간적 맥락 정보를 활용한 그래프 갱신, 그리고 시각-언어 정보의 융합을 통한 장면 이해의 정밀도 향상에 주력하고 있습니다. 또한, 대규모 언어 모델(LLM)과의 결합을 통해 3차원 장면 그래프 생성의 자동화와 지능화를 실현하고 있습니다.
이러한 연구는 실내 환경에서의 로봇 서비스, 자율주행, 증강현실 등 다양한 첨단 산업 분야에 직접적으로 기여할 수 있습니다. 더불어, 특허와 논문을 통해 기술적 우수성을 입증하고 있으며, 실제 산업 현장과의 협력을 통해 실용화 가능성도 높이고 있습니다.
멀티모달 인공지능 및 시각-언어 융합 기술
김인철 연구실은 멀티모달 인공지능, 즉 시각 정보와 언어 정보를 통합적으로 이해하고 처리하는 기술 개발에 집중하고 있습니다. 최근 연구에서는 영상 기반 상식 추론, 영상-언어 공동 임베딩, 비디오 캡션 생성, 참조 표현 분리 인코딩 등 다양한 멀티모달 AI 과제를 수행하고 있습니다. 이러한 기술은 인공지능이 사람처럼 영상을 보고, 언어로 설명하거나 질문에 답변하는 등 인간과 유사한 지능적 행동을 가능하게 합니다.
연구실은 대규모 영상 데이터와 자연어 데이터를 결합하여, 심층 신경망 및 그래프 신경망을 활용한 멀티모달 임베딩, 상식 추론, 질문 응답 시스템, 영상 기반 대화 시스템 등을 개발하고 있습니다. 예를 들어, 지식 그래프를 활용한 영상 기반 상식 추론, 영상-언어 공동 임베딩을 통한 참조 표현 이해, 그리고 비디오 캡션 생성 모델 등은 국내외 학술지와 특허를 통해 그 우수성이 입증되었습니다. 또한, 영상 내 객체의 속성, 관계, 맥락 정보를 통합적으로 분석하여, 보다 정확하고 풍부한 의미 해석을 실현하고 있습니다.
이러한 멀티모달 AI 기술은 자율주행, 스마트 홈, 로봇 서비스, 인공지능 비서, 영상 검색 및 추천 등 다양한 산업 분야에서 핵심적인 역할을 하고 있습니다. 연구실은 실제 산업적 응용을 염두에 두고, 실용적이고 확장성 있는 AI 시스템 개발에 힘쓰고 있습니다.
로봇 지능 및 강화학습 기반 자율 행동 계획
본 연구실은 로봇의 자율적 행동 계획과 학습, 특히 강화학습 및 모방학습 기반의 로봇 지능 개발에 주력하고 있습니다. 클라우드에 연결된 개별 로봇 및 로봇그룹의 작업 계획 기술, 서비스 로봇의 물체 다루기, 로봇 손 조작 지능, 그리고 실내 환경에서의 자율 이동 및 내비게이션 등 다양한 로봇 응용 분야를 연구하고 있습니다. 이러한 연구는 실제 산업 현장에서의 로봇 자동화, 스마트 팩토리, 물류 및 서비스 로봇 등에 직접적으로 활용될 수 있습니다.
연구실은 트랜스포머 기반의 온-오프라인 복합 강화학습, 의미적 제약을 적용한 뉴로-논리 강화학습, 모방학습과 강화학습의 결합 등 최신 AI 학습 기법을 도입하여, 로봇이 복잡한 환경에서 효율적으로 작업을 수행할 수 있도록 지원합니다. 또한, 로봇의 행동 정책 최적화, 다중 에이전트 협력, 실시간 상황 인식 및 추론 등 다양한 요소 기술을 통합적으로 개발하고 있습니다. 실제로, 로봇 물체 조작, 목표 기반 시각적 이동, 다중 로봇 제조 물류 작업 등에서 우수한 성과를 거두고 있습니다.
이러한 연구는 특허, 논문, 산학협력 프로젝트 등을 통해 기술적 우수성과 실용성을 동시에 확보하고 있습니다. 앞으로도 연구실은 로봇 지능의 고도화와 실용화를 위해 지속적으로 연구를 확장해 나갈 계획입니다.
1
Constraint Satisfaction for Motion Feasibility Checking
Lee Seokjun, Kim Incheol
MATHEMATICAL PROBLEMS IN ENGINEERING, 202105
2
Tracklet Pair Proposal and Context Reasoning for Video Scene Graph Generation
Jung Gayoung, Lee Jonghun, Kim Incheol
SENSORS, 202105
3
Vision-Language-Knowledge Co-Embedding for Visual Commonsense Reasoning
Lee JaeYun, Kim Incheol
SENSORS, 202105
2
클라우드에 연결된 개별 로봇 및 로봇그룹의 작업 계획 기술 개발(4차년도)
3
클라우드에 연결된 개별 로봇 및 로봇그룹의 작업 계획 기술 개발(3차년도)