CLVR
김재철AI대학원 임조셉
CLVR 연구실은 KAIST에서 인공지능, 로봇공학, 컴퓨터 비전 분야를 선도하는 연구실로, Joseph J. Lim 교수의 지도 아래 지능형 시스템 개발을 목표로 하고 있습니다. 연구실의 핵심 목표는 로봇이 실제 세계에서 인지, 행동, 추론을 바탕으로 연속적인 의사결정을 내릴 수 있도록 하는 것입니다. 이를 위해 강화학습, 로봇 학습, 표현 학습, 시각 인지, 심볼릭 조작 등 다양한 연구 주제를 포괄적으로 다루고 있습니다.
연구실은 로봇이 복잡한 환경에서 장기적이고 복합적인 작업을 수행할 수 있도록, 강화학습 기반의 정책 학습과 행동 일반화, 그리고 대규모 데이터셋을 활용한 오프라인 학습 등 첨단 기술을 개발하고 있습니다. 최근에는 다양한 로봇 조작 데이터셋 구축, 정책 사전학습, 다중 작업 정책 공유 등에서 세계적인 성과를 내고 있으며, ICRA, RSS, CoRL 등 주요 국제 학회에서 논문 발표 및 수상 실적도 다수 보유하고 있습니다.
또한, CLVR 연구실은 인간의 인지 능력을 모방한 인지 모델과 심볼릭 조작 연구를 통해, 로봇이 논리적 추론과 계획, 고수준의 심볼 조작 능력을 갖추도록 하는 데 집중하고 있습니다. 신경망 기반의 프로그램 합성, 도메인/행동 일반화, 물리적 세계에 대한 이해 등 다양한 접근법을 통해, 로봇의 인지적 유연성과 적응력을 높이고 있습니다.
컴퓨터 비전과 표현 학습 분야에서도 CLVR 연구실은 영상 기반 학습, 시각적 보상 학습, 객체 및 관계 추론 등 다양한 연구를 진행하고 있습니다. 이를 통해 로봇이 실제 환경에서 얻는 시각 정보를 효과적으로 활용하여, 상황 인식과 행동 선택의 정확도를 높이고 있습니다. 이러한 연구는 로봇의 자율성 향상뿐만 아니라, 인간-로봇 상호작용, 멀티모달 학습 등 다양한 인공지능 분야와도 긴밀하게 연결되어 있습니다.
CLVR 연구실의 연구는 미래의 지능형 로봇 시스템 개발과 더불어, 인공지능의 근본적인 이해를 심화시키는 데 기여하고 있습니다. 다양한 분야의 융합 연구와 국제적 협력을 통해, 실제 사회와 산업 현장에서 활용 가능한 혁신적인 기술을 지속적으로 개발하고 있습니다.
Robot Manipulation
Reinforcement Learning
Imitation Learning
로봇 학습과 강화학습
CLVR 연구실은 로봇이 실제 환경에서 복잡한 작업을 수행할 수 있도록 하는 로봇 학습과 강화학습 분야에서 선도적인 연구를 수행하고 있습니다. 연구실은 로봇이 다양한 환경과 상황에서 스스로 학습하고 적응할 수 있도록, 강화학습 기반의 정책 학습, 행동 일반화, 그리고 장기적 조작(manipulation) 기술 개발에 집중하고 있습니다. 이를 통해 로봇이 단순한 반복 작업을 넘어서, 미지의 환경에서도 유연하게 문제를 해결할 수 있는 능력을 갖추도록 합니다.
특히, CLVR 연구실은 다양한 데이터셋과 시뮬레이션 환경을 활용하여 로봇의 행동을 모방하거나, 기존의 데이터를 활용해 새로운 기술을 전이 학습하는 방법론을 개발하고 있습니다. 최근에는 대규모 로봇 조작 데이터셋(DROID, Open X-Embodiment 등) 구축과 이를 활용한 정책 사전학습(pre-training), 다중 작업(multi-task) 정책 공유, 그리고 오프라인 데이터 기반의 효율적인 정책 학습 등에서 탁월한 성과를 내고 있습니다. 이러한 연구는 실제 로봇이 복잡한 조립, 조작, 이동 등 다양한 작업을 수행하는 데 필수적인 기반 기술로 자리잡고 있습니다.
CLVR 연구실의 로봇 학습 및 강화학습 연구는 국제적으로도 높은 평가를 받고 있으며, ICRA, RSS, CoRL, NeurIPS 등 세계적인 학회에서 다수의 논문이 발표되고 수상 실적도 보유하고 있습니다. 이러한 연구는 미래의 지능형 로봇 시스템 개발과 산업 현장, 가정, 의료 등 다양한 분야에서의 실질적 응용 가능성을 높이고 있습니다.
인지 모델과 심볼릭 조작
CLVR 연구실은 인간의 인지 능력을 모방한 인지 모델과 심볼릭 조작(symbolic manipulation) 분야에서도 활발한 연구를 진행하고 있습니다. 인지 모델 연구는 로봇이 환경을 이해하고, 다양한 도메인과 작업에 대해 일반화할 수 있도록 하는 데 중점을 둡니다. 이를 위해 도메인/행동 일반화(domain/action generalization), 물리적 세계에 대한 논리적 추론(logical reasoning), 그리고 세계 모델(world model) 기반의 표현 학습(representation learning) 등 다양한 접근법을 개발하고 있습니다.
심볼릭 조작 분야에서는 신경망 기반의 프로그램 합성(neural program synthesis)과 같은 기술을 통해, 로봇이 복잡한 작업을 고수준의 심볼로 표현하고 조작할 수 있도록 연구합니다. 예를 들어, 로봇이 시각적 정보를 바탕으로 작업의 단계를 추론하거나, 다양한 조작 기술을 조합하여 새로운 작업을 수행할 수 있도록 하는 연구가 대표적입니다. 이러한 연구는 로봇이 단순한 센서-모터 반응을 넘어서, 논리적 사고와 계획 능력을 갖추는 데 중요한 역할을 합니다.
CLVR 연구실의 인지 모델 및 심볼릭 조작 연구는 강화학습, 컴퓨터 비전, 자연어 처리 등 다양한 인공지능 분야와 융합되어, 더욱 복잡하고 지능적인 로봇 시스템 개발로 이어지고 있습니다. 이와 같은 연구는 로봇이 인간과 유사한 수준의 인지적 유연성과 적응력을 갖추는 데 기여하며, 미래의 자율적 인공지능 시스템의 핵심 기반이 되고 있습니다.
비전 기반 인지와 표현 학습
CLVR 연구실은 컴퓨터 비전과 표현 학습(representation learning)을 결합하여, 로봇이 시각적 정보를 효과적으로 이해하고 활용할 수 있도록 하는 연구를 수행하고 있습니다. 연구실은 영상 기반 학습(learning from videos), 시각적 보상 학습(visual reward learning), 그리고 객체의 속성 및 관계 추론 등 다양한 주제를 다루고 있습니다. 이를 통해 로봇이 실제 환경에서 얻는 다양한 시각 정보를 바탕으로, 상황을 인식하고 적절한 행동을 선택할 수 있도록 합니다.
특히, CLVR 연구실은 대규모 영상 데이터와 시뮬레이션 환경을 활용하여, 로봇이 다양한 시각적 상황에 대해 일반화할 수 있는 표현을 학습하는 방법을 개발하고 있습니다. 예를 들어, 데모2벡(Demo2Vec), 키프레임 예측(Keyframe Discovery), 물리적 속성 추론(Physics Understanding) 등 다양한 연구가 진행되고 있습니다. 이러한 연구는 로봇이 미지의 환경에서도 새로운 객체나 상황을 빠르게 인식하고 적응할 수 있도록 하는 데 중요한 역할을 합니다.
비전 기반 인지와 표현 학습 연구는 로봇의 자율성 향상뿐만 아니라, 인간-로봇 상호작용, 자연어 이해, 멀티모달 학습 등 다양한 인공지능 분야와도 긴밀하게 연결되어 있습니다. CLVR 연구실의 연구 성과는 실제 로봇 시스템의 지능적 행동 구현과 더불어, 인공지능의 근본적인 이해를 심화시키는 데 기여하고 있습니다.
1
Subtask-Aware Visual Reward Learning from Segmented Demonstrations
Changyeon Kim, Minho Heo, Doohyun Lee, Honglak Lee, Jinwoo Shin, Joseph J. Lim*, Kimin Lee*
, 2025
2
QMP: Q-switch Mixture of Policies for Multi-Task Behavior Sharing
Grace Zhang*, Ayush Jain*, Injune Hwang, Shao-Hua Sun, Joseph J. Lim
, 2025
3
EXTRACT: Efficient Policy Learning by Extracting Transferrable Robot Skills from Offline Data
Jesse Zhang, Minho Heo, Zuxin Liu, Erdem Biyik, Joseph J. Lim, Yao Liu, Rasool Fakoor
, 2024