RnDCircle Logo
arrow left icon

SNU Machine Perception and Reasoning Lab.

서울대학교 전기·정보공학부

최종현 교수

SNU Machine Perception and Reasoning Lab.

전기·정보공학부 최종현

SNU Machine Perception and Reasoning Lab은 효율적이면서도 정확한 멀티모달 인지 모델, 알고리즘 및 시스템 개발을 핵심 연구 목표로 삼고 있습니다. 본 연구실은 시각, 언어, 청각 등 다양한 형태의 데이터를 통합적으로 이해하고 해석하는 멀티모달 인지 기술을 통해 인간 수준의 인공지능 구현을 지향합니다. 이를 위해 라벨링 비용 절감, 계산 복잡도 최소화, 경량화된 신경망 구조 설계 등 다양한 혁신적 방법론을 연구하고 있습니다. 특히, 지속적 학습(Continual Learning) 분야에서 두각을 나타내고 있으며, 온라인 환경에서의 연속적 학습, 계층적 라벨 확장, 메모리 관리, 로짓 밸런싱 등 다양한 기법을 개발하여 인공지능 모델이 실제 환경 변화에 유연하게 적응할 수 있도록 지원합니다. 또한, 임베디드 AI 에이전트 연구를 통해 자연어 명령을 이해하고 실제 환경에서 다양한 태스크를 수행할 수 있는 인공지능 시스템을 구현하고 있습니다. 시각정보처리 및 컴퓨터 비전 분야에서도 얼굴 인식, 객체 검출, 동작 인식, 영상 복원, 이벤트 카메라 기반 영상 처리 등 다양한 연구를 수행하고 있습니다. 최신 딥러닝 기법과 새로운 센서 데이터를 활용하여, 기존의 한계를 극복하고 실용적인 문제 해결에 집중하고 있습니다. 이러한 연구 성과는 국제 주요 학회 및 저널에 다수 게재되고 있으며, 다양한 특허와 산학협력을 통해 산업 현장에 적용되고 있습니다. 본 연구실은 다양한 정부 및 산업체 프로젝트를 수행하며, 실제 응용 분야에서 요구되는 실시간 처리, 저전력, 저비용 시스템 구현을 목표로 하고 있습니다. 자율주행, 로봇, 스마트 디바이스, 의료 영상 분석 등 다양한 분야에서 연구 성과가 활용되고 있으며, 앞으로도 기술의 실용화와 확장성을 지속적으로 검증해 나갈 예정입니다. SNU Machine Perception and Reasoning Lab은 앞으로도 멀티모달 인지, 지속적 학습, 임베디드 AI 에이전트, 시각정보처리 등 인공지능 분야의 핵심 기술 개발에 앞장서며, 세계적인 연구 경쟁력을 유지하고 혁신적인 인공지능 시스템 구현에 매진할 것입니다.

효율적이고 정확한 멀티모달 인지 모델 및 시스템 개발
본 연구실은 효율적이면서도 정확한 멀티모달 인지 모델, 알고리즘 및 시스템 개발에 중점을 두고 있습니다. 멀티모달 인지는 시각, 언어, 청각 등 다양한 형태의 데이터를 통합적으로 이해하고 해석하는 기술로, 인공지능 분야에서 인간 수준의 인지 능력을 구현하는 데 필수적입니다. 본 연구실에서는 라벨링 비용과 학습 및 추론 과정에서의 계산 복잡도를 최소화하면서도 높은 성능을 달성할 수 있는 모델 구조와 학습 방법론을 연구하고 있습니다. 특히, 대규모 멀티모달 데이터셋을 효과적으로 활용하기 위한 효율적인 데이터 라벨링 기법, 경량화된 신경망 구조, 그리고 분산 및 병렬처리 기반의 학습 시스템을 개발하고 있습니다. 이를 통해 실제 환경에서 요구되는 실시간 처리 및 저전력, 저비용 시스템 구현이 가능하도록 다양한 최적화 기법을 적용하고 있습니다. 또한, 멀티모달 인지 모델의 성능을 극대화하기 위해 다양한 도메인에서의 전이학습, 자기지도학습, 그리고 대조학습 기법을 적극적으로 도입하고 있습니다. 이러한 연구는 자율주행, 로봇, 스마트 디바이스, 의료 영상 분석 등 다양한 응용 분야에서 활용될 수 있으며, 실제 산업 현장과의 협업을 통해 기술의 실용화와 확장성을 검증하고 있습니다. 앞으로도 본 연구실은 멀티모달 인지 모델의 효율성과 정확성을 동시에 달성하기 위한 혁신적인 연구를 지속적으로 추진할 계획입니다.
지속적 학습(Continual Learning) 및 임베디드 AI 에이전트
지속적 학습(Continual Learning)은 인공지능이 새로운 정보를 연속적으로 학습하면서도 기존에 습득한 지식을 잃지 않는 능력을 의미합니다. 본 연구실은 온라인 환경에서의 지속적 학습, 계층적 라벨 확장, 메모리 관리, 로짓 밸런싱 등 다양한 지속적 학습 기법을 개발하고 있습니다. 이를 통해 인공지능 모델이 실제 환경에서 변화하는 데이터와 작업에 유연하게 적응할 수 있도록 지원합니다. 특히, 임베디드 AI 에이전트 분야에서는 자연어 명령을 이해하고 실제 환경에서 다양한 태스크를 수행할 수 있는 인공지능 에이전트의 개발에 주력하고 있습니다. 본 연구실은 멀티모달 정보(영상, 음성, 텍스트 등)를 통합적으로 처리하여, 인간과 유사한 수준의 인지 및 추론 능력을 갖춘 에이전트를 구현하고자 합니다. 이를 위해 온라인 지속적 학습, 환경 인지 메모리, 컨텍스트 인지 플래닝 등 다양한 핵심 기술을 연구하고 있습니다. 이러한 연구는 스마트 홈, 로봇, 자율주행, 산업 자동화 등 다양한 분야에서 실제로 적용될 수 있으며, 실제 환경에서의 테스트와 챌린지 참여를 통해 기술의 우수성을 입증하고 있습니다. 앞으로도 본 연구실은 지속적 학습과 임베디드 AI 에이전트의 융합을 통해, 인간 수준의 적응성과 지능을 갖춘 차세대 인공지능 시스템 개발에 앞장설 것입니다.
시각정보처리 및 컴퓨터 비전 기반 인공지능
시각정보처리와 컴퓨터 비전은 인공지능의 핵심 분야로, 이미지와 비디오 데이터를 분석하여 의미 있는 정보를 추출하는 기술입니다. 본 연구실은 얼굴 인식, 객체 검출, 동작 인식, 영상 복원, 이벤트 카메라 기반 영상 처리 등 다양한 시각정보처리 기술을 연구하고 있습니다. 특히, 다양한 환경 변화(조명, 자세, 해상도 등)에 강인한 인식 모델 개발에 많은 노력을 기울이고 있습니다. 최근에는 바이너리 네트워크, 신경망 아키텍처 탐색, 대규모 데이터셋 기반의 전이학습, 자기지도학습 등 최신 딥러닝 기법을 적극적으로 도입하여, 기존의 한계를 극복하고 있습니다. 또한, 이벤트 카메라와 같은 새로운 센서 데이터를 활용한 고해상도 이미지 복원, 저전력 환경에서의 실시간 인식 등 실용적인 문제 해결에도 집중하고 있습니다. 이러한 연구 성과는 국제 주요 학회 및 저널에 다수 게재되고 있으며, 다양한 특허와 기술이전, 산학협력을 통해 실제 산업 현장에 적용되고 있습니다. 앞으로도 본 연구실은 시각정보처리와 컴퓨터 비전 분야에서 세계적인 연구 경쟁력을 유지하며, 혁신적인 인공지능 기술 개발에 매진할 것입니다.
1
Large Language Models Still Exhibit Bias in Long Text
Wonje Jeung, Dongjae Jeon, Ashkan Yousefpour, Jonghyun Choi
Arxiv, 2024
2
i-SRT: Aligning Large Multimodal Models for Videos by Iterative Self-Retrospective Judgment
Daechul Ahn, Yura Choi, San Kim, Youngjae Yu, Dongyeop Kang, Jonghyun Choi
Arxiv, 2024
3
An Information Theoretic Metric for Evaluating Unlearning Models
Dongjae Jeon, Wonje Jeung, Taeheon Kim, Albert No, Jonghyun Choi
Arxiv, 2024
1
미래국방인공지능 특화연구센터(2단계)
국방과학연구소
2024년 05월 ~ 2025년 04월
2
(1세부) 인공지능 에이전트 협업기반 신경망 변이 및 지능 강화 기술 개발
과학기술정보통신부
2024년 03월 ~ 2024년 12월
3
인간 수준의 인공지능을 위한 증가적 멀티 모달 인지 에이전트 연구
과학기술정보통신부
2024년 03월 ~ 2025년 02월