세종대학교 인공지능데이터사이언스학과 조재원 교수
Multimodal AI Lab은 세종대학교 인공지능데이터사이언스학과에 소속된 연구실로, 컴퓨터 비전, 자연어 처리, 오디오 등 다양한 모달리티의 융합을 통한 차세대 인공지능 기술 개발에 주력하고 있습니다. 본 연구실은 딥러닝과 머신러닝을 기반으로, 멀티모달 데이터의 통합적 이해와 생성, 그리고 실제 응용에 적용 가능한 혁신적인 모델을 연구하고 있습니다. 주요 연구 분야로는 Vision & Language, 대규모 비전-언어 모델(LVLM), 대규모 언어 모델(LLM), 언어-이미지 생성, 비디오 이해, 수어 인식 등이 있습니다. 이러한 분야에서 연구실은 이미지와 텍스트, 비디오와 언어 등 서로 다른 데이터 간의 의미적 연결을 찾고, 이를 바탕으로 복합적인 인공지능 태스크를 해결하는 데 집중하고 있습니다. 또한, 실제 환경에서 발생할 수 있는 데이터 이슈, 편향 문제, 분포 외 데이터 탐지, 능동 학습 등 인공지능의 신뢰성과 공정성을 높이기 위한 연구도 활발히 진행 중입니다. 연구실의 대표 논문들은 Visual Question Answering, 멀티모달 학습, 비디오 기반 질의응답, 수어 인식 등 다양한 분야에서 우수한 성과를 거두고 있으며, 국내외 주요 학회 및 저널에 다수의 논문을 게재하고 있습니다. 특히, 대규모 멀티모달 모델의 효율적 학습, 데이터 편향 완화, 실제 환경에서의 강인성 확보 등 첨단 이슈에 대한 연구가 두드러집니다. 이외에도, 연구실은 사회적 약자를 위한 포용적 인공지능 기술 개발, 데이터의 다양성과 품질 향상, 실제 서비스 적용을 위한 실용적 연구 등 다양한 사회적·기술적 도전 과제에 적극적으로 대응하고 있습니다. 멀티모달 인공지능의 미래를 선도하기 위해, 지속적인 연구와 혁신을 이어가고 있습니다. 앞으로 Multimodal AI Lab은 더욱 복잡하고 다양한 멀티모달 환경에서의 인공지능 모델 개발, 데이터 이슈 해결, 공정하고 신뢰할 수 있는 AI 시스템 구현 등 다양한 연구 목표를 달성하기 위해 노력할 것입니다. 이를 통해 인공지능 기술의 사회적 가치와 실용성을 높이고, 글로벌 연구 경쟁력을 강화하는 데 기여할 것입니다.
대표 연구 분야 확인하기