울산과학기술원 인공지능대학원 김태환 교수
김태환 연구실은 인공지능과 기계학습을 기반으로 텍스트·이미지·오디오·비디오를 아우르는 멀티모달 생성 AI, 인간의 의도와 감정을 이해하는 교감형 인터랙션 AI, 그리고 시각-언어-행동 통합 기반의 체화형 에이전트와 온디바이스 제조 AI를 연구하며, 이를 통해 인간 친화적이면서도 실제 환경에 적용 가능한 차세대 지능 시스템을 개발하고 있다.
텍스트로부터 비디오 생성을 위한 그리드 확산 모델 장치 및 방법
이미지 및 텍스트 기반으로 오디오를 생성하는 오디오 생성 모델을 트레이닝시키는 방법 및 장치
비디오 생성 모델을 이용하여 스토리 기반으로 비디오를 생성하는 방법 및 장치