AI-driven Multimodal Haptic Authoring and Accessibility Translation
연구 내용
대규모 언어 모델과 멀티모달 입력을 활용해 햅틱 렌더링 파라미터를 자동 추론하고, 시각 정보를 촉각·청각으로 변환하는 접근성 콘텐츠 제작 연구
멀티센서 햅틱 경험을 몰입형 미디어에 포함하기 위해 입력 데이터로부터 촉각 표현을 자동 생성하고 저작 부담을 낮추는 접근을 수행합니다. 멀티모달 입력과 의미 서술을 기반으로 햅틱 렌더링 파라미터와 물리 성질을 추론하고, 새로 고칠 수 있는 핀 어레이 등 표현 장치에 맞춘 촉각 아이콘을 생성합니다. 또한 비디오 및 그래픽의 맥락 정보를 컴퓨터 비전으로 추출해 텍스트 음성 변환 및 촉각화로 연결함으로써, 시각 중심 콘텐츠를 청각·촉각 중심으로 재구성하는 차별성을 보유합니다.
관련 연구 성과
관련 논문
4편
관련 특허
0건
관련 프로젝트
4건
연구 흐름
초기에는 핀 어레이 기반 새로 고침형 디스플레이에서 그래픽과 영상의 맥락을 추출하고, 이를 청각 설명 및 촉각 장면으로 변환하는 파이프라인을 구축했습니다. 이후에는 몰입형 영상에서 멀티모달 4D 효과를 자동 생성하는 방식으로 확장하여, 공간화·인터랙션 요소를 함께 구성하는 방향으로 연구를 심화했습니다. 최근에는 저작자가 수동으로 지정하던 촉각 표현 파라미터를 줄이기 위해 LLM을 활용한 AI 보조 저작 도구를 도입하고, 사용자 평가를 통해 효율과 산출물 품질을 검증하는 흐름으로 진행되고 있습니다.
활용 가능성
활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.
관련 논문
구분
제목
HAPhy: AI-Assisted Content Creator Supporting Tools for Multi-sensory Haptic Experiences in Immersive Media
Automatic Accessible Multimodal Translation of Graphics Using A Refreshable Pin Array
Automatic Video-to-Audiotactile Conversion of Golf Broadcasting on A Refreshable Pin Array
Automatic Generation of Multimodal 4D Effects for Immersive Video Watching Experiences
관련 프로젝트
구분
제목
시각장애인의 인지 특성을 반영하는 멀티모달기기와 이를 활용한 AI 기반 글로벌 교육 플랫폼의 개발 및 실증
실감형 문화콘텐츠 체험을 위한 사용자 맥락 기반 시촉각 인터랙션 저작 기술개발
실감형 문화콘텐츠 체험을 위한 사용자 맥락 기반 시촉각 인터랙션 저작 기술개발
실감형 문화콘텐츠 체험을 위한 사용자 맥락 기반 시촉각 인터랙션 저작 기술개발