비디오/3D 시각정보 이해와 Text-to-Video 기반 학습 콘텐츠 모형 연구

Visual Understanding of Video/3D Data and Text-to-Video Based Learning Content Modeling

연구 내용

수중 비디오의 요약·객체 검출과 sparse-view 3D 재구성의 기하 왜곡 제어를 수행하고, Text-to-Video로 교육용 디지털 스토리텔링 모형을 개발하는 연구

김용성 연구실은 시각 데이터의 효율적 해석과 생성 활용을 동시에 다룹니다. 수중 비디오에서는 키프레임을 효율적으로 추출한 뒤 YOLOv3 기반 객체 검출을 수행하고, 저대비·블러 특성을 반영한 영상 향상으로 인식 안정성을 확보합니다. 또한 sparse-view 3D Gaussian Splatting에서 과도한 positional degrees of freedom이 기하 왜곡을 유발한다는 가설을 바탕으로, reprojection-based DoF separation과 제약 설계를 통해 구조적 타당성을 높입니다. 더 나아가 Text-to-Video 기반으로 Merrill의 Component Display Theory를 적용한 디지털 스토리텔링 교수·학습 모형을 개발하고 타당화 절차를 수행합니다.

관련 프로젝트

0건

연구 흐름

연도 흐름상 2022년에는 수중 비디오의 요약과 객체 검출을 결합한 인식 프레임워크를 구축하여 저대비 환경에서의 처리 전략을 정리했습니다. 2024년에는 sparse-view 재구성에서 기하 아티팩트를 줄이기 위한 DoF 제어 관점을 도입해 3D 재구성 품질을 개선했습니다. 2025년에는 Text-to-Video AI를 활용하여 수업 설계 요소를 Merrill 이론의 자료 제시 유형과 연결하는 교육 모형을 개발하고 내부·외부 타당화를 통해 모형 적합성을 확인했습니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

수중 비디오 요약 자동화
해양 감시 객체 검출
저대비 영상 처리 전처리
키프레임 기반 분석
희소 뷰 3D 재구성 고품질화
기하 왜곡 억제 재구성 알고리즘
VR/AR용 장면 복원
교육용 디지털 스토리텔링 제작
Text-to-Video 기반 교수·학습 자료 생성
시각 정보 기반 학습활동 설계 도구