IVML

전자공학부
고현석

IVML(지능형 영상미디어 연구실)은 딥러닝 기반의 첨단 영상신호처리와 컴퓨터 비전 기술을 중심으로, 차세대 영상미디어의 혁신을 선도하는 연구를 수행하고 있습니다. 본 연구실은 초고실감 영상미디어 서비스, AI 기반 영상 분석, 그리고 다양한 산업 및 연구 분야에 적용 가능한 지능형 영상신호처리 기술 개발을 목표로 하고 있습니다. 연구실의 주요 연구 분야는 영상 압축(Video Coding), 영상/비디오 처리(Image/Video Processing), 컴퓨터 비전(Computer Vision), 인지 화질 예측(Perceptual Visual Quality Prediction), 영상 복원 및 화질개선(Image/Video Restoration & Enhancement), 그리고 AI 기반 국방 자동화 알고리즘 개발 등입니다. 특히, 딥러닝을 활용한 영상 내 객체 인식, 분할, 추적, 얼굴 이미지 디블러링, 멀티뷰 인스턴스 매칭 등 다양한 컴퓨터 비전 문제를 해결하는 기술을 개발하고 있습니다. 또한, 디지털 홀로그램 및 초고실감 영상미디어의 압축 및 복원 기술에 대한 연구도 활발히 이루어지고 있습니다. 홀로그램 신호의 특수성을 반영한 맞춤형 압축 알고리즘, 딥러닝 기반의 화질 개선 및 복원 네트워크, 그리고 수치 복원 도메인에서의 화질 평가 등은 차세대 XR, 메타버스, 의료 영상 등 다양한 분야에서 실질적인 파급 효과를 기대할 수 있습니다. 국방 및 저탐지 환경에서의 영상 분석 기술도 본 연구실의 중요한 연구 축입니다. 수중 소나 신호 분석, 저탐지 표적 추적, 의미론적 분할, 조건부 확산 모델 기반 데이터 생성 등은 군사적 응용뿐만 아니라, 해양 환경 모니터링, 재난 구조, 보안 등 다양한 분야로 확장될 수 있습니다. 실제 산업체 및 연구기관과의 협력을 통해 기술의 실용화와 고도화에도 힘쓰고 있습니다. IVML은 자체적으로 대규모 영상 데이터셋을 구축하고, 최신 딥러닝 모델을 설계 및 최적화하여 실제 환경에서의 적용 가능성을 높이고 있습니다. 창의적이고 혁신적인 연구를 통해 영상신호처리 및 인공지능 분야의 전문 인력을 양성하고, 산업체, 연구소, 학계 등 다양한 분야로의 진출을 목표로 하고 있습니다. 앞으로도 영상 미디어 기술 발전에 기여하며, 글로벌 리더로 성장해 나가고자 합니다.

Acoustic Signal Detection

Holographic Video Compression

Video Quality Assessment

대표 연구 분야

연구 영역 전체보기

딥러닝 기반 지능형 영상신호처리 및 컴퓨터 비전

지능형 영상미디어 연구실에서는 딥러닝을 활용한 첨단 영상신호처리와 컴퓨터 비전 기술을 중점적으로 연구하고 있습니다. 딥러닝은 대규모 데이터와 복잡한 패턴을 학습하여 기존의 영상처리 기법보다 뛰어난 성능을 보이며, 영상 내 객체 인식, 분할, 추적 등 다양한 컴퓨터 비전 문제를 효과적으로 해결할 수 있습니다. 본 연구실은 이러한 딥러닝 기반 기술을 바탕으로 초고실감 영상미디어 서비스, 실시간 영상 분석, 자동화된 영상 이해 등 다양한 응용 분야에 적용하고 있습니다. 특히, 영상 내의 복잡한 장면에서 객체를 정확하게 인식하고 추적하는 기술, 다양한 환경(조도 변화, 가림, 노이즈 등)에서도 견고하게 동작하는 얼굴 인식 및 디블러링 기술, 그리고 다중 시점 영상에서의 인스턴스 매칭 및 분할 알고리즘 개발에 주력하고 있습니다. 이러한 연구는 방송, 보안, 의료, 국방 등 다양한 산업 분야에서 실질적인 가치를 창출하고 있습니다. 또한, 연구실은 자체적으로 대규모 영상 데이터셋을 구축하고, 최신 딥러닝 모델을 설계 및 최적화하여 실제 환경에서의 적용 가능성을 높이고 있습니다. 이를 통해 영상신호처리 및 컴퓨터 비전 분야에서 세계적인 연구 성과를 창출하고, 산업계와 학계에 혁신적인 솔루션을 제공하고자 합니다.

디지털 홀로그램 및 초고실감 영상미디어 압축·복원 기술

디지털 홀로그램과 초고실감 영상미디어는 3차원 공간에서의 실감나는 시각 경험을 제공하지만, 방대한 데이터 용량으로 인해 효율적인 압축 및 복원 기술이 필수적입니다. 본 연구실은 홀로그램 신호의 특성을 고려한 맞춤형 압축 알고리즘과, 딥러닝 기반의 혁신적인 영상 복원 및 화질 개선 기법을 개발하고 있습니다. 기존의 표준 압축 방식이 자연 영상에 최적화되어 있는 반면, 홀로그램과 같은 특수 신호에는 한계가 있기 때문에, 신호의 주기성, 위상 정보, 수치 복원 도메인 품질 등을 반영한 새로운 접근법이 필요합니다. 연구실에서는 JPEG2000, HEVC, VVC 등 기존 표준 코덱의 한계를 분석하고, 딥러닝을 활용한 엔드투엔드 압축 네트워크를 설계하여 홀로그램 데이터의 효율적인 저장과 전송을 실현하고 있습니다. 또한, 압축된 홀로그램의 수치 복원 영상 품질을 객관적·주관적으로 평가하는 다양한 화질 평가 지표 및 데이터셋을 구축하여, 실제 사용자 경험을 반영한 기술 개발에 힘쓰고 있습니다. 이러한 연구는 차세대 디스플레이, XR(확장현실), 메타버스, 의료 영상 등 다양한 분야에서 실질적인 파급 효과를 기대할 수 있습니다. 본 연구실은 국제 표준화 활동에도 적극적으로 참여하며, 디지털 홀로그램 및 초고실감 미디어 기술의 글로벌 리더로 자리매김하고 있습니다.

AI 기반 국방 자동화 및 저탐지 환경 영상 분석

본 연구실은 AI와 딥러닝 기술을 활용하여 국방 분야의 자동화 및 저탐지 환경에서의 영상 분석 기술을 선도적으로 개발하고 있습니다. 특히, 수중 환경에서의 소나 신호 분석, 저탐지 표적 추적, 의미론적 분할 등은 군사적 중요성이 매우 높은 연구 주제입니다. 수동형 소나로부터 획득한 BTR(Bearing-Time Records), DEMON 그램 등 다양한 음향 및 영상 데이터를 딥러닝 기반 네트워크로 분석하여, 적 표적의 위치와 특성을 정확하게 파악할 수 있도록 지원합니다. 저신호대잡음비(SNR) 환경이나 다양한 노이즈 조건에서도 견고하게 동작하는 분할 네트워크, 조건부 확산 모델을 활용한 데이터 생성, 그리고 실제 군사 환경을 모사한 대규모 시뮬레이션 데이터셋 구축 등 다양한 연구가 이루어지고 있습니다. 또한, 인공지능 기반의 자동화 알고리즘을 통해 실시간 표적 탐지 및 추적, 방위각 및 주파수 정보 획득, 의미론적 분할 등 국방 자동화 시스템의 핵심 기술을 개발하고 있습니다. 이러한 연구는 국방뿐만 아니라 해양 환경 모니터링, 재난 구조, 보안 등 다양한 응용 분야로 확장될 수 있으며, 실제 산업체 및 연구기관과의 협력을 통해 기술의 실용화와 고도화를 추진하고 있습니다.

주요 논문

발행물 전체보기

Progressive Multi-View Instance Matching: Occlusion-Robust Approach with Initial Segmentation Enhancement

S. Bae, S. Jang, J. Lee, H. Ko

IEEE Sensors Journal, 2024

Facial image deblurring network for robust illuminance adaptation and key structure restoration

Y. Kim, H. Kwon, H. Ko

Engineering Applications of Artificial Intelligence, 2024

A Performance Analysis of Versatile Video Coding for Encoding Phase-only Hologram Videos

Y. Kim, W. Shin, J. Lee, K. Oh, H. Ko

Optics Express, 2023

완료된 프로젝트

프로젝트 전체보기

한국전기연구원 주관 비가시 대기 환경에서의 시야 확보를 위한 공간 데이터 스캐닝 및 분석 시스템 연구 과제

한국전기연구원

2025년 07월 ~

ETRI 주관 기계를 위한 범용 피쳐 부호화 프레임워크 연구 과제

ETRI

2024년 06월 ~

LIG Nex1 주관 AI 기반 수동소나 음향탐지정보 데이터셋 생성 기술 연구 과제

LIG Nex1

2024년 05월 ~