김태완 교수 연구실 | 동덕여자대학교 데이터사이언스전공

김태완 연구실

동덕여자대학교 데이터사이언스전공 김태완 교수

연속학습

평생학습

영상 감시

|김태완 교수 연구실

홈

연구 영역

기본 정보

논문·특허

구성원

홈

김태완 연구실

동덕여자대학교 데이터사이언스전공 김태완 교수

김태완 연구실은 데이터사이언스전공 기반의 영상 및 음성 인공지능을 중심으로 연구합니다. 실시간 감시에서 환경 변화에 대응하기 위해 연속학습·평생학습 아키텍처를 설계하고, 엣지-서버 구조에서 모델 업데이트를 수행하는 방법을 개발합니다. 또한 CCTV 및 병원 감시 환경의 품질 저하를 반영하는 IQA 데이터셋과 Transformer 기반 비디오 인페인팅을 통해 복원-평가 연계를 구축합니다. 음성 영역에서는 전이학습 앙상블과 설명가능 기법을 결합해 감정인식 근거를 제시하고, 얼굴-음성 교차모달 임베딩으로 멀티모달 특징 정렬을 수행합니다.

연속학습평생학습영상 감시영상 품질평가비디오 인페인팅

대표 연구 분야

연구 영역 전체보기

실시간 영상 감시를 위한 연속학습·평생학습 아키텍처 연구

Online Continual and Lifelong Learning for Real-time Video Surveillance

연구 분야 상세보기

실시간 영상 감시를 위한 연속학습·평생학습 아키텍처 연구

Online Continual and Lifelong Learning for Real-time Video Surveillance

연구 분야 상세보기

CCTV·의료 감시 환경을 위한 비디오 복원과 장면 인지 품질평가 연구

Video Restoration and Scene-aware Image Quality Assessment for CCTV and Hospital Surveillance

연구 분야 상세보기

설명가능 전이학습 기반 음성 감정인식과 얼굴-음성 교차모달 임베딩 연구

Explainable Transfer Learning for Speech Emotion Recognition and Face-Voice Multimodal Embedding

연구 분야 상세보기

연구 성과 추이

표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

주요 논문

논문 전체보기

Article

인용수 0

2025

CQAD: An Image Quality Assessment Dataset for CCTV

Yujin Han, Taewan Kim

Journal of Multimedia Information System

이 논문은 실제 감시 환경의 복잡성을 반영하도록 특별히 설계된 새로운 영상 품질 평가(IQA) 데이터셋인 CCTV 품질 평가 데이터셋(CQAD)을 제시한다. 기존의 IQA 데이터셋은 대부분 자연 영상을 기반으로 하며, CCTV 영상에서 흔히 마주치는 다양한 조건과 열화 특성을 충분히 포착하지 못한다. 예를 들어 조명의 변화, 고정된 시점, 환경 잡음 등이 이에 해당한다. 이러한 공백을 해소하기 위해 CQAD는 실내 및 실외의 다양한 장소에서 설치된 실제 감시 카메라로부터 수집한 기준(reference) 이미지 120장을 포함하며, 주간 및 야간 조건 모두에서 촬영되었다. 각 기준 이미지는 여섯 가지의 일반적인 왜곡 유형 중 하나를 사용하여 열화되었고, 평균 의견 점수(MOS) 프레임워크를 통해 55명의 인간 참여자로부터 주관적 품질 평점을 얻었다. 실험 분석 결과, 지각된 영상 품질은 왜곡 유형뿐만 아니라 장면 맥락, 조명 조건, 하루 중 시간에 의해서도 영향을 받는 것으로 나타났다. CQAD는 장면 인지(scene-aware) IQA 모델의 개발, AI 기반 비디오 분석의 견고성 평가, 그리고 실제 감시 응용에 맞춘 복원(restoration) 기법의 설계에 유용한 벤치마크를 제공한다.

https://doi.org/10.33851/jmis.2025.12.3.81

Image quality

Distortion (music)

Benchmark (surveying)

Quality assessment

Image (mathematics)

Quality (philosophy)

Scene statistics

Article

인용수 0

2025

Face and voice cross-modal association with learning convex feature embedding

Taewan Kim, Jiwoo Kang

IF 3.1 (2025)

Multimedia Systems

https://doi.org/10.1007/s00530-025-01872-9

Modal

Computer science

Embedding

Feature (linguistics)

Association (psychology)

Artificial intelligence

Speech recognition

Face (sociological concept)

Feature learning

Regular polygon

Article

인용수 8

2024

Deep Transformer Based Video Inpainting Using Fast Fourier Tokenization

Taewan Kim, Jin-Woo Kim, Heeseok Oh, Jiwoo Kang

IF 3.6 (2024)

IEEE Access

멀리 떨어진 시공간 상호작용을 연결하는 것은, 큰 이동 마스크를 사용하는 고품질 비디오 인페인팅에서 중요하다. 대부분의 기존 기술은 프레임 내에서 패치 유사성을 활용하거나, 공간 및 시간 차원에서 구멍을 메우기 위해 대규모 학습 데이터를 이용한다. 최근 연구들은 근접 상호작용의 지배로부터 벗어나기 위해 딥 비디오 인페인팅에 유망한 Transformer 구조를 도입함으로써, 기존 기준 모델보다 우수한 성능을 달성한다. 그러나 이러한 방법들은 여전히 복잡한 장면을 포함하는 더 큰 구멍을 완성하는 데 어려움을 겪는다. 이 문제를 완화하기 위해, 우리는 먼저 토큰 표현을 위해 프레임 전역의 수용영역을 포괄하는 빠른 푸리에 합성곱을 사용한다. 그런 다음 토큰은 분리된 시공간 Transformer를 통과하여 장거리 문맥 관계를 명시적으로 모델링하는 동시에, 모든 입력 프레임에서 누락된 영역을 동시에 완성한다. 비디오 인페인팅을 방향성이 없는 시퀀스-투-시퀀스 예측 과제로 정식화함으로써, 우리 모델은 큰 결손 영역이나 복잡한 기하구조와 같은 조건에서도 시각적으로 일관된 콘텐츠를 채운다. 또한 우리의 시공간 Transformer는 경계로부터 구멍을 반복적으로 채워 풍부한 문맥 정보를 활용할 수 있다. 우리는 표준 정지 마스크와 보다 현실적인 움직이는 객체 마스크를 사용하여 제안한 모델의 우수성을 검증한다. 정성적 및 정량적 결과 모두에서, 우리 모델은 최신 알고리즘과 비교하여 유리함을 보인다.

https://doi.org/10.1109/access.2024.3361283

Computer science

Inpainting

Transformer

Artificial intelligence

Computer vision

Computer graphics (images)

Fourier transform

Image (mathematics)

Electrical engineering

Mathematics

최신 특허

특허 전체보기

상태	출원연도	과제명	출원번호
공개	2023	인공지능을 이용한 정신병동 내 환자의 이상행동 감지 시스템 및 감지 방법	1020230187395
공개	2020	차량의 출입을 제어하는 방법 및 상기 방법을 수행하는 차량 출입 제어 시스템	1020200140541
공개	2020	차량 번호판에서 문자를 추출하는 방법 및 상기 방법을 수행하는 번호판 문자 추출 장치	1020200139724

전체 특허

인공지능을 이용한 정신병동 내 환자의 이상행동 감지 시스템 및 감지 방법

상태

공개

출원연도

2023

출원번호

1020230187395

상세 정보 바로가기

차량의 출입을 제어하는 방법 및 상기 방법을 수행하는 차량 출입 제어 시스템

상태

공개

출원연도

2020

출원번호

1020200140541

상세 정보 바로가기

차량 번호판에서 문자를 추출하는 방법 및 상기 방법을 수행하는 번호판 문자 추출 장치

상태

공개

출원연도

2020

출원번호

1020200139724

상세 정보 바로가기