RnDCircle Logo
김태완 연구실
동덕여자대학교 데이터사이언스전공 김태완 교수
연속학습
평생학습
영상 감시
연구 영역
기본 정보
논문·특허
구성원

김태완 연구실

동덕여자대학교 데이터사이언스전공 김태완 교수

김태완 연구실은 데이터사이언스전공 기반의 영상 및 음성 인공지능을 중심으로 연구합니다. 실시간 감시에서 환경 변화에 대응하기 위해 연속학습·평생학습 아키텍처를 설계하고, 엣지-서버 구조에서 모델 업데이트를 수행하는 방법을 개발합니다. 또한 CCTV 및 병원 감시 환경의 품질 저하를 반영하는 IQA 데이터셋과 Transformer 기반 비디오 인페인팅을 통해 복원-평가 연계를 구축합니다. 음성 영역에서는 전이학습 앙상블과 설명가능 기법을 결합해 감정인식 근거를 제시하고, 얼굴-음성 교차모달 임베딩으로 멀티모달 특징 정렬을 수행합니다.

연속학습평생학습영상 감시영상 품질평가비디오 인페인팅
대표 연구 분야
연구 영역 전체보기
실시간 영상 감시를 위한 연속학습·평생학습 아키텍처 연구 thumbnail
실시간 영상 감시를 위한 연속학습·평생학습 아키텍처 연구
Online Continual and Lifelong Learning for Real-time Video Surveillance
연구 분야 상세보기
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.
주요 논문
5
논문 전체보기
1
Article
|
인용수 0
·
2025
CQAD: An Image Quality Assessment Dataset for CCTV
Yujin Han, Taewan Kim
Journal of Multimedia Information System
이 논문은 실제 감시 환경의 복잡성을 반영하도록 특별히 설계된 새로운 영상 품질 평가(IQA) 데이터셋인 CCTV 품질 평가 데이터셋(CQAD)을 제시한다. 기존의 IQA 데이터셋은 대부분 자연 영상을 기반으로 하며, CCTV 영상에서 흔히 마주치는 다양한 조건과 열화 특성을 충분히 포착하지 못한다. 예를 들어 조명의 변화, 고정된 시점, 환경 잡음 등이 이에 해당한다. 이러한 공백을 해소하기 위해 CQAD는 실내 및 실외의 다양한 장소에서 설치된 실제 감시 카메라로부터 수집한 기준(reference) 이미지 120장을 포함하며, 주간 및 야간 조건 모두에서 촬영되었다. 각 기준 이미지는 여섯 가지의 일반적인 왜곡 유형 중 하나를 사용하여 열화되었고, 평균 의견 점수(MOS) 프레임워크를 통해 55명의 인간 참여자로부터 주관적 품질 평점을 얻었다. 실험 분석 결과, 지각된 영상 품질은 왜곡 유형뿐만 아니라 장면 맥락, 조명 조건, 하루 중 시간에 의해서도 영향을 받는 것으로 나타났다. CQAD는 장면 인지(scene-aware) IQA 모델의 개발, AI 기반 비디오 분석의 견고성 평가, 그리고 실제 감시 응용에 맞춘 복원(restoration) 기법의 설계에 유용한 벤치마크를 제공한다.
https://doi.org/10.33851/jmis.2025.12.3.81
Image quality
Distortion (music)
Benchmark (surveying)
Quality assessment
Image (mathematics)
Quality (philosophy)
Scene statistics
2
Article
|
·
인용수 0
·
2025
Face and voice cross-modal association with learning convex feature embedding
Taewan Kim, Jiwoo Kang
IF 3.1 (2025)
Multimedia Systems
https://doi.org/10.1007/s00530-025-01872-9
Modal
Computer science
Embedding
Feature (linguistics)
Association (psychology)
Artificial intelligence
Speech recognition
Face (sociological concept)
Feature learning
Regular polygon
3
Article
|
인용수 8
·
2024
Deep Transformer Based Video Inpainting Using Fast Fourier Tokenization
Taewan Kim, Jin-Woo Kim, Heeseok Oh, Jiwoo Kang
IF 3.6 (2024)
IEEE Access
멀리 떨어진 시공간 상호작용을 연결하는 것은, 큰 이동 마스크를 사용하는 고품질 비디오 인페인팅에서 중요하다. 대부분의 기존 기술은 프레임 내에서 패치 유사성을 활용하거나, 공간 및 시간 차원에서 구멍을 메우기 위해 대규모 학습 데이터를 이용한다. 최근 연구들은 근접 상호작용의 지배로부터 벗어나기 위해 딥 비디오 인페인팅에 유망한 Transformer 구조를 도입함으로써, 기존 기준 모델보다 우수한 성능을 달성한다. 그러나 이러한 방법들은 여전히 복잡한 장면을 포함하는 더 큰 구멍을 완성하는 데 어려움을 겪는다. 이 문제를 완화하기 위해, 우리는 먼저 토큰 표현을 위해 프레임 전역의 수용영역을 포괄하는 빠른 푸리에 합성곱을 사용한다. 그런 다음 토큰은 분리된 시공간 Transformer를 통과하여 장거리 문맥 관계를 명시적으로 모델링하는 동시에, 모든 입력 프레임에서 누락된 영역을 동시에 완성한다. 비디오 인페인팅을 방향성이 없는 시퀀스-투-시퀀스 예측 과제로 정식화함으로써, 우리 모델은 큰 결손 영역이나 복잡한 기하구조와 같은 조건에서도 시각적으로 일관된 콘텐츠를 채운다. 또한 우리의 시공간 Transformer는 경계로부터 구멍을 반복적으로 채워 풍부한 문맥 정보를 활용할 수 있다. 우리는 표준 정지 마스크와 보다 현실적인 움직이는 객체 마스크를 사용하여 제안한 모델의 우수성을 검증한다. 정성적 및 정량적 결과 모두에서, 우리 모델은 최신 알고리즘과 비교하여 유리함을 보인다.
https://doi.org/10.1109/access.2024.3361283
Computer science
Inpainting
Transformer
Artificial intelligence
Computer vision
Computer graphics (images)
Fourier transform
Image (mathematics)
Electrical engineering
Mathematics
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
공개2023인공지능을 이용한 정신병동 내 환자의 이상행동 감지 시스템 및 감지 방법1020230187395
공개2020차량의 출입을 제어하는 방법 및 상기 방법을 수행하는 차량 출입 제어 시스템1020200140541
공개2020차량 번호판에서 문자를 추출하는 방법 및 상기 방법을 수행하는 번호판 문자 추출 장치1020200139724
전체 특허

인공지능을 이용한 정신병동 내 환자의 이상행동 감지 시스템 및 감지 방법

상태
공개
출원연도
2023
출원번호
1020230187395

차량의 출입을 제어하는 방법 및 상기 방법을 수행하는 차량 출입 제어 시스템

상태
공개
출원연도
2020
출원번호
1020200140541

차량 번호판에서 문자를 추출하는 방법 및 상기 방법을 수행하는 번호판 문자 추출 장치

상태
공개
출원연도
2020
출원번호
1020200139724