RnDCircle Logo
김진영 연구실
전남대학교 지능전자컴퓨터공학과 김진영 교수
컴퓨터 비전
의료영상 분석
자기지도학습
연구 영역
기본 정보
논문·특허
과제
구성원

김진영 연구실

전남대학교 지능전자컴퓨터공학과 김진영 교수

김진영 연구실은 디지털 신호처리 관점에서 음향·영상 및 멀티모달 데이터를 분석하는 연구를 수행합니다. 특히 영상 신호에서 결함과 균열을 국소화하는 컴퓨터 비전 기술, 의료 영상에서 분할과 예측을 수행하는 딥러닝 기반 분석 기술, 시청각 자극과 뇌파 특징을 매핑하여 감정을 분류하는 교차모달 감정 인식 기술을 중심으로 연구합니다. 또한 데이터 특성과 학습 일반화 문제를 다루기 위해 자기지도학습, 대비 학습, 지식 증류, 멀티스케일 특징 융합 같은 방법론을 적용하며, 임베디드 추론과 시스템화 관점의 성능 구현까지 확장합니다.

컴퓨터 비전의료영상 분석자기지도학습대비학습지식 증류
대표 연구 분야
연구 영역 전체보기
다변량 시계열 예측과 TCN 기반 예측 시스템 thumbnail
다변량 시계열 예측과 TCN 기반 예측 시스템
Multivariate Time-Series Forecasting and TCN-Based Prediction Systems
연구 분야 상세보기
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.
주요 논문
5
논문 전체보기
1
Article
|
인용수 2
·
2025
DuCo-Net: Dual-Contrastive Learning Network for Medical Report Retrieval Leveraging Enhanced Encoders and Augmentations
Zahid Ur Rahman, Ju-Hwan Lee, Dang Thanh Vu, Iqbal Murtza, Jin Young Kim
IF 3.6 (2025)
IEEE Access
의학 영상의학 보고서를 생성하는 기존의 과정은 방대하고 시간이 많이 소요되어, 영상의학과 전문의가 영상 연구로부터 소견을 면밀히 기술해야 한다. 이러한 수작업 방식은 종종 환자 진료에서 바람직하지 않은 지연을 초래한다. 컴퓨터 비전과 딥러닝의 발전에도 불구하고, 자동화된 의학 보고서를 생성하기 위한 효과적인 컴퓨터 보조 솔루션을 개발하는 일은 여전히 어렵다. 최근 딥러닝 기술의 발전, 특히 대조 학습(contrastive learning)의 도입은 자연어 감독(natural language supervision)에서 유의미한 성능을 보여주었다. 그러나 특히 흉부 X-ray(chest x-rays, CXR) 영역에서 의학 보고서 생성에 이를 적용하는 데에는 대규모 주석 데이터셋의 부재로 인해 한계가 있었다. 많은 연구들이 자연 이미지의 데이터 부족 문제를 해결하기 위해 멀티모달 대조 학습(multimodal contrastive learning) 방식을 제안해 왔다. 그러나 의학 보고서 생성 관점에서 이러한 기법들이 효율적으로 탐색된 사례는 없다. 본 연구는 백본 네트워크와 증강 네트워크를 포함하는 이중 대조 학습 네트워크(DuCo-Net)를 제안함으로써 이러한 과제들을 해결한다. 백본 네트워크는 원본 데이터로 학습되는 반면, 증강 네트워크는 통합된 프레임워크에서 교차 모델 증강 학습을 강조한다. DuCo-Net은 두 가지 상호 보완적인 학습 메커니즘을 가능하게 한다. 즉, 이미지 또는 텍스트 중 각 양식(modality) 내에서 각 네트워크가 전문화된 특징을 학습하는 양식 내(intra-modal) 학습과, 결합된 손실함수(combined loss function)를 통해 이미지와 텍스트 양식 간의 관계를 포착하는 양식 간(inter-modal) 학습이다. 이러한 이중 학습 접근은 의료 데이터를 처리하도록 특별히 맞춤화된 고급 풀링 기법을 적용하여 수정된 DenseNet121 및 BioBERT 모델을 활용한다. 두 개의 공개 데이터셋에 대한 포괄적 평가는 DuCo-Net이 기존 벤치마크를 유의미하게 능가함을 보여준다. Indiana University Chest X-rays 데이터셋에서는 제안 방법론이 표준 지표 전반에서 유의미한 향상을 보였으며(BLEU-1: 0.50, ROUGE: 0.40, METEOR: 0.24, F1: 0.40), MIMIC-CXR 데이터셋에서도 견고한 성능을 유지하였다(BLEU-1: 0.42, ROUGE: 0.34, METEOR: 0.20, F1: 0.34). 이는 의학 보고서 생성에서 기존의 최첨단 접근법 대비 실질적인 개선을 나타낸다.
https://doi.org/10.1109/access.2025.3538325
Computer science
Dual (grammatical number)
Encoder
Artificial intelligence
Operating system
2
Article
|
인용수 2
·
2024
SDSL: Spectral Distance Scaling Loss Pretraining SwinUNETR for 3D Medical Image Segmentation
Jin Lee, Dang Thanh Vu, Gwang-Hyun Yu, Jinsul Kim, Kunyung Kim, Jin Young Kim
IF 3.6 (2024)
IEEE Access
마스킹 이미지 모델링(masked image modeling, MIM)을 활용하는 자기지도학습 기반의 최근 접근법들은 높은 성능을 보여주었다. 그러나 MIM을 소규모 데이터셋에 그대로 적용할 경우, 하위 과제에 대한 일반화 성능이 저하된다. 본 연구는 데이터셋 부족이 야기하는 한계를 상세한 해부학적 구조의 포착이 보완할 수 있다고 가정하며, 의료 영상 과제에서의 일반화를 향상시키도록 설계된 Spectral Distance Scaling Loss(SDSL)를 제안한다. 전통적인 픽셀 기반 방법과 달리, SDSL은 저주파 및 고주파 상세 정보에 대한 균형 잡힌 학습을 보장하기 위해 인코더 표상을 강화하는 주파수 영역 정보를 포함한다. 또한 사전학습 모델이 여러 단계에 걸쳐 주파수 정보를 재구성할 수 있도록 하기 위해 웨이블릿 다중 해상도 분해(wavelet multi resolution decomposition)를 활용하였다. 종합적인 실험 결과, SDSL 사전학습은 기존 방법들보다 더 선명한 재구성 결과와 더 정확한 분할 성능을 제공함이 확인되었다. 제안된 접근법은 Beyond the Cranial Vault 데이터셋에서 평균 Dice 점수 84.17%, Medical Segmentation Decathlon Spleen 데이터셋에서 98.20%, Multimodality Whole Heart Segmentation 데이터셋에서 90.38%의 최고 평균 Dice 점수를 달성하였다. 이러한 결과는 스펙트럼 변이를 효과적으로 처리하고 모델의 일반화를 개선함으로써 의료 영상 기술을 발전시킬 SDSL의 잠재력을 강조한다.
https://doi.org/10.1109/access.2024.3450961
Computer science
Artificial intelligence
Computer vision
Image segmentation
Segmentation
Medical imaging
Scaling
Pattern recognition (psychology)
Mathematics
3
Article
|
·
인용수 8
·
2023
Developing a Novel Methodology by Integrating Deep Learning and HMM for Segmentation of Retinal Blood Vessels in Fundus Images
Mehdi Hassan, Safdar Ali, Jin Young Kim, Ayesha Saadia, Muhammad Sanaullah, Hani Alquhayz, Khushbakht Safdar
IF 3.9 (2023)
Interdisciplinary Sciences Computational Life Sciences
https://doi.org/10.1007/s12539-022-00545-9
Artificial intelligence
Computer science
Segmentation
Hidden Markov model
Pyramid (geometry)
Pattern recognition (psychology)
Deep learning
Convolutional neural network
Encoder
Fundus (uterus)
최신 정부 과제
70
과제 전체보기
1
2025년 4월-2025년 12월
|58,334,000
탈중앙화 생체데이터 보안 기술 기반 연합학습 플랫폼 개발
탈중앙화 생체데이터 보안 기술 기반 SDK 개발연합학습 기반 안면인식 AI 모델 로컬학습 및 글로벌학습
탈중앙화
인공지능
연합학습
사이버보안
2
2025년 3월-2028년 12월
|736,000,000
노지 작물 방제 스마트패키지 기술 산업화
최종목표 : 노지 작물 환경 및 생육 기반 정밀 방제 기술 개발을 통한 스마트 방제 패키지 기술 산업화- 노지 작물 정밀 방제를 위한 SS기 플랫폼 설계- SS기 정밀 방제 및 사용성 편의를 위한 다목적 액세서리 개발- 정밀 방제를 위한 도포 속도 및 분무기 속도 정밀 제어 기술 개발- 인공지능 기반 작물 병해충 및 잡초 인식 결과에 반응하는 동적 노즐 제...
노지 자율주행 방제기
RTK 정밀 GPS
작물 생육 인식
가변율 살포
인공지능 영상인식
3
2025년 3월-2028년 12월
|552,000,000
노지 작물 방제 스마트패키지 기술 산업화
최종목표 : 노지 작물 환경 및 생육 기반 정밀 방제 기술 개발을 통한 스마트 방제 패키지 기술 산업화- 노지 작물 정밀 방제를 위한 SS기 플랫폼 설계- SS기 정밀 방제 및 사용성 편의를 위한 다목적 액세서리 개발- 정밀 방제를 위한 도포 속도 및 분무기 속도 정밀 제어 기술 개발- 인공지능 기반 작물 병해충 및 잡초 인식 결과에 반응하는 동적 노즐 제...
노지 자율주행 방제기
RTK 정밀 GPS
작물 생육 인식
가변율 살포
인공지능 영상인식
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
등록2024패치 단위 히트맵 기반 앵커 프리 검출을 수행하는 전자 장치 및 그의 앵커 프리 검출 방법1020240159637
등록2024개념 병목 모델 기반 지식 증류 학습 장치 및 방법1020240091399
등록2022한국어-한국 수어 번역 데이터 증강 및 평가 방법과 이를 수행하기 위한 장치1020220119007
전체 특허

패치 단위 히트맵 기반 앵커 프리 검출을 수행하는 전자 장치 및 그의 앵커 프리 검출 방법

상태
등록
출원연도
2024
출원번호
1020240159637

개념 병목 모델 기반 지식 증류 학습 장치 및 방법

상태
등록
출원연도
2024
출원번호
1020240091399

한국어-한국 수어 번역 데이터 증강 및 평가 방법과 이를 수행하기 위한 장치

상태
등록
출원연도
2022
출원번호
1020220119007