주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
article
|
·
인용수 1
·
2025Local Overlapping Attentional Selection with VIT for Image Classification in Remote Sensing
Changman Zou, Wang‐Su Jeon, Sang‐Yong Rhee
원격탐사 영상 분류는 장면의 복잡성과 상공(수직) 시점으로 인한 시각적 특징의 변동성 때문에 고유한 어려움을 수반한다. 전통적인 합성곱 신경망(CNN)은 장거리 의존성을 처리하고 정확한 분류를 위해 충분한 문맥 정보를 추출하는 데 어려움을 겪는다. 이에 대응하여, 우리는 원격탐사 장면 분류를 위해 특별히 설계된 Transformer 아키텍처에 로컬 어텐션 선택 모듈을 통합하는 새로운 접근인 LSViT 모델을 제안한다. LSViT는 식별에 유리한 토큰을 선택하고 중복 정보를 제거함으로써 분류 성능을 향상시킨다. 본 모델은 전역 및 국소 특징을 모두 포착하는 Transformer의 역량을 활용하여 중요한 이미지 영역에 대한 집중을 개선한다. 우리는 LSViT를 두 개의 벤치마크 데이터셋인 AID와 NWPU-RESISC45에서 평가하였으며, 전통적인 CNN 및 다른 Transformer 기반 방법과 비교해 최신 수준의 정확도를 달성하는 등 경쟁력 있는 성능을 보임을 확인하였다. 특히, 로컬 어텐션 선택 모듈은 중첩되는 객체와 복잡한 배경을 포함한 장면을 분류하는 모델의 능력을 향상시켜, 대규모 원격탐사 영상 분류 과제에 효과적인 해결책이 된다.
https://doi.org/10.1109/iceic64972.2025.10879691
Selection (genetic algorithm)
Computer science
Artificial intelligence
Computer vision
Pattern recognition (psychology)
2
article
|
·
인용수 1
·
2025LW-FastPose: A Lightweight Network for Human Pose Estimation Based on Improvements to FastPose
Mingxing Cai, Wang‐Su Jeon, Sang‐Yong Rhee
인간 자세 추정 네트워크 모델의 성능이 지속적으로 향상됨에 따라, 더 깊은 네트워크 구조는 흔히 파라미터 수의 상당한 증가와 연산 복잡도의 증가를 동반한다. 이러한 문제를 해결하기 위해 본 논문에서는 경량 인체 자세 추정 네트워크 LW-FastPose를 제안한다. 제안된 네트워크는 EL-ResNet 특징 추출 네트워크와 업샘플링 DUC 모듈로 구성된다. EL-ResNet 특징 추출 네트워크의 기반이 되는 DWNK 베이스 모듈은 잔차 연결(residual connections)과 depthwise separable convolution 기법을 활용하는 depthwise separable convolution 모듈이다. 이러한 설계는 모델 성능을 유지하면서 연산 복잡도를 유의미하게 감소시킨다. COCO 데이터셋에 대한 실험 결과에 따르면, LW-FastPose는 FastPose 네트워크와 비교하여 파라미터 수와 연산 복잡도를 각각 34%와 27% 감소시킨다. 다른 주요 모델들에 비해 LW-FastPose는 파라미터 수 및 연산 부담을 크게 줄일 뿐 아니라 성능 저하 없이 경쟁력 있는 예측 정확도를 달성한다.
https://doi.org/10.1109/iceic64972.2025.10879683
Computer science
Pose
Estimation
Artificial intelligence
Engineering
Systems engineering
3
article
|
인용수 2
·
2025A Dual-Headed Teacher–Student Framework with an Uncertainty-Guided Mechanism for Semi-Supervised Skin Lesion Segmentation
Changman Zou, Wang‐Su Jeon, Haixiang Ju, Sang‐Yong Rhee
IF 2.6 (2025)
Electronics
의료 영상 분할은 제한된 주석 데이터, 복잡한 병변 경계, 그리고 의료 영상에 내재된 변동성으로 인해 어려운 과제이다. 이러한 도전 과제들은 임상 적용을 위해 정확하고 견고한 분할이 필수적이게 만든다. 본 연구에서는 피부 병변 분할을 위해 특별히 설계된 새로운 반지도 학습 프레임워크인 불확실성 유도 보조 Mean Teacher (Uncertainty-Driven Auxiliary Mean Teacher, UDAMT) 모델을 제안한다. 우리의 접근은 불확실성에 기반한 메커니즘을 활용하는 듀얼 헤드(dual-headed) 교사–학생(teacher–student) 아키텍처를 사용하여 특징 학습과 경계 정밀도를 향상시킨다. ISIC 2016, ISIC 2017, ISIC 2018 데이터셋에 대한 광범위한 실험 결과, UDAMT는 저라벨 설정(라벨 데이터 5%)에서 Dice 계수는 1.17 퍼센트 포인트, 평균 Intersection over Union(mIoU)은 1.31 퍼센트 포인트 향상되어 최신 기술 대비 유의미한 성능 개선을 달성함을 보여주었다. 또한 UDAMT는 12.9 M 파라미터를 필요로 하며, 이는 기준 모델(12.5 M)보다 약간 높지만 MT(14.8 M) 및 UAMT(15.2 M)보다 유의미하게 낮다. 이미지당 추론 시간은 25.7 ms로 계산 효율성을 보장한다. 제거 실험(ablations)은 각 구성 요소의 기여도를 검증하며, PH2 벤치마크에 대한 교차 데이터셋 평가는 작은 병변에 대한 견고성을 확인한다. 본 연구는 정확성, 효율성, 그리고 임상적 적용 가능성의 균형을 이루는 확장 가능하고 효율적인 반지도 의료 영상 분할 해결책을 제공한다.
https://doi.org/10.3390/electronics14050984
Dual (grammatical number)
Mechanism (biology)
Segmentation
Lesion
Artificial intelligence
Computer science
Pattern recognition (psychology)
Machine learning
Medicine
Surgery
4
article
|
인용수 2
·
2024ATT-NestedUnet: Sugar Beet and Weed Detection Using Semantic Segmentation
xinzhi Hu, Wang‐Su Jeon, Grezgorz Cielniak, Sang‐Yong Rhee
IF 1.2 (2024)
International Journal of Fuzzy Logic and Intelligent Systems
사탕무(Beta vulgaris)는 저온, 가뭄 및 염분에 대한 내성이 있는 이년생 초본으로, 전 세계 주요 당 작물 중 하나이다. 당 외에도 사탕무는 화학 및 제약 제품을 위한 중요한 원료이며, 당 추출 후 남는 부산물은 복합 사료(compound feed)와 같은 농업 부산물을 생산하는 데 활용될 수 있어 종합적 이용 가치가 높다[1]. 사탕무와 같은 밭 잡초는 작물의 생장에 해롭고, 작물과 햇빛 및 양분을 놓고 경쟁할 수 있다. 잡초가 재배 기간 동안 제때 제거되지 않으면 수확량과 품질이 감소한다. 따라서 선택적 제초 작업을 위한 자동화 기계의 개발에 대한 관심이 상당하다.
이 기술의 핵심 구성 요소는 작물과 잡초를 구별하는 비전(vision) 시스템이다. 전통적인 사탕무 검출에서 발생하는 잡초 추출의 어려움, 검출 성능 저하, 그리고 영역 경계(region boundary) 분할의 문제를 해결하기 위해, 분할(segmentation)을 위한 개선된 UNet++에 기반한 엔드투엔드(End-to-end) 인코더-디코더 모델을 본 논문에서 제안하고 사탕무 및 잡초 검출에 적용하였다. UNet++는 스킵 연결(skip connections)을 통해 서로 다른 층(layer)에서의 특징 맵(feature map)을 더 잘 융합하며, 사탕무 및 잡초 이미지의 세부 정보를 효과적으로 보존할 수 있다. 새로운 모델은 UNet++의 업샘플링(upsampling) 과정에 주의(attention) 모듈을 임베딩하여, 불필요한 잡음으로부터의 간섭을 억제함으로써 UNet++에 주의 메커니즘을 추가하였다.
개선된 모델은 1026장의 이미지를 포함하는 사탕무 및 잡초 데이터셋에서 평가되었다. 본 연구에서 사용한 이미지 데이터셋은 독일 본 대학(University of Bonn)에서 수집한 사탕무 및 잡초 이미지로부터 얻었다. 실험 결과에 따르면, 제안 모델은 잡음을 유의미하게 제거하고 분할 정확도를 향상시킬 수 있다.
https://doi.org/10.5391/ijfis.2024.24.1.1
Sugar beet
Weed
Artificial intelligence
Natural language processing
Segmentation
Computer science
Agronomy
Biology
5
article
|
인용수 8
·
2024Research on the Multiple Small Target Detection Methodology in Remote Sensing
Changman Zou, Wang‐Su Jeon, Sang‐Yong Rhee
IF 3.5 (2024)
Sensors
본 연구는 원격탐사 영상에서의 표적 탐지 분야를 발전시키는 데 초점을 두며, 소형 표적 탐지, 복잡한 배경 처리, 밀집 표적 분포와 같은 과제들을 다룬다. 이를 위해 YOLOv7 알고리즘을 개선하는 기반의 해결책을 제안한다. 첫째, YOLOv7의 다중 스케일 특징 향상(MFE) 방법을 개선하여 소형 표적과 복잡한 배경을 탐지하는 데 있어 적응성과 정확도를 향상시킨다. 둘째, 전역 정보를 효과적으로 포착하고 통합하기 위한 수정된 YOLOv7 전역 정보 DP-MLP 모듈을 설계하여, 특히 대규모 변동과 복잡한 장면을 처리하는 데서 표적 탐지 정확도와 견고성을 향상시킨다. 마지막으로, 라벨이 없는 데이터를 포함하는 반지도 학습 모델(SSLM) 기반 표적 탐지 알고리즘을 탐구하고, 라벨이 없는 데이터로부터의 정보를 활용하여 모델의 일반화 능력과 성능을 향상시킨다. 실험 결과, YOLOv7의 우수한 성능에도 불구하고 평균 정밀도(mean average precision, MAP)는 여전히 1.9% 향상될 수 있음을 보여준다. 구체적으로 TGRS-HRRSD-Dataset에서의 테스트에서는 MFE 및 DP-MLP 모델이 각각 MAP 93.4%와 93.1%를 달성한다. NWPU VHR-10 데이터셋 전반에서는 세 모델이 각각 MAP 93.1%, 92.1%, 92.2%를 달성한다. 원래 모델에 비해 다양한 지표에서 유의미한 개선이 관찰된다. 본 연구는 원격탐사 영상 객체 탐지의 적응성, 정확도 및 일반화 성능을 향상시킨다.
https://doi.org/10.3390/s24103211
Adaptability
Robustness (evolution)
Computer science
Generalization
Artificial intelligence
Object detection
Data mining
Pattern recognition (psychology)
Scale (ratio)
Feature (linguistics)