주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
article
|
인용수 1
·
2025WalkGCN: a biased sampling strategy for GNNs on non-attributed graphs
Mincheol Shin, Tae-Young Choe, Yejong Ryu, Yanggon Kim, Mucheol Kim
IF 6.4 (2025)
Journal Of Big Data
그래프 신경망(Graph Neural Networks, GNN)은 일반적으로 그래프 구조에서의 상호작용을 포착하기 위해 노드 속성이 존재한다고 가정한다. 그러나 실제 그래프 데이터는 종종 불완전하거나 완전히 누락된 속성 정보를 갖는다. 불완전한 속성을 다루기 위한 GNN 접근법은 널리 구현되어 있으나, 속성이 없는 그래프에 대한 연구는 부족한 실정이다. DeepWalk 및 node2vec은 그래프 합성곱 신경망(Graph Convolutional Networks, GCN)에서 인공적인 속성을 생성하는 데 활용될 수 있다. 하지만 무작위 보행의 확률적 특성은 일관되지 않은 성능을 초래한다. 또한 이는 차수 편향(degree bias)을 도입하여 허브 노드가 과도하게 샘플링되고, 저차수 노드는 과소 표현되는 문제를 유발한다. 이러한 한계를 해결하기 위해 우리는 인공 노드 속성 생성을 위한 Walk Graph Convolutional Networks (WalkGCN)를 제안한다. WalkGCN은 노드 시퀀스 생성 과정에서 차수에 의한 편향을 완화하는 편향 샘플링 전략을 사용한다. 학습 데이터의 균형을 맞추기 위해 리프 노드(leaf nodes)의 샘플링 빈도를 증가시킨다. 선행 단계에서 생성된 노드 임베딩(node embeddings)을 각 노드의 인공 속성으로 활용한다. 이후 인공 속성을 포함한 그래프를 표준(vanilla) 그래프 합성곱 신경망 모델에 입력하여 노드 분류를 수행한다. 세 개의 그래프 데이터셋에 대해 광범위하게 수행한 실험 결과는 WalkGCN이 무작위 보행의 하이퍼파라미터 또는 무작위성(randomness)과 무관한 인공 속성을 효과적으로 생성함을 보여준다. 또한 제안된 모델은 다양한 기준(baseline) 모델보다 성능이 우수하다. 코드는 https://github.com/mincheol-shin-cau/WalkGCN 에서 제공된다.
https://doi.org/10.1186/s40537-025-01270-y
Graph
Randomness
Random walk
Node (physics)
Random geometric graph
Null model
Hyperparameter
Sampling (signal processing)
2
article
|
인용수 0
·
2025KRongBERT: Enhanced factorization-based morphological approach for the Korean pretrained language model
Hyunwook Yu, Yejin Cho, Geunchul Park, Mucheol Kim
IF 6.9 (2025)
Information Processing & Management
변환기(transformers) 기반 양방향 인코더 표현(BERT) 모델은 라틴 기반 언어를 대상으로 다양한 자연어 처리 과제에서 괄목할 만한 성과를 거두었다. 그러나 한국어는 제한된 데이터 자원과 복잡한 언어 구조로 인해 고유한 도전 과제를 제시한다. 본 논문에서는 이러한 한국어의 고유한 언어적 복잡성을 효과적으로 해결하기 위해 형태론적 접근을 통해 설계된 언어 모델인 KRongBERT를 제안한다. KRongBERT는 한국어에서 바이트 쌍 인코딩(byte-pair-encoding) 토크나이저로 인해 발생하는 어휘 외(out-of-vocabulary) 문제를 완화하고, 이해를 향상시키기 위해 언어 특화 임베딩 층을 통합한다. 본 모델은 기존 BERT 구현에 비해 특정 자연어 이해 과제에서 최대 1.56%의 성능 향상을 보인다. 특히 KRongBERT는 다른 모델들이 필요로 하는 데이터의 11.42%만을 사용하면서도, 기존의 최신 한국어 BERT 모델들보다 우수한 성능을 달성한다. 본 실험 결과는 KRongBERT가 한국어의 복잡성을 효율적으로 처리하며, 현재의 최신 접근법을 능가함을 보여준다. 코드는 https://github.com/Splo2t/KRongBERT 에서 공개되어 있다.
• 형태론적 접근에 기반한 한국어 사전학습 모델 KRongBERT를 제시
• 한국어 NLP에서 어휘 외 문제를 해결하기 위해 접사(affix)를 인식하는 토크나이저를 제안
• 한국어의 위치 정보를 포착하기 위한 형태소 임베딩 층을 통합
• 더 적은 학습 데이터로 한국어 NLU 과제에서 최신 모델을 능가
https://doi.org/10.1016/j.ipm.2025.104072
Computer science
Factorization
Natural language processing
Artificial intelligence
Language model
Algorithm
3
article
|
인용수 1
·
2023Adaptive variable sampling model for performance analysis in high cache-performance computing environments
Mincheol Shin, Mucheol Kim, Geunchul Park, Ajith Abraham
IF 3.4 (2023)
Heliyon
고성능 컴퓨팅은 다양한 과학 분야에 컴퓨팅 성능을 제공하며, 메타인지 이상의 통찰을 제공함으로써 발전을 뒷받침한다. 자원을 낭비하지 않으면서 컴퓨팅 성능을 극대화하는 것은 주요 연구 과제이다. 컴퓨터의 다음 상태에 대한 성능을 예측하는 것은 스케줄링에 효과적이다. 그러나 컴퓨터의 상태를 나타내는 하드웨어 성능 모니터는 높은 수준의 전문 지식이 요구되며, 표준화된 모델은 존재하지 않는다. 본 논문에서는 고성능 컴퓨팅 환경에서의 성능 분석을 위한 적응형 변수 샘플링 모델을 제안한다. 우리의 방법은 성능 예측과 관련된 수많은 변수들로부터 최적의 변수를 자동으로 분류하고, 샘플링된 변수를 사용하여 성능을 예측한다. 성능 분석을 위한 최적 변수는 샘플링 과정에서 전문 지식을 필요로 하지 않는다. 우리는 본 방법을 검증하기 위해 다양한 아키텍처와 응용 분야에서 실험을 수행하였다. 본 모델은 정확도 손실 없이 최소 24.25%에서 최대 58.75%까지 더 빠르게 수행되었다.
https://doi.org/10.1016/j.heliyon.2023.e16777
Computer science
Supercomputer
Performance prediction
Scheduling (production processes)
Machine learning
Variable (mathematics)
Cache
Sampling (signal processing)
Variety (cybernetics)
Artificial intelligence
4
article
|
인용수 4
·
2023Deep learning-assisted IoMT framework for cerebral microbleed detection
Zeeshan Ali, Sheneela Naz, Sadaf Yasmin, Maryam Bukhari, Mucheol Kim
IF 3.4 (2023)
Heliyon
사물인터넷(IoT), 빅데이터, 인공지능(AI)은 모두 디지털 의료 서비스의 형성과 구현에 영향을 미치는 핵심 기술이다. 첨단 센서와 AI 기반 인사이트를 결합한 Internet of Medical Things(IoMT) 시스템을 구축하는 것은 지능형 의료 시스템을 위해 중요하다. 본 논문은 사람의 임상 환경에서 발생하는 진단 및 치료 과정의 불가피한 오류를 줄이기 위해, 뇌 자기공명영상(MRI) 분석을 위한 IoMT 프레임워크를 제시한다. 이는 뇌 미세출혈(cerebral microbleeds, CMBs)을 정확히 검출하기 위한 것이다. 정확한 CMB 검출의 문제점은 CMB가 지름 5–10 mm의 작은 점 형태라는 점이며, 건강한 조직과 유사하고 식별이 극히 어려워 원격 및 의료 기반이 취약한 의료기관에서 전문적인 지도의 필요성이 요구된다는 것이다. 둘째, 기존 연구에서 컴퓨터 보조진단(computer-aided diagnostic, CAD) 시스템은 정확한 CMB 검출을 위해 설계되어 있으나, 제안된 접근은 2단계로 구성된다. 첫 단계에서 전체 MRI 영상으로부터 잠재적 후보 CMB를 선별한 다음, 이를 거짓양성(false-positive) 감소 단계로 전달한다. 이러한 전처리 및 후처리 단계는 사람의 개입 없이도 결과를 산출할 수 있는, CMB를 위한 완전 자동화 CAD 시스템을 구축하기 어렵게 만든다. 따라서 본 연구의 핵심 목표로서, IoMT 기기에서 효과적인 CMB 검출 및 분할을 위한 end-to-end 향상 UNet 기반 모델을 제안한다. 제안된 시스템은 CMB 분할을 위한 전처리 또는 후처리 단계가 필요 없으며, 기존 연구에서는 전체 MRI 영상 입력으로부터 각 CMB 픽셀을 국소화(locate)하는 작업을 수행하지 않는다. 그 결과, 제안된 방법은 대조도 변이와 다른 정상 조직과의 유사성이 존재하는 상황에서도 CMB 검출에서 우수한 성능을 보였고, dice 점수 0.70, 정확도 99 %, 거짓양성률 0.002 %를 산출하였다. © 2017 Elsevier Inc. 판권 소유.
https://doi.org/10.1016/j.heliyon.2023.e22879
Computer science
Segmentation
Artificial intelligence
The Internet
Deep learning
Medical imaging
Key (lock)
CAD
Image processing
Image segmentation
5
article
|
인용수 36
·
2023Safety map: Disaster management road network for urban resilience
Jiho Kim, Sanghyun Park, Mucheol Kim
IF 10.5 (2023)
Sustainable Cities and Society
본 연구는 도시 지역에서 위기 대응을 위한 도로를, 도로의 위상학적 관계를 통한 관리 필요성과 재난에 대한 도로의 내구성 및 회복탄력성 속성을 고려함으로써 선정하는 것을 목표로 한다. 재난 저항 도로 네트워크란 다양한 재난 시나리오에 따라 역동적으로 활용되는 안전한 도로들의 네트워크를 의미한다. 이 네트워크는 높은 접근성과 재난 저항성을 요구한다. 경우에 따라 도로는 시민의 안전을 확보하고 인적 자원을 보존하며 재난 지역으로 긴급 물자를 운송하기 위한 대피 경로로 사용된다. 재난 발생 시, 다양한 유형의 재난에 저항하는 도로 기반시설을 활용하는 것은 도시의 기능을 유지하는 데 도움이 되며, 도시 회복탄력성 증가에 기여할 수 있다. 본 논문에서는 도로 네트워크의 재구성 과정에서 ERAM(Eigenvector Ratio of Adjacency Matrix) 모델을 통해 도로 레이어를 추출한다. 즉 공공 도로 데이터로부터 재난 회복탄력성이 높은 도로 레이어와, 도로 간 위상학적 관계에서 연결성이 높은 도로 레이어를 모두 추출한다. 이어서 네트워크는 재난 저항성에 기반한 레이어와 위상학적 관계에 기반한 레이어를 결합하여 재난 저항 도로 네트워크를 도출한다. 검증은 추출된 재난 저항 도로 네트워크와 교통 특성을 나타내는 교통량 계수 지점을 비교하는 사례 연구를 통해 수행될 것이다. 제안된 연구 결과는 재난 상황에서 대피 경로 계획 및 긴급 수송 경로 계획을 위해 참조되는 지리정보로 활용될 예정이며, 재난 계획을 위한 기초 연구 자료로 활용될 것이다.
https://doi.org/10.1016/j.scs.2023.104650
Resilience (materials science)
Emergency management
Transport engineering
Resistance (ecology)
Computer science
Plan (archaeology)
Geography
Computer security
Engineering