RnDCircle Logo
김무철 연구실
중앙대학교 소프트웨어학부 김무철 교수
재난정보시스템
그래프 신경망
지오펜싱
기본 정보
연구 분야
프로젝트
논문
구성원

김무철 연구실

중앙대학교 소프트웨어학부 김무철 교수

김무철 연구실은 소프트웨어 관점에서 재난정보시스템과 안전 의사결정을 구현합니다. 도시 도로 데이터를 그래프 구조로 변환하고 재난 내구성 및 위상 관계를 반영해 대피·긴급수송 경로를 생성하며, GIS 지오펜싱과 크라우드센싱을 결합해 위험 영역을 동적으로 갱신하는 방식의 연구를 수행합니다. 또한 그래프 신경망 샘플링 편향을 완화하는 모델, 한국어 형태소 기반 언어모델, BERT 기반 이종 스키마 매칭과 데이터 큐레이션을 통해 데이터 표준화와 정보 필터링 문제를 다룹니다. 고성능컴퓨팅 성능 예측, 그래프 임베딩 기반 취약점 분류, IoMT 기반 의료영상 분할 연구도 병행합니다.

재난정보시스템그래프 신경망지오펜싱크라우드센싱한국어 언어모델
대표 연구 분야
연구 영역 전체보기
GIS·도로 네트워크 기반 재난 대피 및 대응 의사결정 연구 thumbnail
GIS·도로 네트워크 기반 재난 대피 및 대응 의사결정 연구
GIS and Road-Network Based Disaster Evacuation and Response Decision-Making
연구 분야 상세보기
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

23총합

5개년 연도별 피인용 수

237총합
주요 논문
5
논문 전체보기
1
article
|
인용수 0
·
2025
KRongBERT: Enhanced factorization-based morphological approach for the Korean pretrained language model
Hyunwook Yu, Yejin Cho, Geunchul Park, Mucheol Kim
IF 6.9 (2025)
Information Processing & Management
The bidirectional encoder representations from transformers (BERT) model has achieved remarkable success in various natural language processing tasks for Latin-based languages. However, the Korean language presents unique challenges with limited data resources and complex linguistic structures. In this paper, we present KRongBERT, a language model specifically designed through a morphological approach to effectively address the unique linguistic complexities of Korean. KRongBERT mitigates the out-of-vocabulary issues that arise with byte-pair-encoding tokenizers in Korean and incorporates language-specific embedding layers to enhance understanding. Our model demonstrates up to an 1.56% improvement in performance on specific natural language understanding tasks compared to the traditional BERT implementations. Notably, KRongBERT achieves superior performance compared to existing state-of-the-art Korean BERT models while utilizing only 11.42% of the data required by other models. Our experiments demonstrate that KRongBERT efficiently handles the complexities of the Korean language, outperforming current state-of-the-art approaches. The code is publicly available at https://github.com/Splo2t/KRongBERT . • Present KRongBERT, a Korean pre-trained model based on a morphological approach • Propose an affix-aware tokenizer to tackle out-of-vocabulary issues in Korean NLP. • Incorporate a morpheme embedding layer to capture Korean positional information. • Outperform state-of-the-art models on Korean NLU tasks with less training data.
https://doi.org/10.1016/j.ipm.2025.104072
Computer science
Factorization
Natural language processing
Artificial intelligence
Language model
Algorithm
2
article
|
인용수 1
·
2025
WalkGCN: a biased sampling strategy for GNNs on non-attributed graphs
Mincheol Shin, Tae-Young Choe, Yejong Ryu, Yanggon Kim, Mucheol Kim
IF 6.4 (2025)
Journal Of Big Data
Graph Neural Networks (GNNs) typically assume the presence of node attributes to capture interactions in a graph structure. However, real-world graph data often has incomplete or completely-missing attribute information. GNN approaches to dealing with incomplete attributes are widely implemented, yet there is a paucity of research on graphs without attributes. DeepWalk and node2vec can be exploited to generate artificial attributes in Graph Convolutional Networks (GCN). However, the stochastic nature of random walks disrupts consistent performance. Furthermore, it introduces a degree bias, which causes the over-sampling of hub nodes and the under-representation of low-degree nodes. To address this limitation, we propose Walk Graph Convolutional Networks (WalkGCN) for generating artificial node attributes. WalkGCN employs a biased sampling strategy that mitigates degree-induced bias during node sequence generation. It increases the sampling frequency of leaf nodes to balance the training data. The node embeddings generated in the preceding phase are employed as artificial attributes for each node. The graph with artificial attributes is then fed to the vanilla graph convolutional networks model, which performs node classification. The results of extensive experiments on three graph datasets demonstrate that WalkGCN effectively generates artificial attributes that are independent of the hyperparameters or randomness of the random walk. Furthermore, the proposed model outperforms a variety of baseline models. The code is available at https://github.com/mincheol-shin-cau/WalkGCN .
https://doi.org/10.1186/s40537-025-01270-y
Graph
Randomness
Random walk
Node (physics)
Random geometric graph
Null model
Hyperparameter
Sampling (signal processing)
3
article
|
인용수 1
·
2023
Adaptive variable sampling model for performance analysis in high cache-performance computing environments
Mincheol Shin, Mucheol Kim, Geunchul Park, Ajith Abraham
IF 3.4 (2023)
Heliyon
High-performance computing provides computing power for a variety of scientific disciplines, supporting advancements by offering insights beyond metacognition. Maximizing computing performance without wasting resources is a major research issue. Predicting the performance of a computer's next state is effective for scheduling. However, hardware performance monitors representing the computer's state require high expert knowledge, and there is no standardized model. In this paper, we propose an adaptive variable sampling model for performance analysis in high-performance computing environments. Our method automatically classifies the optimal variables from numerous variables related to performance prediction and predicts performance using the sampled variables. The optimal variables for performance analysis do not require expert knowledge during the sampling process. We conducted experiments in various architectures and applications to validate this method. This model performed at least 24.25% and up to 58.75% faster without any loss in accuracy.
https://doi.org/10.1016/j.heliyon.2023.e16777
Computer science
Supercomputer
Performance prediction
Scheduling (production processes)
Machine learning
Variable (mathematics)
Cache
Sampling (signal processing)
Variety (cybernetics)
Artificial intelligence
최신 정부 과제
11
과제 전체보기
1
2025년 3월-2032년 12월
|112,520,000
발생가능한 복합재난 신속 예측 및 연속적인 재난 예방을 위한 디지털 혁신요소기술 개발
대한민국 전역을 하나의 이기종 그래프로 표현하고 사람 중심 실시간 재난 인지 데이터를 언어모델로 학습해, 복합재난을 사전에 예측하고 자율 대응하는 AGI 개발
인공 일반 지능
이기종 그래프
거대 언어모델
멀티모달
재난관리
2
주관|
2021년 8월-2024년 2월
|95,515,000
필터 버블 완화를 위한 그래프 기반 데이터 큐레이션 모델 연구
GrC 기반 정보 네트워크 구성 연구 - 집단지성에 의한 소셜 데이터를 기반으로 문서 간 동질성과 이질성이 반영되는 특징 매트릭스 구성 연구를 수행 - 모호성을 고려하기 위해 세분화 컴퓨팅 패러다임을 활용한 특징 매트릭스 구성 연구를 수행 - 그래프 분석 과정에서 부하를 줄이기 위해 그래프 차원 감소(graph dimension reduction) 기법 연구를 수행 그래프 분석을 위한 문서 전처리 연구 - 다양한 매체에서 발생하는 정보를 추출 및 요약하기 위해 인공신경망(Artificial Neural Network) 기반 RNN(Recurrent Neural Networks) 및 LSTM(Long Short-Term Memory), BERT(Bidirectional Encoder Representations from Transformers), GPT-3(Generative Pre-trained Transformer 3)를 이용한 연구를 진행함 - 대용량 그래프 처리를 위한 그래프 전처리 기술을 연구함 - 단어 임베딩(word embedding) 기법을 활용하여 ‘클릭 베이트’를 유도하는 특징을 추출하고 신뢰성이 떨어지는 컨텐츠의 특징을 추출함 대용량 그래프 데이터 분석 및 처리 연구 - 매체 간 관계, 정보의 특성을 반영하기 위해 어탠션 메커니즘(Attention Mechanism)을 활용한 그래프 구축 - 대용량 그래프를 생성하기 위한 소셜 데이터 전처리 기술 연구 - 사전 학습된 그래프를 활용하여 추가되는 노드와 속성에 대해서 fine tuning할 수 있는 기술 연구 - 그래프 분석 과정에서 batch, attention, layer의 3중 병렬화를 통해 대규모 그래프 데이터 효과적으로 처리하는 기술 연구 GNN 기반 그래프 분석 연구 - 다른 성질의 node와 edge를 포함한 방향성 그래프를 분석하기 위해 HetSANN(Heterogeneous Graph Structural Attention Neural Network)를 이용한 연구를 진행함 - 그래프의 구조적인 정보를 분석하기 위해 meta-path와 RandomWalk를 이용한 연구를 진행함 GCN기반 이기종 정보 그래프 분류 모델 - 출처에 따라 인접행렬의 가중치를 다르게 구성하여 출처, 문서 정보를 모두 반영하는 GCN 모델의 성능 향상 연구 - 어탠션 메커니즘을 사용하여 매체 간 관계를 저차원 인접행렬에 반영하는 기법 연구를 수행 - 동질성있는 문서를 분석하고 이를 그래프 단위로 분류하는 그래프 분류기술 연구를 수행 그래프 Link Prediction 기술 - 기존의 휴리스틱(heuristic)한 방법이 아닌 GNN 기반의 Link Prediction을 통해 node간의 edge에 대한 가정 없이 link prediction 기술 연구 - 그래프의 편향성을 완화하기 위해 어탠션 메커니즘을 통해 각기 다른 가중치를 부여하여 편향성 완화 기술 연구 그래프 기반 데이터 큐레이션 - 매체 간 관계, 정보의 특성을 반영하기 위해 어탠션 메커니즘(Attention Mechanism)을 활용 - 딥러닝을 기반으로한 큐레이션 연구 진행 - (GNN)이웃 노드(Data)의 요소(Attribute)간 상관관계를 가중치로 대상 정점마다 다른 연결성과 영향력을 데이터 편향을 방지하기 위한 ‘이질성’ 값으로 사용하기 위한 학습 연구를 수행 - (GCN)인접 노드의 요소 정보를 바탕으로 학습을 진행하고 인접 노드의 요소정보 평균을 취하여 반영하여 노드 간 동질성 관계를 파악하기 위한 연구를 수행 그래프 기반 애플리케이션 기술 연구 - 일부 라벨링(labeling)된 ‘클릭 베이트’의 특성을 통해 신뢰성이 떨어지는 문서, 매체를 식별하는 준 지도학습(semi-supervised learning)기술을 연구를 수행 - 큐레이션 정보의 신뢰성 평가 및 제공 기술 연구를 수행
그래프 분석
지식 큐레이션
필터버블
정보 네트워크
딥러닝
그래프 신경망
세분화 된 컴퓨팅
3
주관|
2021년 8월-2024년 2월
|95,515,000
필터 버블 완화를 위한 그래프 기반 데이터 큐레이션 모델 연구
- 집단지성에 의한 소셜 데이터를 기반으로 문서 간 동질성과 이질성이 반영되는 특징 매트릭스를 구성했습니다. - 모호성을 고려하기 위해 세분화 컴퓨팅 패러다임을 활용한 특징 매트릭스를 구성했습니다. - 그래프 분석 과정에서 부하를 줄이기 위해 그래프 차원 감소 기법을 연구했습니다. - 다양한 매체에서 발생하는 정보를 추출 및 요약하기 위해 인공신경망 기반 RNN, LSTM, BERT, GPT-3를 이용한 연구를 진행했습니다. - 대용량 그래프 처리를 위한 그래프 전처리 기술을 연구했습니다. - 단어 임베딩 기법을 활용하여 ‘클릭 베이트’를 유도하는 특징을 추출하고 신뢰성이 떨어지는 컨텐츠의 특징을 추출했습니다. - 매체 간 관계, 정보의 특성을 반영하기 위해 어탠션 메커니즘을 활용한 그래프를 구축했습니다. - 대용량 그래프를 생성하기 위한 소셜 데이터 전처리 기술을 연구했습니다. - 사전 학습된 그래프를 활용하여 추가되는 노드와 속성에 대해서 fine tuning할 수 있는 기술을 연구했습니다. - 다른 성질의 node와 edge를 포함한 방향성 그래프를 분석하기 위해 HetSANN을 이용한 연구를 진행했습니다. - 그래프의 구조적인 정보를 분석하기 위해 meta-path와 RandomWalk를 이용한 연구를 진행했습니다. - 출처에 따라 인접행렬의 가중치를 다르게 구성하여 출처, 문서 정보를 모두 반영하는 GCN 모델의 성능을 향상시켰습니다. - 어탠션 메커니즘을 사용하여 매체 간 관계를 저차원 인접행렬에 반영하는 기법을 연구했습니다. - 동질성있는 문서를 분석하고 이를 그래프 단위로 분류하는 그래프 분류기술을 연구했습니다. - 기존의 휴리스틱한 방법이 아닌 GNN 기반의 Link Prediction을 통해 node간의 edge에 대한 가정 없이 link prediction 기술을 연구했습니다. - 그래프의 편향성을 완화하기 위해 어탠션 메커니즘을 통해 각기 다른 가중치를 부여하여 편향성 완화 기술을 연구했습니다. - 매체 간 관계, 정보의 특성을 반영하기 위해 어탠션 메커니즘을 활용하여 개인에게 적합한 정보를 큐레이션하는 연구를 진행했습니다.
그래프 분석
지식 큐레이션
필터버블
정보 네트워크
딥러닝
그래프 신경망
세분화 된 컴퓨팅
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
공개2024행동 주파수 분석 기반 수어 번역 장치 및 그 방법1020240123638
등록2022재난 대응을 위한 도로 네트워크 관리 시스템 및 방법1020220029593
등록2020개인정보 보호를 위해 개선된 스마트 컨트랙트 기반의 지능형 중개를 위한 장치 및 방법1020200134466
전체 특허

행동 주파수 분석 기반 수어 번역 장치 및 그 방법

상태
공개
출원연도
2024
출원번호
1020240123638

재난 대응을 위한 도로 네트워크 관리 시스템 및 방법

상태
등록
출원연도
2022
출원번호
1020220029593

개인정보 보호를 위해 개선된 스마트 컨트랙트 기반의 지능형 중개를 위한 장치 및 방법

상태
등록
출원연도
2020
출원번호
1020200134466

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.