RnDCircle Logo
황혜수 연구실
서울시립대학교 컴퓨터과학부 황혜수 교수
그래프 딥러닝 자기지도학습(적응적 SSL) 프레임워크
비지도 그래프 표현 학습/대조학습(UED)과 과평탄화 완화
이질 간선·동적 환경을 고려한 GNN 추천(IGTN)
연구 영역
기본 정보
논문·특허
과제
구성원

황혜수 연구실

서울시립대학교 컴퓨터과학부 황혜수 교수

황혜수 연구실은 서울시립대학교를 기반으로 그래프 신경망, 빅데이터 분석, 고차원 데이터 샘플링 등 첨단 데이터 과학 분야에서 활발한 연구를 수행하고 있습니다. 연구실은 그래프 구조의 데이터에서 발생하는 다양한 문제를 해결하기 위한 신경망 모델과 알고리즘 개발에 주력하고 있으며, 실제 추천 시스템, 정보 검색, 소셜 네트워크 분석 등 다양한 응용 분야에 연구 성과를 적용하고 있습니다. 특히, 비지도 그래프 표현 학습과 그래프 신경망 기반 추천 시스템 연구를 통해, 이질적인 데이터와 동적 환경에서도 높은 성능을 유지할 수 있는 모델을 개발하고 있습니다. 이러한 연구는 대규모 그래프 데이터의 복잡한 구조와 특성을 효과적으로 반영하여, 데이터 분석의 정확도와 효율성을 동시에 향상시키는 데 기여하고 있습니다. 또한, 연구실은 빅데이터 환경에서의 효율적인 데이터 구조와 알고리즘 개발에도 앞장서고 있습니다. Balanced Canopy Clustering을 활용한 k-최근접 이웃 그래프 생성, 고차원 데이터 샘플링 기법 등은 대용량 데이터의 실시간 분석과 지식 발굴에 필수적인 기술로, 다양한 산업 및 학문 분야에서 활용되고 있습니다. 시계열 데이터 분석, 고차원 데이터의 차원 축소 및 샘플링, 그리고 데이터 기반 의사결정 지원 등도 연구실의 주요 연구 주제입니다. 이러한 연구는 의료, 금융, 제조 등 다양한 분야에서 데이터 기반 혁신을 이끌고 있습니다. 황혜수 연구실은 앞으로도 그래프 딥러닝, 빅데이터 분석, 고차원 데이터 처리 등 데이터 과학 전반에 걸친 이론적·실용적 연구를 지속하여, 인공지능 및 데이터 기반 사회의 발전에 기여할 것입니다.

그래프 딥러닝 자기지도학습(적응적 SSL) 프레임워크비지도 그래프 표현 학습/대조학습(UED)과 과평탄화 완화이질 간선·동적 환경을 고려한 GNN 추천(IGTN)가중집합 샘플링(ICWS) 기반 효율적 Top-k 검색/유사도 추정k-NN 그래프 생성·근사(kNN graph construction/LSH) 알고리즘
대표 연구 분야
연구 영역 전체보기
다중 매개변수 MRI 임베딩 기반 직장암 pCR 예측 thumbnail
다중 매개변수 MRI 임베딩 기반 직장암 pCR 예측
Multi-Parametric MRI Embedding for Rectal Cancer pCR Prediction
연구 분야 상세보기
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.
주요 논문
3
논문 전체보기
1
Article
|
·
인용수 0
·
2025
Balancing Decorrelation and Label Predictability for Deep Graph Representation Learning
Naeun Park, Heasoo Hwang
https://doi.org/10.1109/bigdata66926.2025.11402201
Decorrelation
Predictability
Representation (politics)
Graph
Deep learning
2
Article
|
·
인용수 0
·
2024
UED: Unsupervised Graph Representation Learning Model Using an Edge Discriminator and a Decoupling Encoder
H. C. Lee, Heasoo Hwang
KIISE Transactions on Computing Practices
비지도 그래프 표현 학습은 과평탄화로 인해 정점 표현의 품질이 저하될 수 있다. 과평탄화의 주요 원인은 이질적인 이웃 정점의 병합, 그래프 합성곱에서 전파와 특징 변환의 결합이다. 이를 해결하기 위해 본 연구는 간선 판별기와 탈결합 인코더를 사용하는 비지도 그래프 대조 학습 모델인 UED를 제안한다. 구체적으로, 간선 판별기는 이질적 이웃 정점 병합으로 인한 과평탄화를 완화하고, 탈결합 인코더는 전파와 특징 변환의 결합으로 인한 과평탄화를 완화한다. 또, 데이터셋의 성질을 고려하여 특징 정보 기반의 kNN(k-Nearest Neighbor)과 구조 정보 기반의 kNN을 이용하여 양성 샘플링한다. 6개의 이질 간선 그래프 데이터셋에서 정점 분류 실험을 수행하여 제안 방법의 효과를 입증했다.
https://doi.org/10.5626/ktcp.2024.30.7.330
Discriminator
Encoder
Decoupling (probability)
Computer science
Graph
Representation (politics)
Artificial intelligence
Enhanced Data Rates for GSM Evolution
Feature learning
Pattern recognition (psychology)
3
Article
|
인용수 8
·
2021
Pathologic Complete Response Prediction after Neoadjuvant Chemoradiation Therapy for Rectal Cancer Using Radiomics and Deep Embedding Network of MRI
Seung Hyun Lee, Joon Seok Lim, Jaeseung Shin, Sung‐Won Kim, Heasoo Hwang
IF 2.838 (2021)
Applied Sciences
신보조 화학방사선치료(nCRT) 후 자기공명영상(MRI)에 대한 평가는 직장암 병기 설정과 치료 계획 수립에 필수적이다. 그러나 직장암 환자에서 nCRT 이후 병리학적 완전 반응(pCR)을 예측할 때, 기존 연구들은 방사믹스 특징에 기반한 단순 정량 평가 또는 다중-매개변수 MRI를 부분적으로 분석하는 방식에 주로 의존해 왔다. 우리는 새로운 다중-매개변수 MRI 임베딩을 기반으로 하는 효과적인 pCR 예측 방법을 제안한다. 먼저, 여러 MRI 시퀀스를 함께 분석할 때에만 확인할 수 있는 종양의 체적 특징을 추출하고자 한다. 구체적으로, 다수의 MRI 시퀀스를 다중-시퀀스 융합 영상(MSFI)으로 캡슐화하고 MSFI 임베딩을 생성한다. 종양의 중요한 특성을 포착하는 방사믹스 특징을 MSFI 임베딩과 결합하여 다중-매개변수 MRI 임베딩을 만들고, 이를 무작위 포레스트 분류기를 사용해 pCR을 예측하는 데 활용한다. 광범위한 실험 결과, 차원 축소 방법과 무관하게 주어진 모든 MRI 시퀀스를 사용하는 것이 가장 효과적임을 확인하였다. 제안된 방법은 서로 다른 특징 벡터 조합과 차원 축소 방법 또는 다른 분류 모델을 사용하는 모든 변형들보다 우수하였다. 비교 실험에서 제안된 방법은 AUC와 F1-score 측면에서 네 가지 경쟁적 기준 모델들보다 우수함을 보였다. 우리는 직장암 환자 912명의 MRI 시퀀스를 사용하였으며, 이는 기존 연구들 가운데 가장 큰 표본 규모이다.
https://doi.org/10.3390/app11209494
Magnetic resonance imaging
Radiomics
Merge (version control)
Computer science
Grading (engineering)
Artificial intelligence
Colorectal cancer
Embedding
Pattern recognition (psychology)
Random forest
최신 정부 과제
7
과제 전체보기
1
2022년 2월-2025년 2월
|85,534,000
그래프 딥러닝을 위한 적응적 자기지도학습 프레임워크
본 연구에서는 그래프 딥러닝을 위한 자기지도학습의 (1) 학습데이터 샘플링 고도화 (2) 그래프 데이터 고도화 (3) 학습 태스크 다양화 라는 세 가지 연구주제를 선정하였다. 본 연구를 통해 레이블링 되지 않은 대량의 그래프 데이터로부터 데이터의 지형 및 특성을 최대한 발굴해내고 이를 목표 태스크에 적응적으로 전이함으로써 그래프 딥러닝 목표 태스크 성능을 ...
그래프 데이터
자기지도학습
전이학습
데이터 샘플링
데이터 증강
다중작업학습
일관성 학습
대조 학습
2
주관|
2022년 2월-2025년 2월
|95,037,000
그래프 딥러닝을 위한 적응적 자기지도학습 프레임워크
[연구주제1] 자기지도학습을 위한 학습데이터 샘플링 고도화 (Adaptive Graph Data Sampling) • 자기지도학습 시 대용량 그래프 데이터 자체를 학습데이터로 사용해야 하는데, 학습 소요시간을 줄이기 위해 무작위 샘플링하여 사용하는 경우가 일반적임 • 본 연구에서는 자기지도학습 단계 및 그래프 데이터와 목표 태스크의 특성에 맞추어 적응적으로 학습데이터의 난이도를 조정함으로써 학습 효과를 극대화하기 위하여 강화학습 (reinforced learning)에 기반한 학습데이터 샘플러를 제안함 • 긍정 학습데이터와 부정 학습데이터 각각의 난이도를 적응적으로 조절하기 위하여 각 학습데이터 샘플러를 반대 방향으로 학습하여 난이도가 낮은 샘플, 난이도가 높은 샘플을 선택하도록 샘플러를 세분화함 • 링크가 부족한 데이터의 경우 무작위 링크와 top-k 링크[AMGCN20]를 추가한 후 강화학습의 학습데이터로 사용함으로써 더 우수한 강화학습 성능을 달성함을 사전실험에서 확인하였음 • 연구과제 사전검증을 위한 사전실험결과 [그림4]에 따르면, [그림3]의 두 그래프 데이터 상에서 난이도 높은 부정 학습데이터 샘플러 (hard negative data sampler)와 부정 학습데이터 생성기 (negative data generator)를 동시에 사용했을 때 적응적 학습데이터 선정 관련 최신연구인 [AGE20] 보다 성능이 더 우수함을 알 수 있음 [연구주제2] 자기지도학습을 위한 그래프 데이터 고도화 (Adaptive Graph Data Generation) • 주어진 그래프 데이터를 학습데이터로 사용하여 자기지도학습을 수행하고 이를 목표 태스크에 전이하여 목표 태스크 성능을 향상하는 경우가 일반적임 • 본 연구에서는 전체 그래프 데이터를 학습데이터로 활용하는 것에서 나아가 그래프 데이터를 확장하고 확장된 그래프 데이터를 이용해 기존 자기지도학습 태스크의 성능을 개선하거나 새로운 자기지도학습 태스크를 수행하고 이를 목표 태크스에 전이하여 목표 태스크 성능을 좀 더 개선하는 방법을 제안함 [연구주제3] 그래프 데이터를 이용한 자기지도학습 태스크 다양화 (Auxiliary Tasks for Graph Transfer Learning) • 목표 태스크의 보조 태스크로는 주어진 그래프 데이터 복원 태스크가 흔히 사용되나, 그래프 데이터나 목표 태스크 종류에 따라 주어진 그래프 데이터의 복원 태스크 학습 결과를 전이하면 오히려 목표 태스크의 성능이 저하되는 경우를 사전실험에서 관찰하였음 • 본 연구에서는 보조 태스크를 다양화하여 주어진 그래프의 데이터 지형 및 특성을 최대한 발굴해내어 이를 목표 태스크에 전이함으로써 목표 태스크 성능을 안정적으로 향상하는데 기여하고자 함. 이를 위해 아래 네 종류의 그래프 데이터 자기지도학습 태스크를 선정하였으며 이들의 전이 효과를 다양한 그래프 데이터와 목표 태스크를 사용하여 실험하고 보조 태스크 간 상호관계를 분석하고자 함 • 사전실험결과인 [그림5]에서 세 가지의 그래프 전이학습 최신연구결과를 일반 그래프 합성곱 신경망 결과와 비교하였음. 그래프 증강 후 일관성 학습[NodeAug20], 주어진 그래프 데이터 복원 태스크로 사전학습 후 미세조정[GPTGNN20], 주어진 그래프 데이터 복원 태스크로 적응적 전이학습[AUXTS21], 이 세 방법 모두 [그림3]의 두 그래프 데이터셋에서 일관되게 목표 태스크인 노드 분류의 정확도를 향상함을 확인하였으나 셋 중 뚜렷한 우세를 보이는 방법을 선택할 수는 없는 상황임
그래프 데이터
자기지도학습
전이학습
데이터 샘플링
데이터 증강
다중작업학습
일관성 학습
대조 학습
3
주관|
2019년 2월-2022년 2월
|100,000,000
지식 발굴을 위한 빅데이터 분석 프레임워크 개발
제안하는 빅데이터 분석 프레임워크는 아래 4개의 단계로 구성되며 각 단계의 주요 연구 내용은 다음과 같음 [1단계] 데이터 특성 파악 & 데이터 표현형 생성 1) Clustering Engine과 Feature Interaction Analyzer는 전체 데이터로부터 데이터 구조와 데이터 특징 간 연관관계를 분석하며 Representation Learner는 이를 활용하여 고품질의 데이터 표현형을 생성함 2) Clustering Engine은 다양한 군집 간 분리도 (Cluster Separability) 분석 기능을 포함하여 하며 LSH (Locality-Sensitive Hashing) 기반 샘플링 기법 [BCWS] 을 이용하여 차원 축소 후 군집화함으로써 반복되는 군집화의 시간 비용을 절약하고자 함 3) Feature Interaction Analyzer와 Representation Learner는 FM (Factorization Machine)과 신경망을 결합한 Neural FM 구조를 기반으로 함. 두 부분이 통합되어 동시에 학습될 수도 있음 4) Feature Interaction Analyzer에서 2018년 Amazon에서 제안한 것처럼 다양한 고차특징 (High-order Feature)을 생성한 후 이를 분석하여 표현형 학습에 사용하는 방식도 고려함 [2단계] 목적함수 구성 & 지식 활용 1) Objective Function Generator는 1단계에서 학습한 데이터 구조, 데이터 특징 간 연관관계 및 데이터 표현형을 통합적으로 활용하여 목적함수를 구성함 2) Knowledge-aware DNNs는 다양한 신경망을 결합하여 구성할 계획인데 기본적으로는GAN과 다중작업학습(MTL)에 기반한 신경망 구조를 사용함. 비지도학습이 아니라 가용 빅데이터 전체를 사용한 준지도학습을 시행하며 관련 도메인의 다른 빅데이터와 여러 목적함수들을 이용하여 동시 학습을 진행함으로써 더 강건한 (Robust) 데이터 표현형으로 개선하고 이에 바탕 하여 고품질의 딥러닝을 수행하고자 함 3) 이 때, 주어진 빅데이터를 위한 다중작업학습(MTL)을 실행하기 위하여 다양한 도메인의 빅데이터 및 메타데이터를 이미 보유하고 있다고 가정함 4) Knowledge-aware DNNs 내에 패턴 추출을 위한 지식을 학습하기 위하여 주의집중 신경망 (Attention Network)을 포함하고자 하며, 이는 주어진 데이터의 주요 특성에 해당하는 선택적 주의집중 정도를 학습하게 됨 [3단계] 데이터 탐색 & 지식 추출 1) Knowledge Explorer는 데이터 분석을 통한 지식 추출을 원하는 사용자에게 데이터 분석의 결과 도출된 지식 (주요패턴, 유사도, 새로운 군집 정보 등)을 제공하는 부분으로, 사용자는 Knowledge Explorer를 통해 이를 탐색하고 주요 지식을 추출하는 활동을 함 2) Knowledge Explorer는 1단계와 2단계의 중간/최종 결과물들 (군집 정보, 특징 간 상호작용 정보, Knowledge-aware DNNs 내 정보 등)을 통합적으로 활용하여 지식을 도출하여야 하는데, Knowledge Explorer를 위한 알고리즘이 전체 데이터 분석 프레임워크 가운데 가장 연구 난이도가 높을 것으로 예상됨 [4단계] 지식 추출 및 활용의 선순환 1) Knowledge Explorer를 통해 추출한 사용자가 추출한 신규 지식을 전체 분석 프레임워크에 반영할 때 이러한 작업이 반복될 수 있으므로 프레임워크 내 모든 부분이 점진적으로 개선되도록 각 알고리즘의 효율성을 향상해야 함 2) 추출된 지식의 활용을 통하여 예측정확도의 추가 향상과 더 고품질의 지식 추출이 동시에 가능해야 함
데이터분석
지식추출
빅데이터
딥러닝
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
공개2024비지도 그래프 표현 학습 모델 및 이를 이용한 학습 방법1020240079705
전체 특허

비지도 그래프 표현 학습 모델 및 이를 이용한 학습 방법

상태
공개
출원연도
2024
출원번호
1020240079705
연구실 하이라이트
연구실의 정보를 AI가 요약해서 키워드 중심으로 정리해두었어요
기술파급력
재학습 없는 동적 추천 시스템
AI 요약 확인하기
독창적기술
GNN 성능 저하의 핵심, 과평탄화 문제 해결
AI 요약 확인하기
기술파급력
5배 빠른 초고속 k-NN 그래프 생성 기술
AI 요약 확인하기
상용화성공
MRI 영상 딥러닝 기반 직장암 치료 반응 예측
AI 요약 확인하기
연구자역량
대규모 그래프 검색의 권위자: ObjectRank & BinRank
AI 요약 확인하기
독창적기술
고차원 데이터 유사도 분석을 위한 초고속 샘플링
AI 요약 확인하기
맞춤형 인사이트 리포트
연구실의 전체 데이터를 활용한 맞춤형 인사이트 리포트
연구 트렌드부터 공동 연구 방향성 기획까지
연구실과 같이 할 수 있는게 무엇인지,
지금 바로 확인해보세요
무료 리포트 확인하기