황혜수 교수 연구실 | 서울시립대학교 컴퓨터과학부

황혜수 연구실

서울시립대학교 컴퓨터과학부 황혜수 교수

그래프 딥러닝 자기지도학습(적응적 SSL) 프레임워크

비지도 그래프 표현 학습/대조학습(UED)과 과평탄화 완화

이질 간선·동적 환경을 고려한 GNN 추천(IGTN)

|황혜수 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

홈

황혜수 연구실

서울시립대학교 컴퓨터과학부 황혜수 교수

황혜수 연구실은 서울시립대학교를 기반으로 그래프 신경망, 빅데이터 분석, 고차원 데이터 샘플링 등 첨단 데이터 과학 분야에서 활발한 연구를 수행하고 있습니다. 연구실은 그래프 구조의 데이터에서 발생하는 다양한 문제를 해결하기 위한 신경망 모델과 알고리즘 개발에 주력하고 있으며, 실제 추천 시스템, 정보 검색, 소셜 네트워크 분석 등 다양한 응용 분야에 연구 성과를 적용하고 있습니다. 특히, 비지도 그래프 표현 학습과 그래프 신경망 기반 추천 시스템 연구를 통해, 이질적인 데이터와 동적 환경에서도 높은 성능을 유지할 수 있는 모델을 개발하고 있습니다. 이러한 연구는 대규모 그래프 데이터의 복잡한 구조와 특성을 효과적으로 반영하여, 데이터 분석의 정확도와 효율성을 동시에 향상시키는 데 기여하고 있습니다. 또한, 연구실은 빅데이터 환경에서의 효율적인 데이터 구조와 알고리즘 개발에도 앞장서고 있습니다. Balanced Canopy Clustering을 활용한 k-최근접 이웃 그래프 생성, 고차원 데이터 샘플링 기법 등은 대용량 데이터의 실시간 분석과 지식 발굴에 필수적인 기술로, 다양한 산업 및 학문 분야에서 활용되고 있습니다. 시계열 데이터 분석, 고차원 데이터의 차원 축소 및 샘플링, 그리고 데이터 기반 의사결정 지원 등도 연구실의 주요 연구 주제입니다. 이러한 연구는 의료, 금융, 제조 등 다양한 분야에서 데이터 기반 혁신을 이끌고 있습니다. 황혜수 연구실은 앞으로도 그래프 딥러닝, 빅데이터 분석, 고차원 데이터 처리 등 데이터 과학 전반에 걸친 이론적·실용적 연구를 지속하여, 인공지능 및 데이터 기반 사회의 발전에 기여할 것입니다.

그래프 딥러닝 자기지도학습(적응적 SSL) 프레임워크비지도 그래프 표현 학습/대조학습(UED)과 과평탄화 완화이질 간선·동적 환경을 고려한 GNN 추천(IGTN)가중집합 샘플링(ICWS) 기반 효율적 Top-k 검색/유사도 추정k-NN 그래프 생성·근사(kNN graph construction/LSH) 알고리즘

대표 연구 분야

연구 영역 전체보기

다중 매개변수 MRI 임베딩 기반 직장암 pCR 예측

Multi-Parametric MRI Embedding for Rectal Cancer pCR Prediction

연구 분야 상세보기

다중 매개변수 MRI 임베딩 기반 직장암 pCR 예측

Multi-Parametric MRI Embedding for Rectal Cancer pCR Prediction

연구 분야 상세보기

간선 판별기와 탈결합 인코더 기반 비지도 그래프 표현 학습

Unsupervised Graph Representation Learning with Edge Discriminator and Decoupling Encoder

연구 분야 상세보기

데코렐레이션과 라벨 예측 가능성의 균형을 통한 적응적 자기지도 학습

Adaptive Self-Supervised Learning Balancing Decorrelation and Label Predictability

연구 분야 상세보기

연구 성과 추이

표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

주요 논문

논문 전체보기

Article

인용수 0

2025

Balancing Decorrelation and Label Predictability for Deep Graph Representation Learning

Naeun Park, Heasoo Hwang

https://doi.org/10.1109/bigdata66926.2025.11402201

Decorrelation

Predictability

Representation (politics)

Graph

Deep learning

Article

인용수 0

2024

UED: Unsupervised Graph Representation Learning Model Using an Edge Discriminator and a Decoupling Encoder

H. C. Lee, Heasoo Hwang

KIISE Transactions on Computing Practices

비지도 그래프 표현 학습은 과평탄화로 인해 정점 표현의 품질이 저하될 수 있다. 과평탄화의 주요 원인은 이질적인 이웃 정점의 병합, 그래프 합성곱에서 전파와 특징 변환의 결합이다. 이를 해결하기 위해 본 연구는 간선 판별기와 탈결합 인코더를 사용하는 비지도 그래프 대조 학습 모델인 UED를 제안한다. 구체적으로, 간선 판별기는 이질적 이웃 정점 병합으로 인한 과평탄화를 완화하고, 탈결합 인코더는 전파와 특징 변환의 결합으로 인한 과평탄화를 완화한다. 또, 데이터셋의 성질을 고려하여 특징 정보 기반의 kNN(k-Nearest Neighbor)과 구조 정보 기반의 kNN을 이용하여 양성 샘플링한다. 6개의 이질 간선 그래프 데이터셋에서 정점 분류 실험을 수행하여 제안 방법의 효과를 입증했다.

https://doi.org/10.5626/ktcp.2024.30.7.330

Discriminator

Encoder

Decoupling (probability)

Computer science

Graph

Representation (politics)

Artificial intelligence

Enhanced Data Rates for GSM Evolution

Feature learning

Pattern recognition (psychology)

Article

인용수 8

2021

Pathologic Complete Response Prediction after Neoadjuvant Chemoradiation Therapy for Rectal Cancer Using Radiomics and Deep Embedding Network of MRI

Seung Hyun Lee, Joon Seok Lim, Jaeseung Shin, Sung‐Won Kim, Heasoo Hwang

IF 2.838 (2021)

Applied Sciences

신보조 화학방사선치료(nCRT) 후 자기공명영상(MRI)에 대한 평가는 직장암 병기 설정과 치료 계획 수립에 필수적이다. 그러나 직장암 환자에서 nCRT 이후 병리학적 완전 반응(pCR)을 예측할 때, 기존 연구들은 방사믹스 특징에 기반한 단순 정량 평가 또는 다중-매개변수 MRI를 부분적으로 분석하는 방식에 주로 의존해 왔다. 우리는 새로운 다중-매개변수 MRI 임베딩을 기반으로 하는 효과적인 pCR 예측 방법을 제안한다. 먼저, 여러 MRI 시퀀스를 함께 분석할 때에만 확인할 수 있는 종양의 체적 특징을 추출하고자 한다. 구체적으로, 다수의 MRI 시퀀스를 다중-시퀀스 융합 영상(MSFI)으로 캡슐화하고 MSFI 임베딩을 생성한다. 종양의 중요한 특성을 포착하는 방사믹스 특징을 MSFI 임베딩과 결합하여 다중-매개변수 MRI 임베딩을 만들고, 이를 무작위 포레스트 분류기를 사용해 pCR을 예측하는 데 활용한다. 광범위한 실험 결과, 차원 축소 방법과 무관하게 주어진 모든 MRI 시퀀스를 사용하는 것이 가장 효과적임을 확인하였다. 제안된 방법은 서로 다른 특징 벡터 조합과 차원 축소 방법 또는 다른 분류 모델을 사용하는 모든 변형들보다 우수하였다. 비교 실험에서 제안된 방법은 AUC와 F1-score 측면에서 네 가지 경쟁적 기준 모델들보다 우수함을 보였다. 우리는 직장암 환자 912명의 MRI 시퀀스를 사용하였으며, 이는 기존 연구들 가운데 가장 큰 표본 규모이다.

https://doi.org/10.3390/app11209494

Magnetic resonance imaging

Radiomics

Merge (version control)

Computer science

Grading (engineering)

Artificial intelligence

Colorectal cancer

Embedding

Pattern recognition (psychology)

Random forest

최신 정부 과제

과제 전체보기

2022년 2월-2025년 2월

|85,534,000원

그래프 딥러닝을 위한 적응적 자기지도학습 프레임워크

본 연구에서는 그래프 딥러닝을 위한 자기지도학습의 (1) 학습데이터 샘플링 고도화 (2) 그래프 데이터 고도화 (3) 학습 태스크 다양화 라는 세 가지 연구주제를 선정하였다. 본 연구를 통해 레이블링 되지 않은 대량의 그래프 데이터로부터 데이터의 지형 및 특성을 최대한 발굴해내고 이를 목표 태스크에 적응적으로 전이함으로써 그래프 딥러닝 목표 태스크 성능을 ...

그래프 데이터

자기지도학습

전이학습

데이터 샘플링

데이터 증강

다중작업학습

일관성 학습

대조 학습

주관|

2022년 2월-2025년 2월

|95,037,000원

그래프 딥러닝을 위한 적응적 자기지도학습 프레임워크

[연구주제1] 자기지도학습을 위한 학습데이터 샘플링 고도화 (Adaptive Graph Data Sampling) • 자기지도학습 시 대용량 그래프 데이터 자체를 학습데이터로 사용해야 하는데, 학습 소요시간을 줄이기 위해 무작위 샘플링하여 사용하는 경우가 일반적임 • 본 연구에서는 자기지도학습 단계 및 그래프 데이터와 목표 태스크의 특성에 맞추어 적응적으로 학습데이터의 난이도를 조정함으로써 학습 효과를 극대화하기 위하여 강화학습 (reinforced learning)에 기반한 학습데이터 샘플러를 제안함 • 긍정 학습데이터와 부정 학습데이터 각각의 난이도를 적응적으로 조절하기 위하여 각 학습데이터 샘플러를 반대 방향으로 학습하여 난이도가 낮은 샘플, 난이도가 높은 샘플을 선택하도록 샘플러를 세분화함 • 링크가 부족한 데이터의 경우 무작위 링크와 top-k 링크[AMGCN20]를 추가한 후 강화학습의 학습데이터로 사용함으로써 더 우수한 강화학습 성능을 달성함을 사전실험에서 확인하였음 • 연구과제 사전검증을 위한 사전실험결과 [그림4]에 따르면, [그림3]의 두 그래프 데이터 상에서 난이도 높은 부정 학습데이터 샘플러 (hard negative data sampler)와 부정 학습데이터 생성기 (negative data generator)를 동시에 사용했을 때 적응적 학습데이터 선정 관련 최신연구인 [AGE20] 보다 성능이 더 우수함을 알 수 있음 [연구주제2] 자기지도학습을 위한 그래프 데이터 고도화 (Adaptive Graph Data Generation) • 주어진 그래프 데이터를 학습데이터로 사용하여 자기지도학습을 수행하고 이를 목표 태스크에 전이하여 목표 태스크 성능을 향상하는 경우가 일반적임 • 본 연구에서는 전체 그래프 데이터를 학습데이터로 활용하는 것에서 나아가 그래프 데이터를 확장하고 확장된 그래프 데이터를 이용해 기존 자기지도학습 태스크의 성능을 개선하거나 새로운 자기지도학습 태스크를 수행하고 이를 목표 태크스에 전이하여 목표 태스크 성능을 좀 더 개선하는 방법을 제안함 [연구주제3] 그래프 데이터를 이용한 자기지도학습 태스크 다양화 (Auxiliary Tasks for Graph Transfer Learning) • 목표 태스크의 보조 태스크로는 주어진 그래프 데이터 복원 태스크가 흔히 사용되나, 그래프 데이터나 목표 태스크 종류에 따라 주어진 그래프 데이터의 복원 태스크 학습 결과를 전이하면 오히려 목표 태스크의 성능이 저하되는 경우를 사전실험에서 관찰하였음 • 본 연구에서는 보조 태스크를 다양화하여 주어진 그래프의 데이터 지형 및 특성을 최대한 발굴해내어 이를 목표 태스크에 전이함으로써 목표 태스크 성능을 안정적으로 향상하는데 기여하고자 함. 이를 위해 아래 네 종류의 그래프 데이터 자기지도학습 태스크를 선정하였으며 이들의 전이 효과를 다양한 그래프 데이터와 목표 태스크를 사용하여 실험하고 보조 태스크 간 상호관계를 분석하고자 함 • 사전실험결과인 [그림5]에서 세 가지의 그래프 전이학습 최신연구결과를 일반 그래프 합성곱 신경망 결과와 비교하였음. 그래프 증강 후 일관성 학습[NodeAug20], 주어진 그래프 데이터 복원 태스크로 사전학습 후 미세조정[GPTGNN20], 주어진 그래프 데이터 복원 태스크로 적응적 전이학습[AUXTS21], 이 세 방법 모두 [그림3]의 두 그래프 데이터셋에서 일관되게 목표 태스크인 노드 분류의 정확도를 향상함을 확인하였으나 셋 중 뚜렷한 우세를 보이는 방법을 선택할 수는 없는 상황임

그래프 데이터

자기지도학습

전이학습

데이터 샘플링

데이터 증강

다중작업학습

일관성 학습

대조 학습

주관|

2019년 2월-2022년 2월

|100,000,000원

지식 발굴을 위한 빅데이터 분석 프레임워크 개발

제안하는 빅데이터 분석 프레임워크는 아래 4개의 단계로 구성되며 각 단계의 주요 연구 내용은 다음과 같음 [1단계] 데이터 특성 파악 & 데이터 표현형 생성 1) Clustering Engine과 Feature Interaction Analyzer는 전체 데이터로부터 데이터 구조와 데이터 특징 간 연관관계를 분석하며 Representation Learner는 이를 활용하여 고품질의 데이터 표현형을 생성함 2) Clustering Engine은 다양한 군집 간 분리도 (Cluster Separability) 분석 기능을 포함하여 하며 LSH (Locality-Sensitive Hashing) 기반 샘플링 기법 [BCWS] 을 이용하여 차원 축소 후 군집화함으로써 반복되는 군집화의 시간 비용을 절약하고자 함 3) Feature Interaction Analyzer와 Representation Learner는 FM (Factorization Machine)과 신경망을 결합한 Neural FM 구조를 기반으로 함. 두 부분이 통합되어 동시에 학습될 수도 있음 4) Feature Interaction Analyzer에서 2018년 Amazon에서 제안한 것처럼 다양한 고차특징 (High-order Feature)을 생성한 후 이를 분석하여 표현형 학습에 사용하는 방식도 고려함 [2단계] 목적함수 구성 & 지식 활용 1) Objective Function Generator는 1단계에서 학습한 데이터 구조, 데이터 특징 간 연관관계 및 데이터 표현형을 통합적으로 활용하여 목적함수를 구성함 2) Knowledge-aware DNNs는 다양한 신경망을 결합하여 구성할 계획인데 기본적으로는GAN과 다중작업학습(MTL)에 기반한 신경망 구조를 사용함. 비지도학습이 아니라 가용 빅데이터 전체를 사용한 준지도학습을 시행하며 관련 도메인의 다른 빅데이터와 여러 목적함수들을 이용하여 동시 학습을 진행함으로써 더 강건한 (Robust) 데이터 표현형으로 개선하고 이에 바탕 하여 고품질의 딥러닝을 수행하고자 함 3) 이 때, 주어진 빅데이터를 위한 다중작업학습(MTL)을 실행하기 위하여 다양한 도메인의 빅데이터 및 메타데이터를 이미 보유하고 있다고 가정함 4) Knowledge-aware DNNs 내에 패턴 추출을 위한 지식을 학습하기 위하여 주의집중 신경망 (Attention Network)을 포함하고자 하며, 이는 주어진 데이터의 주요 특성에 해당하는 선택적 주의집중 정도를 학습하게 됨 [3단계] 데이터 탐색 & 지식 추출 1) Knowledge Explorer는 데이터 분석을 통한 지식 추출을 원하는 사용자에게 데이터 분석의 결과 도출된 지식 (주요패턴, 유사도, 새로운 군집 정보 등)을 제공하는 부분으로, 사용자는 Knowledge Explorer를 통해 이를 탐색하고 주요 지식을 추출하는 활동을 함 2) Knowledge Explorer는 1단계와 2단계의 중간/최종 결과물들 (군집 정보, 특징 간 상호작용 정보, Knowledge-aware DNNs 내 정보 등)을 통합적으로 활용하여 지식을 도출하여야 하는데, Knowledge Explorer를 위한 알고리즘이 전체 데이터 분석 프레임워크 가운데 가장 연구 난이도가 높을 것으로 예상됨 [4단계] 지식 추출 및 활용의 선순환 1) Knowledge Explorer를 통해 추출한 사용자가 추출한 신규 지식을 전체 분석 프레임워크에 반영할 때 이러한 작업이 반복될 수 있으므로 프레임워크 내 모든 부분이 점진적으로 개선되도록 각 알고리즘의 효율성을 향상해야 함 2) 추출된 지식의 활용을 통하여 예측정확도의 추가 향상과 더 고품질의 지식 추출이 동시에 가능해야 함

데이터분석

지식추출

빅데이터

딥러닝

최신 특허

특허 전체보기

상태	출원연도	과제명	출원번호	상세정보
공개	2024	비지도 그래프 표현 학습 모델 및 이를 이용한 학습 방법	1020240079705

전체 특허

비지도 그래프 표현 학습 모델 및 이를 이용한 학습 방법

상태

공개

출원연도

2024

출원번호

1020240079705

상세 정보 바로가기

연구실 하이라이트

연구실의 정보를 AI가 요약해서 키워드 중심으로 정리해두었어요

기술파급력

재학습 없는 동적 추천 시스템

AI 요약 확인하기

독창적기술

GNN 성능 저하의 핵심, 과평탄화 문제 해결

AI 요약 확인하기

기술파급력

5배 빠른 초고속 k-NN 그래프 생성 기술

AI 요약 확인하기

상용화성공

MRI 영상 딥러닝 기반 직장암 치료 반응 예측

AI 요약 확인하기

연구자역량

대규모 그래프 검색의 권위자: ObjectRank & BinRank

AI 요약 확인하기

독창적기술

고차원 데이터 유사도 분석을 위한 초고속 샘플링

AI 요약 확인하기

맞춤형 인사이트 리포트

연구실의 전체 데이터를 활용한 맞춤형 인사이트 리포트

연구 트렌드부터 공동 연구 방향성 기획까지

연구실과 같이 할 수 있는게 무엇인지,
지금 바로 확인해보세요

무료 리포트 확인하기