RnDCircle Logo
arrow left icon

SDM Lab

성신여자대학교 수리통계데이터사이언스학부

정호현 교수

Topic Modeling

Network Analysis

Keyword Extraction

SDM Lab

수리통계데이터사이언스학부 정호현

SDM Lab(Statistical Data Mining Laboratory)은 성신여자대학교 수리통계데이터사이언스학부 소속으로, 대규모 및 복잡한 데이터의 분석을 위한 통계학, 기계학습, 딥러닝 기반의 첨단 연구를 수행하고 있습니다. 본 연구실은 이론적 통계학과 실제 응용 분야 간의 간극을 해소하고, 사회 네트워크, 의료, 정책, 산업 등 다양한 영역의 실제 문제를 해결하는 데 중점을 두고 있습니다. 주요 연구 분야로는 통계적 네트워크 과학, 사회 네트워크 분석, 베이지안 모델링, 시계열 네트워크 분석, 텍스트 마이닝 및 토픽 모델링 등이 있습니다. 네트워크 데이터의 성장 메커니즘, 부익부 빈익빈 현상, 노드의 적합성 및 인기 효과 등 복잡한 네트워크 내 동적 현상을 정량적으로 분석하고, 이를 기반으로 실제 사회 및 산업 현상에 대한 깊이 있는 해석을 제공합니다. 또한, 본 연구실은 베이지안 생성 모델, EM 알고리즘, MCMC, 시계열 회귀분석 등 다양한 첨단 통계 기법을 활용하여 시계열 네트워크, 의료 통계, 사용자-아이템 추천 시스템 등 다양한 데이터 유형을 분석합니다. 이를 통해 불확실성을 정량화하고, 데이터 기반의 신뢰성 높은 의사결정 지원을 실현하고 있습니다. 텍스트 마이닝 및 토픽 모델링 분야에서는 논문, 특허, SNS 등 비정형 데이터에서 핵심 키워드와 이머징 트렌드를 도출하여, R&D 투자, 정책 수립, 디지털 헬스케어 등 다양한 분야의 전략적 기획에 기여하고 있습니다. 설명 가능한 인공지능(XAI) 기법과 결합된 분석을 통해 해석력과 투명성을 높이고, 실제 현장에서 활용 가능한 데이터 분석 솔루션을 제공합니다. SDM Lab은 이론과 실무를 아우르는 융합적 연구를 통해, 데이터사이언스 및 통계학 분야의 혁신을 선도하고 있습니다. 다양한 국내외 연구 프로젝트와 산학협력, 학술대회 발표 등을 통해 연구 성과를 확산하고, 데이터 기반 사회의 발전에 기여하고 있습니다.

Topic Modeling
Network Analysis
Keyword Extraction
통계적 네트워크 과학 및 사회 네트워크 분석
통계적 네트워크 과학은 복잡한 네트워크 구조를 이해하고 분석하기 위한 통계적 방법론을 개발하는 분야입니다. 본 연구실에서는 소셜 네트워크, 과학 협업 네트워크, 사용자-아이템 이분 네트워크 등 다양한 실제 네트워크 데이터를 대상으로 네트워크의 성장 메커니즘, 노드 간 상호작용, 네트워크 내 부익부 현상 등 핵심적인 현상을 정량적으로 분석합니다. 특히, 네트워크 내에서 인기(인기 효과)와 노드의 이질성(적합성)이 네트워크 성장에 미치는 영향을 규명하기 위해 동적 네트워크 모델, 선호적 연결 모델, 베이지안 생성 모델 등 첨단 통계 기법을 적용하고 있습니다. 사회 네트워크 분석에서는 네트워크 내에서 정보가 어떻게 확산되는지, 특정 노드가 네트워크 내에서 어떤 역할을 수행하는지, 그리고 네트워크 구조가 사회적 현상에 어떠한 영향을 미치는지에 대한 연구를 수행합니다. 이를 위해 LDA, ERGM, 동시출현 네트워크 분석 등 다양한 통계적 및 기계학습 기반의 네트워크 분석 기법을 활용합니다. 실제로 트위터, 유튜브, 페이스북 등 다양한 소셜 미디어 데이터를 분석하여 사회적 트렌드와 네트워크 구조의 변화를 실증적으로 탐구하고 있습니다. 이러한 연구는 네트워크 내에서 발생하는 부익부 빈익빈 현상, 노드의 적합성 변화, 인기 효과의 동적 변화 등을 정량적으로 측정하고 예측하는 데 큰 기여를 하고 있습니다. 또한, 과학 협업 네트워크, 커뮤니티 Q&A, 사용자-아이템 추천 시스템 등 다양한 응용 분야에서 네트워크 기반 의사결정 지원과 정책 수립에 실질적인 통찰을 제공합니다.
베이지안 모델링 및 시계열 네트워크 분석
베이지안 모델링은 불확실성이 존재하는 복잡한 데이터에서 사전 지식과 데이터를 결합하여 보다 정교한 추론을 가능하게 하는 통계적 접근법입니다. 본 연구실에서는 베이지안 생성 모델, 베이지안 네트워크 모델, Gibbs 샘플링 등 다양한 베이지안 추론 기법을 활용하여 네트워크 데이터, 시계열 데이터, 의료 통계 데이터 등 다양한 형태의 데이터를 분석하고 있습니다. 특히, 사용자-아이템 이분 네트워크에서 인기와 영향력 편향을 제거하고, 진정한 품질을 추정하는 베이지안 모델을 개발하여 추천 시스템의 신뢰성과 해석력을 높이고 있습니다. 시계열 네트워크 분석에서는 시간에 따라 변화하는 네트워크 구조와 노드 특성의 동적 변화를 모델링합니다. 예를 들어, 분산 컴퓨팅 시스템에서 작업자의 능력이 시간에 따라 어떻게 변화하는지, 네트워크 내에서 노드의 적합성과 인기가 어떻게 상호작용하며 진화하는지에 대한 연구를 수행합니다. 이를 위해 EM 알고리즘, MCMC, 시계열 회귀분석, ARIMA 등 다양한 통계적 기법을 적용하여 네트워크의 동적 특성을 정량적으로 분석하고 예측합니다. 이러한 연구는 네트워크 성장 메커니즘의 이해를 넘어, 실제 사회, 산업, 의료 등 다양한 분야에서 시계열 네트워크 데이터를 효과적으로 분석하고 미래를 예측하는 데 중요한 역할을 합니다. 또한, 베이지안 모델링을 통한 불확실성 정량화와 해석력 증대는 데이터 기반 의사결정의 신뢰성을 높이는 데 기여하고 있습니다.
텍스트 마이닝 및 토픽 모델링 기반 데이터 분석
텍스트 마이닝과 토픽 모델링은 대규모 비정형 텍스트 데이터에서 의미 있는 정보를 추출하고, 데이터의 구조와 트렌드를 파악하는 데 필수적인 기술입니다. 본 연구실에서는 LDA, LSA, 토픽 출현 지도 기법 등 다양한 토픽 모델링 기법을 활용하여 논문, 특허, SNS 데이터 등에서 핵심 키워드와 이머징 기술 트렌드를 도출하고 있습니다. 특히, 복합어 키워드와 토픽의 중요도, 성장률을 분석하여 디지털 헬스케어, R&D 투자, 정책 연구 등 다양한 분야에서 전략적 의사결정 지원에 활용하고 있습니다. 또한, 텍스트 마이닝 결과를 네트워크 분석과 결합하여 키워드 동시출현 네트워크, 토픽 간 연계 구조, 연구 트렌드의 시계열 변화 등을 심층적으로 분석합니다. 예를 들어, 트위터 데이터의 키워드 네트워크 분석을 통해 디지털 신기술 분야의 사회적 관심과 연구 과제의 연계성을 파악하고, 토픽별 연구 중요도의 시계열 예측을 통해 미래 연구 방향을 제시합니다. 이러한 연구는 방대한 텍스트 데이터에서 숨겨진 패턴과 트렌드를 효과적으로 추출하고, 데이터 기반의 전략 수립과 정책 기획에 실질적인 인사이트를 제공합니다. 또한, 설명 가능한 인공지능(XAI) 기법과 결합하여 분석 결과의 해석력을 높이고, 다양한 산업 및 학문 분야에서 데이터 기반 혁신을 선도하고 있습니다.
1
Risk of Anxiety Disorders after Epilepsy Diagnosis: A Nationwide Retrospective Cohort Study
Lee, S.W., Kang, C., Choi, U., Jung, H., Bae, Y.
Epilepsy and Behavior,
2
Profile Monitoring via a Nonparametric Bayesian Online Learning Framework
Yang, D., Park, J., Jung, H., Chung, Y.
Journal of Quality Technology,
3
Time-Dependent Risk of Dementia Following Epilepsy Diagnosis: A Nationwide Cohort Study in South Korea
Bae, Y., Kang, C., Choi, U., Jung, H., Lee, S.W.
Archives of Clinical Neuropsychology,
1
A Study on the Effects of Rich-get-richer and Node Fitness in the Growth of Generalized Networks
National Research Foundation of Korea (NRF)
2021년 ~ 2024년
2
Electrical Fire Prevention System with IoT and Artificial Intelligence
Ministry of Land, Infrastructure and Transport (MOLIT)
2021년 ~ 2022년
3
Recent Developments in Network Data Analysis and Their Applications in Science, Industry and Government
Ministry of Science and Technology of Taiwan (MOST)
2019년 ~ 2020년