이정혜 연구실
응용공학과 이정혜
이정혜 연구실은 데이터 프라이버시 보호와 연합학습(Federated Learning) 기술을 중심으로, 다양한 산업 및 헬스케어 분야의 데이터 분석을 선도적으로 수행하고 있습니다. 연구실은 의료, 제조, 금융, 환경 등 민감한 데이터를 다루는 여러 기관이 데이터를 직접 공유하지 않고도 협력적으로 인공지능 모델을 학습할 수 있는 프라이버시 보호 연합학습 알고리즘을 개발하고 있습니다. 이를 위해 Word2Vec, 자기주의 기반 임베딩, 오토인코더, 하모나이즈드 임베딩 등 최신 딥러닝 기법을 적극적으로 도입하고 있으며, 실제로 국내외 병원, 제조업체, 금융기관 등 다양한 산업 현장에 적용하여 실질적인 성과를 내고 있습니다.
연구실은 딥러닝 및 머신러닝을 활용한 산업 및 헬스케어 데이터 분석에도 탁월한 역량을 보유하고 있습니다. 예를 들어, 제조 공정의 품질 예측 및 최적화, 스마트 인솔 기반 신체활동 및 체중 변화 예측, 환경성 질환 사망자 이상치 탐지 등 다양한 응용 분야에서 혁신적인 분석 방법론을 제시하고 있습니다. 또한, 유전체 및 대사체 데이터, 웨어러블 센서 데이터 등 고차원 데이터를 통합 분석하여 만성질환 위험 예측, 생체 나이 추정, 환자 맞춤형 건강관리 프로그램 추천 등 실질적인 건강 증진 방안을 연구하고 있습니다.
고차원 및 이질적 데이터의 통합 분석과 변수 선택 분야에서도 연구실은 독보적인 기술력을 보유하고 있습니다. 마코프 블랭킷 기반 변수 선택, 혼합형 데이터 전용 알고리즘, 다변량 피처 랭킹 등 고차원 데이터에 최적화된 변수 선택 기법을 개발하여, 예측 모델의 정확도와 해석력을 동시에 높이고 있습니다. 이러한 기술은 제조, 바이오, 환경 등 다양한 분야의 데이터 분석에 적용되어, 데이터 기반 의사결정의 신뢰성과 효율성을 크게 향상시키고 있습니다.
연구실의 연구 성과는 다수의 특허 출원과 산업체 협력 프로젝트, 국내외 학술지 논문 및 국제학회 발표를 통해 국내외적으로 인정받고 있습니다. 특히, 프라이버시 보호 연합학습, 딥러닝 기반 제조 및 헬스케어 데이터 분석, 고차원 데이터 변수 선택 등 핵심 기술은 실제 산업 현장과 공공기관에 적용되어 사회적 가치 창출로 이어지고 있습니다.
이정혜 연구실은 앞으로도 데이터 프라이버시 보호와 인공지능 기술의 융합, 고차원·이질적 데이터의 통합 분석, 산업 및 헬스케어 현장 문제 해결을 위한 혁신적인 연구를 지속적으로 추진할 계획입니다. 이를 통해 데이터 기반 사회에서의 신뢰성과 혁신성을 동시에 확보하는 데 기여하고자 합니다.
프라이버시 보호 및 연합학습 기반 데이터 분석
이정혜 연구실은 다양한 기관과 분산된 환경에서의 데이터 분석을 위해 프라이버시 보호와 연합학습(Federated Learning) 기술을 중점적으로 연구하고 있습니다. 의료, 금융, 제조 등 민감한 데이터를 다루는 분야에서는 데이터의 직접적인 공유가 어렵기 때문에, 각 기관의 데이터를 로컬에서 학습하고 모델의 파라미터만을 교환하는 연합학습이 필수적입니다. 연구실에서는 Word2Vec, 자기주의(Self-Attention) 기반 임베딩, 오토인코더 등 다양한 딥러닝 기법을 활용하여, 각 기관의 데이터 특성을 반영하면서도 전체적으로 일관된 예측 성능을 확보할 수 있는 모델을 개발하고 있습니다.
특히, 의료 분야에서는 전자의무기록(EHR) 데이터를 활용한 환자 진단 예측, 환자 유사도 분석, 프라이버시를 보장하는 추천 시스템 등 다양한 응용 연구가 이루어지고 있습니다. 연구실은 다기관 환경에서 발생할 수 있는 임베딩 공간의 불일치 문제를 해결하기 위해, 프로크루스테스(Procrustes) 정렬, 바이링구얼 오토인코더, 하모나이즈드 임베딩 등 혁신적인 임베딩 정렬 및 통합 방법을 제안하였습니다. 이를 통해 각 기관의 데이터가 가진 고유한 정보를 보존하면서도, 전체적인 예측 정확도를 높이고 있습니다.
이러한 연구는 실제로 국내외 병원, 제조업체, 금융기관 등 다양한 산업 현장에 적용되고 있으며, 데이터 프라이버시 보호와 분석 효율성의 균형을 맞추는 데 큰 기여를 하고 있습니다. 또한, 연구실의 기술은 특허로도 다수 출원되어, 연합학습 기반의 추천 시스템, 개인정보 보호 알고리즘, 분산 환경에서의 딥러닝 모델 등 다양한 분야에서 실질적인 활용 가능성을 보여주고 있습니다.
딥러닝 및 머신러닝 기반 산업·헬스케어 데이터 분석
이정혜 연구실은 딥러닝과 머신러닝을 활용한 산업 및 헬스케어 데이터 분석에도 선도적인 연구를 수행하고 있습니다. 제조 공정의 품질 예측, 공정 최적화, 스마트 인솔을 이용한 신체활동 및 체중 변화 예측, 환경성 질환 사망자 이상치 탐지 등 다양한 응용 분야에서 혁신적인 분석 방법론을 개발하고 있습니다. 예를 들어, MMP Net과 같은 연속 다단계 제조 공정 예측 모델은 실제 대형 제조 현장에 적용되어 연간 수십억 원의 비용 절감 효과를 입증하였으며, 스마트 인솔 기반 멀티태스크 학습 프레임워크는 신체활동 분류, 속도 추정, 체중 예측 등 다중 헬스케어 지표를 동시에 예측할 수 있는 효율적인 솔루션을 제시하였습니다.
헬스케어 분야에서는 유전체 데이터, 대사체 데이터, 웨어러블 센서 데이터 등 다양한 형태의 고차원 데이터를 통합 분석하여, 당뇨병, 고혈압 등 만성질환의 위험 예측, 생체 나이 추정, 환자 맞춤형 건강관리 프로그램 추천 등 실질적인 건강 증진 방안을 제시하고 있습니다. 또한, 환경 데이터와 결합한 사망자 이상치 탐지, 환경위험지수 개발 등 공공보건 분야로도 연구를 확장하고 있습니다. 이러한 연구는 실제 특허 출원과 산업체 협력 프로젝트를 통해 사회적 가치 창출로 이어지고 있습니다.
연구실은 데이터 전처리, 변수 선택, 특징 추출, 모델 해석 등 전 과정에 걸쳐 최신의 머신러닝 및 딥러닝 기법을 적용하고 있으며, 특히 고차원·비정형·시계열 데이터에 특화된 분석 프레임워크를 지속적으로 개발하고 있습니다. 이를 통해 산업 현장과 의료 현장에서 발생하는 다양한 데이터 분석 문제를 효과적으로 해결하고, 데이터 기반 의사결정의 정확성과 신뢰성을 높이고 있습니다.
고차원·이질적 데이터의 통합 분석 및 변수 선택
이정혜 연구실은 고차원 및 이질적(heterogeneous) 데이터의 통합 분석과 변수 선택(feature selection) 분야에서도 탁월한 연구 성과를 내고 있습니다. 실제로 유전체, 마이크로어레이, 환경 센서, 제조 공정 등 다양한 분야에서 수만 개의 변수와 소수의 샘플로 구성된 데이터가 빈번하게 등장합니다. 연구실은 마코프 블랭킷(Markov Blanket), 혼합형 데이터(Mixed-type Data) 전용 변수 선택 알고리즘, 다변량 피처 랭킹 등 고차원 데이터에 최적화된 변수 선택 기법을 개발하여, 예측 모델의 정확도와 해석력을 동시에 향상시키고 있습니다.
특히, 변수 간의 상관관계와 중복성을 고려한 마코프 블랭킷 기반의 피처 선택 방법은 기존의 단변량(univariate) 방법에 비해 더 적은 변수로도 높은 예측 성능을 달성할 수 있음을 다수의 논문과 실험을 통해 입증하였습니다. 또한, 혼합형 데이터(연속형+범주형)를 동시에 처리할 수 있는 범용 변수 선택 알고리즘을 제안하여, 실제 산업 및 바이오 데이터 분석에 널리 활용되고 있습니다. 이러한 변수 선택 기술은 고차원 데이터의 차원 축소, 모델 해석, 계산 효율성 향상 등 다양한 장점을 제공합니다.
이와 더불어, 연구실은 변수 선택과정에서 도출된 핵심 변수들을 활용하여, 제조 공정 품질 예측, 환경 센서 기반 가스 분류, 유전체 기반 질병 예측 등 다양한 응용 분야에서 실제적인 성과를 내고 있습니다. 이러한 연구는 데이터 과학, 산업공학, 바이오인포매틱스 등 다양한 학문 분야와 융합되어, 데이터 기반 혁신의 기반을 마련하고 있습니다.
1
MMP Net: A feedforward neural network model with sequential inputs for representing continuous multistage manufacturing processes without intermediate outputs
전재욱, 김재영, 이경민, 조호진, 김경빈, 이정혜, 윤기혁, 임치현
IISE Transactions, 2024
2
HarmoSATE: Harmonized embedding-based self-attentive encoder to improve accuracy of privacy-preserving federated predictive analysis
이정혜, Lee Taek-Ho, Kim Suhyeon, Jun Chi-Hyuck
INFORMATION SCIENCES, 2024
3
An Interpersonal Dynamics Analysis Procedure With Accurate Voice Activity Detection Using Low-Cost Recording Sensors
이정혜, Lim Dongcheol, Kang Hyewon, Choi Beomseok, Hong Woonki
IEEE ACCESS, 2024
2
의료용 데이터 분석을 위한 연합학습 환경 구축, 알고리즘 개발 및 시연
3
AI&BIG DATA 기반의 건강예측 알고리즘 설계를 통한 건강예측/건강증진맞춤운동지도 시스템 개발