하이퍼그래프 마이닝과 고차 상호작용 분석
이 연구 주제는 현실 세계의 복잡한 상호작용을 단순한 쌍대 관계가 아니라 다자 간 그룹 상호작용으로 표현하는 하이퍼그래프를 중심으로 전개된다. 공동연구, 온라인 토론, 생물학적 상호작용, 추천 시스템 등에서는 세 개 이상 개체가 동시에 관계를 맺는 경우가 흔하며, 이러한 구조를 정확히 모델링하기 위해서는 기존 그래프보다 더 풍부한 표현력이 필요하다. 연구실은 하이퍼그래프의 구조적 패턴, 중첩 양상, 전이성, 지속성, 이상현상 등 고차 네트워크의 핵심 특성을 체계적으로 측정하고 이해하는 데 주력한다. 이를 위해 하이퍼그래프 패턴 분석 도구, 통계적 유의성 검정을 위한 널 모델, 구조적 요소 정의, 정량 지표 설계, 샘플링 및 생성 모델 개발 등 폭넓은 방법론을 연구한다. 특히 실제 하이퍼그래프에서 관찰되는 패턴을 재현할 수 있는 생성 모델과, 새로운 하이퍼엣지 예측이나 정렬, 복원, 이상 탐지 같은 실용 문제를 해결하는 알고리즘 개발이 중요한 축을 이룬다. 최근 연구 성과는 하이퍼그래프 마이닝 전반을 정리한 서베이, 하이퍼그래프 신경망, 하이퍼그래프 재구성 및 생성, 그룹 상호작용 분석 등의 형태로 나타나며, 이 분야의 이론적 기반과 실험적 기준을 동시에 확장하고 있다. 이 연구는 복잡계 데이터 분석의 표현 한계를 넘어서는 데 큰 의미가 있다. 쌍대 그래프만으로는 포착하기 어려운 집단 행동의 형성 원리, 정보 확산 구조, 협업의 응집성, 다중 상호작용 기반 이상 징후를 더 정밀하게 해석할 수 있기 때문이다. 향후에는 대규모 하이퍼그래프에 대한 확장 가능한 학습, 설명 가능한 고차 네트워크 분석, 다양한 도메인 데이터와의 융합을 통해 사회과학, 생명과학, 정보검색, 추천, 국방 분석 등으로 응용 범위가 더욱 넓어질 것으로 기대된다.
대규모 텐서 분해와 확장 가능한 데이터 마이닝 시스템
연구실의 또 다른 핵심 축은 대규모 희소 데이터와 고차원 데이터를 효율적으로 분석하기 위한 텐서 분해 및 확장형 데이터 마이닝 기술이다. 추천 시스템, 로그 데이터, 시계열 이벤트, 다중 관계 데이터베이스 등은 행렬을 넘어 텐서 형태로 표현되는 경우가 많으며, 데이터 규모와 차원이 증가할수록 메모리 사용량과 계산 복잡도가 급격히 커진다. 연구실은 이러한 문제를 해결하기 위해 분산 환경에서 동작하는 텐서 분해 알고리즘과 압축, 요약, 근사 표현 기술을 함께 연구한다. 대표적으로 좌표하강 기반 분산 텐서 분해, 고차 텐서의 손실 압축, 스트림 텐서 분해, 불규칙 텐서의 압축 표현 등은 연구실의 강점을 보여준다. 이 과정에서 계산 정확도와 속도, 메모리 효율성, 병렬화 가능성 사이의 균형을 맞추는 것이 핵심 과제이며, 맵리듀스나 분산 처리 프레임워크에서도 실제로 작동 가능한 수준의 알고리즘 설계가 강조된다. 또한 관계형 데이터베이스 전체를 학습 가능한 표현으로 바꾸는 연구나 대규모 그래프 요약 기술도 같은 문제의식 위에 놓여 있으며, 방대한 데이터를 실용적으로 활용하기 위한 데이터 중심 인공지능 기반을 구축한다. 이러한 연구는 단순히 알고리즘 성능 향상에 그치지 않고, 대규모 산업 데이터와 과학 데이터를 처리하는 핵심 인프라 기술로 이어진다. 제한된 자원으로도 초대규모 데이터를 분석할 수 있게 함으로써 기업의 추천·탐지·예측 시스템, 과학 데이터 분석, 공공 데이터 활용, 실시간 스트림 처리 등 다양한 응용을 가능하게 한다. 앞으로는 데이터베이스, 그래프, 텐서, 멀티모달 표현 학습을 통합하는 방향으로 발전하며, 더욱 적은 비용으로 더 큰 데이터를 다루는 차세대 데이터 마이닝 시스템으로 확장될 가능성이 높다.
그래프 학습, 연속 학습, 그리고 응용형 인공지능
연구실은 그래프 신경망과 연속 학습을 포함한 현대적 기계학습 방법을 개발하고, 이를 다양한 응용 문제에 연결하는 연구도 활발히 수행한다. 그래프 데이터는 노드와 엣지의 의존성이 강해 일반적인 독립 표본 가정이 성립하지 않는 경우가 많으며, 시간에 따라 분포가 변하거나 새로운 태스크가 순차적으로 등장하는 상황에서는 학습 안정성과 일반화 성능이 더욱 중요해진다. 연구실은 이러한 문제를 해결하기 위해 그래프 연속 학습 벤치마크, 강건하고 공정한 데이터 중심 학습, 분포 변화 대응, 자기지도 학습 등의 주제를 다룬다. 구체적으로는 그래프 연속 학습 프레임워크 구축, 하이퍼그래프 및 시변 그래프에서의 표현 학습, 추천 시스템의 온라인 업데이트, 메타 학습 기반 적응, 적대적 공격과 방어, 이상 탐지, 강화학습 기반 최적화 등으로 연구가 전개된다. 또한 유전자 발현 추론, 초단기 강수 예측, 의료 추천, 금융 시계열 예측 등 실제 도메인 문제에 그래프 및 딥러닝 기법을 적용해 성능을 입증하고 있다. 이러한 연구는 단순한 모델 제안에 머무르지 않고, 실제 사용 가능한 벤치마크와 소프트웨어 프레임워크를 함께 제공하여 재현성과 활용성을 높인다는 점에서 의미가 크다. 응용형 인공지능 연구의 강점은 다양한 데이터 형식을 공통의 구조 학습 문제로 환원하고, 이를 강건하고 확장 가능한 방식으로 해결한다는 데 있다. 생명정보, 기상, 국방, 추천, 금융 등 서로 다른 분야에서도 데이터의 관계성과 시간적 변화성을 포착하면 새로운 예측 성능과 해석 가능성을 확보할 수 있다. 향후에는 대규모 언어모델, 멀티에이전트 협업, 멀티모달 데이터 융합과의 결합을 통해 그래프 기반 인공지능의 적용 범위가 더 넓어지고, 실제 서비스와 의사결정 지원 시스템으로 이어질 가능성이 크다.