연구실에서 최근에 진행되고 있는 관심 연구 분야
1
시스템 성능 모델링
시스템 성능 모델링은 컴퓨터 시스템의 다양한 구성 요소, 예를 들어 프로세서, 저장장치, 데이터센터 등에서 발생하는 복잡한 동작을 정량적으로 분석하고 예측하는 연구 분야입니다. 본 연구실에서는 내부 구조가 완전히 공개되지 않은 상용 시스템까지도 성능을 정확하게 분석할 수 있는 혁신적인 방법론을 개발하고 있습니다. 이를 통해 시스템의 병목 현상, 자원 활용도, 처리량 등 다양한 성능 지표를 체계적으로 파악할 수 있습니다. 이러한 성능 모델링 기술은 실제 시스템의 설계 및 운영에 있어 매우 중요한 역할을 합니다. 예를 들어, 새로운 하드웨어 아키텍처를 설계하거나, 대규모 데이터센터의 효율적인 자원 배분 전략을 수립할 때, 신뢰성 높은 성능 예측이 필수적입니다. 본 연구실은 정밀한 시뮬레이션 도구와 분석 프레임워크를 개발하여, 다양한 환경에서의 성능을 빠르고 정확하게 평가할 수 있도록 지원하고 있습니다. 향후에는 인공지능 및 빅데이터 기반의 자동화된 성능 분석 기법을 도입하여, 더욱 복잡해지는 현대 시스템 환경에서도 실시간으로 성능을 진단하고 최적화할 수 있는 기술을 지속적으로 발전시킬 계획입니다. 이를 통해 차세대 컴퓨팅 인프라의 신뢰성과 효율성을 극대화하는 데 기여하고자 합니다.
2
시스템을 위한 머신러닝(ML for Systems)
현대의 컴퓨터 시스템은 점점 더 복잡해지고 있으며, 데이터베이스나 저장장치와 같은 핵심 시스템은 수많은 내부 설정값(튜닝 노브)을 가지고 있습니다. 본 연구실에서는 이러한 시스템의 최적 구성을 자동으로 찾아내기 위해 머신러닝 기법을 적극적으로 활용하고 있습니다. 머신러닝을 통해 시스템의 다양한 상태와 입력에 따라 최적의 설정을 실시간으로 추천함으로써, 성능을 극대화하고 운영 효율을 높일 수 있습니다. 특히, 시스템 오토튜닝 분야에서는 기존의 수동적이고 경험에 의존하던 설정 방식에서 벗어나, 데이터 기반의 자동화된 최적화 방법을 제시합니다. 이를 위해 대규모 실험 데이터를 수집하고, 다양한 머신러닝 모델을 적용하여 시스템의 동작 특성을 학습합니다. 그 결과, 복잡한 시스템 환경에서도 사용자의 개입 없이 최적의 성능을 달성할 수 있는 솔루션을 제공합니다. 이러한 연구는 클라우드, 데이터센터, 엣지 컴퓨팅 등 다양한 응용 분야에 적용될 수 있으며, 앞으로는 강화학습 등 최신 AI 기술을 접목하여 더욱 지능적이고 자율적인 시스템 관리가 가능하도록 연구를 확장할 예정입니다.
3
AI 시스템 인프라스트럭처
초거대 인공지능 모델(예: 대형 언어 모델, LLM)과 같은 최신 AI 기술의 발전은 기존 시스템 인프라에 새로운 도전과제를 제시하고 있습니다. 본 연구실은 이러한 대규모 AI 워크로드를 효율적으로 처리할 수 있는 새로운 시스템 인프라스트럭처를 설계하고 최적화하는 데 주력하고 있습니다. 대량의 연산과 데이터 이동, 메모리 및 저장장치의 병목 현상 등 다양한 문제를 해결하기 위한 하드웨어 및 소프트웨어 통합 솔루션을 개발하고 있습니다. 특히, AI 모델의 학습 및 추론 과정에서 발생하는 막대한 자원 소모를 최소화하기 위해, 맞춤형 가속기 설계, 분산 스토리지 시스템, 고성능 네트워크 아키텍처 등 다양한 기술을 연구하고 있습니다. 최근에는 초거대 언어 모델을 위한 차세대 분산 스토리지 시스템 아키텍처 개발 프로젝트를 수행하며, 실제 산업 현장에서 요구되는 성능과 확장성을 동시에 만족시키는 인프라를 구현하고 있습니다. 향후에는 AI 시스템의 신뢰성, 보안성, 에너지 효율성 등 다양한 측면을 고려한 통합 인프라 연구를 지속적으로 추진할 계획입니다. 이를 통해 인공지능 시대의 핵심 인프라 기술을 선도하고, 학계 및 산업계에 실질적인 기여를 하고자 합니다.