프로젝트 소개
본 과제는 매우 강력한 계산 능력을 가진 초고성능컴퓨터를 여러 사용자가 효율적으로 사용하고, 시스템 관리자가 쉽게 운영할 수 있도록 돕는 소프트웨어 도구를 개발하는 연구임. 특히 저전력 매니코어 프로세서와 GPU, Xeon Phi, FPGA 같은 다양한 가속기를 사용하는 최신 초고성능컴퓨터를 대상으로 함.
연구 목표는 사용자가 초고성능컴퓨터의 계산 자원을 쉽게 할당받아 활용하고, 시스템 관리자가 원격에서 효율적으로 운영 및 유지보수할 수 있는 작업 스케줄러와 관리 소프트웨어를 개발하는 데 있음. 특히 저전력 매니코어 프로세서와 GPU, Xeon Phi, FPGA 등 다양한 가속기를 포함하는 재구성형 초고성능컴퓨터를 대상으로 함.
핵심 연구 내용은 상위과제 1 PF 이종 초고성능컴퓨터를 위한 시스템 운영 및 관리 도구 개발임. ARM, KNL 프로세서, FPGA 등 다양한 가속기 및 동적 재구성 시스템 지원을 목표로 함. 이를 위해 GPU, Xeon Phi, FPGA 가속기 스케줄링, 경량 OS 및 프로그래밍 모델 연동, I/O 노드 효율적 배분, 모바일/웹 기반 모니터링 도구, 표준 인터페이스 및 결함 체크 기능 개발 등을 수행함. 최종적으로 PF급 이상 초고성능컴퓨터용 작업 관리 및 모니터링 도구를 오픈 소스로 공개하고 상용화할 계획임.
기대 효과는 개발된 산출물을 오픈 소스로 공개하고 사업화 및 상용화를 추진하는 것임. 이는 수십에서 수천 노드 규모의 클러스터, 특히 가속기 재구성 아키텍처를 채택한 이종 클러스터의 운영 및 관리 도구로 활용 가능하며, 기술지원 패키지 형태로 판매하여 관련 시장에 기여할 것으로 전망됨.