프로젝트 소개
본 과제는 GPU에서 ML/DL 연산이 느려지는 원인을 데이터 지역성 측면에서 분석하고, instruction 수행 스케줄링과 데이터 사전 배치를 통해 수행 시간과 메모리 사용을 줄이기 위한 최적화 연구임.
연구 목표는 GPU stall time 감소와 utiliation 향상에 있음. 1차년도에는 GPU 스케줄링 로그와 Darshan log 기반 모니터링 툴 및 워크로드 분석 툴 구현, 2차년도에는 Multi-GPU 환경에서 데이터 지역성을 반영한 스케줄러 구현, 3차년도에는 Tensorflow, Pytorch 적용 및 Federated Learning 확장성 검증 진행임. 기대 효과는 별도 코드 수정이나 GPU 증설 없이 성능 향상과 비용 절감 실현, 국내 GPU 분석 및 프레임워크 개발 기술 향상임.