이기종 GPU 클러스터 환경에서 딥러닝 계산 작업들을 실행할 때 발생할 수 있는 활용률 저하 문제를 GPU 공유 기술을 통해 해결하고 최적의 성능을 내기 위한 연구가 진행 중이다. 그러나time-slicing, Multi-Process Service(MPS), Multi-Instance GPU(MIG) 공유 기술을 딥러닝 응용의 특성에 맞춰 적절히 사용하는 연구는 제시되지 않았다. 본 논문은 딥러닝 모델 및 파라미터에 따른 작업의 실행 규모, 자원 민감도, 자원 활용 특징을 분석하여 time-slicing, MPS, MIG 공유 기술에 대한 최적의 작업 배치 기준을 제안한다. 서로 다른 공유 기술을 지원하는 이기종 GPU 클러스터 환경에서 최적의 작업 배치를 수행하고 실험을 통해 실행 시간과 처리량이 향상됨을 보였다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.