클라우드 데이터 센터는 고성능 서버를 점차 통합함에 따라, 동질적인 인프라를 유지하는 것이 비효율적인 이질적 환경으로 전환되고 있다. 이에 따라 GPU-CPU 이질적 클라우드 데이터 센터가 필수적인 요소로 자리 잡았다. 최적 스케줄링은 서버 성능 차이와 자원 사용 변동을 처리하는 데 필수적이다. 이질적 클러스터에서의 효율적인 자원 활용은 작업 실행 성능과 전체 시스템 효율을 최적화하기 위한 핵심 과제로서, 전통적인 스케줄링 기법들은 주로 오프라인 정적 프로파일링에 의존하여 각 장치에서의 작업 실행 시간을 사전에 측정하거나, CPU와 메모리 활용도를 기준으로 작업을 분류하여 서로 다른 특성을 갖는 워크로드를 함께 배치함으로써 자원 경합을 완화하고 성능을 향상시킨다. 그러나 이러한 접근법은 세부적인 수준의 자원 경합과 환경 변화에 동적으로 대응하지 못하여 성능 저하와 자원 효율의 감소를 초래한다. 본 연구는 이러한 문제를 해결하기 위해 실시간 자원 지표를 활용하는 동적 스케줄링 프레임워크를 제안한다. 제안된 프레임워크는 작업을 Compute-intensive와 Memory-intensive 범주로 분류하여 이질적 클러스터 환경에서의 최적 작업 배치를 결정한다. Compute-intensive 작업은 높은 IPC(Instructions Per Cycle)를 요구하며 주로 CPU 자원을 활용하는 반면, Memory-intensive 작업은 높은 LLC miss rate를 보이고 상당한 메모리 대역폭을 소모한다. 대규모 실험을 통해 작업 분류 지표를 정의한 후, 프레임워크는 각 작업의 특성에 따라 이를 CPU 서버 또는 GPU 서버에 배치한다. 또한 실시간 자원 모니터링을 통해 경합을 감지하고, 작업 마이그레이션을 트리거하여 자원 활용을 최적화하고 경합을 완화하며 성능을 극대화한다. 실험 결과는 제안 방법이 기존의 이질적 클러스터 스케줄링 기법들보다 우수함을 보여주며, 자원 활용도, 작업 실행 시간, 경합 완화 측면에서 유의미한 개선을 달성하였다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.