머신러닝(ML) 작업의 복잡성이 증대됨에 따라, 가변적인 연산 요구와 엄격한 지연 시간 요구로 인해 고유한 과제가 발생하는 엣지 환경에서 멀티테넌트 ML 워크로드를 신속히 배치하는 일이 늘어나고 있다. 본 논문은 엄격한 실행 시간 제약 하에서 이질적인 엣지(Multiprocessor System on Chip) MPSoC 상의 멀티테넌트 머신러닝(ML) 워크로드 실행을 최적화하도록 설계된 전사적 탄력적 스케줄러인 EMERALD를 제안한다. EMERALD는 입력 해상도 스케일링을 활용하여 딥 뉴럴 네트워크(DNN)의 연산 요구를 동적으로 조정함으로써, 높은 정확도를 유지하면서도 엄격한 지연 시간 요구를 충족할 수 있는 능력을 향상시킨다. 스케줄러는 두 가지 주요 구성 요소로 이루어진다: 로컬 탐욕 스케줄러와 글로벌 스케줄러이다. 로컬 스케줄러는 마감 시한 위반에 대응하여 입력 해상도를 적극적으로 조작하며, 정확도에 미치는 영향이 최소이고 응답 시간을 최대한 단축하는 해상도를 선택한다. 글로벌 스케줄러는 정수 선형계획(Integer Linear Programming, ILP) 기반 스케줄러로서, DNN 의존성, 장면 복잡도, 하드웨어 이질성, 그리고 입력 스케일링 조정과 관련된 정확도와 makespan 간의 트레이드오프와 같은 요소들을 고려하여 로컬 스케줄러의 결정을 정교하게 조정한다. 이러한 계층적 접근은 EMERALD가 계산 효율성과 정확도를 효과적으로 균형 있게 조절하도록 하며, 초당 30프레임을 요구하는 시나리오에서 CAMDNN과 HEFT에 비해 각각 누락된 마감 시한을 11배, 12.3배 더 적게 달성한다. 결과는 엣지 기반 ML 배치의 복잡성을 관리함에 있어 적응형 입력 해상도 스케일링이 핵심적 역할을 수행함을 보여준다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.