딥러닝 기반 지능형 서비스는 스마트시티와 헬스케어를 포함한 사이버물리 응용에서 널리 활용되고 있다. 사용자 말단에 가까운 위치에 딥러닝 기반 지능을 배치하면 개인정보 보호, 응답성, 신뢰성을 향상시킬 수 있다. 자원이 제한된 말단 단말은 연산 집약적인 딥러닝 서비스를 수행하는 데 필요한 지연 및 에너지 요구사항을 충족하도록 세심하게 관리되어야 한다. 딥러닝을 위한 협력형 말단-엣지-클라우드 컴퓨팅은 응용 요구를 계산 오프로딩을 통해 충족할 수 있도록 다양한 성능 및 효율성을 제공한다. 계산 오프로딩 여부를 결정하는 것은 통신-컴퓨팅 공동 최적화 문제이며, 이는 시스템 매개변수(예: 네트워크 상태)와 작업 부하 특성(예: 입력) 모두에 따라 달라진다. 그러나 딥러닝 모델 최적화는 지연과 모델 정확도 사이의 또 다른 트레이드오프 원천을 제공한다. 이러한 컴퓨팅-통신 문제를 고려하는 종단 간 의사결정 해법이 딥러닝 서비스의 최적 오프로딩 정책과 모델을 시너지 있게 찾기 위해 필요하다. 이를 위해 본 연구에서는 응답 시간을 최소화하면서 충분한 정확도를 제공하도록 딥러닝 모델 선택 기법을 고려한 최적 오프로딩 정책을 학습하는 강화학습 기반 컴퓨팅 오프로딩 해법을 제안한다. 종단-엣지-클라우드 시스템에서 엣지 장치에 대한 본 해법의 유효성을 입증하고, 다중 AWS 및 ARM 코어 구성으로 실제 환경 설정을 통해 평가한다. 본 해법은 최신기술 대비 평균 응답 시간에서 35%의 향상을 제공하면서 정확도 감소는 0.9% 미만이며, 이는 종단-엣지-클라우드 시스템에서 DL 추론을 오케스트레이션하기 위한 온라인 학습 프레임워크의 가능성을 보여준다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.