Online Learning for Orchestration of Inference in Multi-user End-edge-cloud Networks | 임성수 교수 연구실 | 국민대학교 소프트웨어학부

|임성수 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

Article|

인용수 18

·2022

Online Learning for Orchestration of Inference in Multi-user End-edge-cloud Networks

Sina Shahhosseini, Dongjoo Seo, Anil Kanduri, Tianyi Hu, Sung-Soo Lim, Bryan Donyanavard, Amir M. Rahmani, Nikil Dutt

IF 2 (2022) ACM Transactions on Embedded Computing Systems

초록

딥러닝 기반 지능형 서비스는 스마트시티와 헬스케어를 포함한 사이버물리 응용에서 널리 활용되고 있다. 사용자 말단에 가까운 위치에 딥러닝 기반 지능을 배치하면 개인정보 보호, 응답성, 신뢰성을 향상시킬 수 있다. 자원이 제한된 말단 단말은 연산 집약적인 딥러닝 서비스를 수행하는 데 필요한 지연 및 에너지 요구사항을 충족하도록 세심하게 관리되어야 한다. 딥러닝을 위한 협력형 말단-엣지-클라우드 컴퓨팅은 응용 요구를 계산 오프로딩을 통해 충족할 수 있도록 다양한 성능 및 효율성을 제공한다. 계산 오프로딩 여부를 결정하는 것은 통신-컴퓨팅 공동 최적화 문제이며, 이는 시스템 매개변수(예: 네트워크 상태)와 작업 부하 특성(예: 입력) 모두에 따라 달라진다. 그러나 딥러닝 모델 최적화는 지연과 모델 정확도 사이의 또 다른 트레이드오프 원천을 제공한다. 이러한 컴퓨팅-통신 문제를 고려하는 종단 간 의사결정 해법이 딥러닝 서비스의 최적 오프로딩 정책과 모델을 시너지 있게 찾기 위해 필요하다. 이를 위해 본 연구에서는 응답 시간을 최소화하면서 충분한 정확도를 제공하도록 딥러닝 모델 선택 기법을 고려한 최적 오프로딩 정책을 학습하는 강화학습 기반 컴퓨팅 오프로딩 해법을 제안한다. 종단-엣지-클라우드 시스템에서 엣지 장치에 대한 본 해법의 유효성을 입증하고, 다중 AWS 및 ARM 코어 구성으로 실제 환경 설정을 통해 평가한다. 본 해법은 최신기술 대비 평균 응답 시간에서 35%의 향상을 제공하면서 정확도 감소는 0.9% 미만이며, 이는 종단-엣지-클라우드 시스템에서 DL 추론을 오케스트레이션하기 위한 온라인 학습 프레임워크의 가능성을 보여준다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Computer scienceCloud computingDeep learningComputation offloadingEdge deviceArtificial intelligenceReinforcement learningEdge computingDistributed computingInference

타입

Article

IF / 인용수

2 / 18

원문

https://doi.org/10.1145/3520129

게재 연도

2022