연합 학습(Federated learning, FL)은 기계 학습 학습 과정에서의 개인정보 유출 위험을 다루기 위한 해결책으로 부상해 왔다. 이 접근법은 클라우드와 원시 온디바이스 학습 데이터를 공유하지 않고, 다양한 모바일 기기가 협력하여 기계 학습 모델을 학습할 수 있게 한다. 그러나 시스템/데이터 이질성과 런타임 변동성으로 인해 FL의 효율적인 엣지 배치는 어렵다. 본 논문은 상기 문제들을 고려함으로써, 모델 수렴을 보장하면서 FL 활용 사례의 에너지 효율을 최적화한다. 우리는 강화학습에 기반한 FedGPO를 제안하며, 이는 시스템/데이터 이질성과 확률적 런타임 변동성에 적응하여 각 FL 집계 라운드마다 최적의 전역 파라미터(B, E, K)를 식별하는 방법을 학습한다. 실험에서 FedGPO는 모델 수렴 시간을 각각 2.4배 개선하였고, 기준 설정 대비 에너지 효율을 3.6배 더 높게 달성하였다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.