분산되고 개인정보를 보존하는 연합 학습(Federated Learning, FL)은 지능형 IoT 응용을 개발하는 데 에지 컴퓨팅 시스템과 결합되어 논의되어 왔다. 그러나 각 FL 노드에서 데이터를 개별적으로 수집하는 경우, 독립적이고 동일한 분포(independent and identically distributed, IID)가 아닌 학습 데이터(non-IID)가 발생할 수 있으며, 이는 FL 성능을 크게 저하시킬 수 있다. 이를 해결하기 위해 본 연구에서는 FL 클라이언트가 더 많은 데이터셋에서 자신의 모델을 학습할 수 있도록 하여, 집합적으로 IID 가상 데이터셋을 형성하는 모델 전이(model transfer) 접근법을 제안한다. 제안된 접근법에서는 로컬 모델이 경험한 데이터 라벨 분포를 기준으로 FL 클라이언트를 전이 요구(transfer-demand)형 또는 집계 성향(aggregation-inclined)형으로 분류한다. 전이 요구형 클라이언트는 자신에게 부족한 라벨을 보완할 수 있는 헬퍼 클라이언트(helper client)로 모델을 전이하는 반면, 집계 성향형 클라이언트는 학습 모델에 충분한 라벨을 보유하므로 모델 집계에 참여한다. 그러나 두 개 이상 전이 요구형 클라이언트가 동일한 헬퍼 클라이언트에 대해 경쟁할 수 있다. 이 경쟁을 해결하기 위해 최소 비용 최대 매칭(minimum-cost maximum-matching, MCMM) 프레임워크와 정수 선형 계획법(integer linear programming)을 적용하여 최적해를 도출한다. FL 클라이언트 간 모델 전송 비용을 최소화하기 위해, 로컬 모델을 클라이언트로부터 집계하는 파라미터 서버(parameter server)를 동적으로 할당하기 위한 스테이너 트리(Steiner tree) 기반 해법을 사용한다. 마지막으로 다양한 문제에 대해 광범위한 시뮬레이션 실험을 수행하였으며, 제안된 접근법은 MNIST의 경우 정확도 99.02%를 달성하고 통신 비용을 20%~66% 범위 내에서 감소시키는 등, CIFAR-10 데이터셋의 경우 비(非)IID 기준 접근법에 비해 정확도를 최소 24% 향상시키고 통신 비용을 29.48%~63.09% 범위 내에서 개선한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.