ReAx: Resource-efficient Asynchronous Execution for Accelerating LLM Fine-tuning at the Edge | 김영근 교수 연구실 | 고려대학교 컴퓨터학과

|김영근 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

Article|

인용수 0

·2025

ReAx: Resource-efficient Asynchronous Execution for Accelerating LLM Fine-tuning at the Edge

Heung Sik Na, Daeseon Choi, Young‐Ho Gong, Young Geun Kim

IF 2 (2025) IEEE Embedded Systems Letters

초록

대규모 언어 모델(Large Language Models, LLMs)의 광범위한 사용과 함께, 다양한 사용자의 요구를 충족하는 개인화 모델에 대한 수요가 증가하고 있다. LLM을 사적으로, 네트워크에 의존하지 않게 개인화하기 위해 온디바이스 미세조정(on-device fine-tuning)이 주목받고 있다. 그러나 온디바이스 미세조정은 계산 및 메모리 집약적 연산을 순차적으로 실행하는 경우가 많아 자원을 충분히 활용하지 못함으로써 효율성과 확장성의 문제에 직면한다. 본 서한에서는 메모리 및 계산 집약적 연산을 자원 효율적인 비동기 병렬 실행으로 처리하여 온디바이스 미세조정을 가속하는 프레임워크 ReAx를 제안한다. 메모리 사용량을 증가시키지 않으면서, ReAx는 기준선(baseline)과 비교하여 평균 미세조정 성능과 에너지 소비를 각각 10.42% 및 5.55% 향상시킨다. 긍정적인 부수 효과로, 비동기 매개변수 업데이트는 스트림 간의 약간의 지연으로 인해 그래디언트 잡음(gradient noise)을 유발하며, 이는 미니배치 간의 불리한 업데이트에 대한 정규화(regularizer)로 작용하지만 정확도는 손상시키지 않는다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Asynchronous communicationScalabilityPersonalizationEnergy consumptionEnhanced Data Rates for GSM EvolutionResource (disambiguation)Noise (video)Efficient energy useResource consumption

타입

Article

IF / 인용수

2 / 0

원문

https://doi.org/10.1109/les.2025.3640585

게재 연도

2025