MAGNETO는 엄격한 전력 제약 하에서 딥 신경망의 계층을 신경 처리 장치에 매핑하기 위한 전력 인지적 유전 탐색 프레임워크이다. MAGNETO는 패널티 기반 제약 집행 메커니즘과 에너지-지연 곱(Energy-delay product) 지향의 적합도 함수를 통합하여, 지연과 에너지 효율의 균형을 이루는 해로 매핑 탐색을 유도한다. 전통적인 매핑 전략과 달리 MAGNETO는 각 계층의 연산 및 메모리 접근 특성에 맞춘 고품질 매핑을 발견하기 위해 매핑 구성을 동적으로 탐색한다. 합성곱 계층, 일반 행렬 곱셈 계층, 선형 계층을 포함한 다양한 계층 유형에 대해 광범위한 실험을 수행한 결과, MAGNETO는 TOPS/W와 MAC당 에너지 측면에서 기준 성능 전략을 일관되게 능가함을 보여주었다. 특히 MAGNETO는 엄격한 1 W 전력 예산 하에서도 낮은 지연과 효율적인 에너지 사용을 모두 달성하여, 지연-에너지 트레이드오프에서 경쟁력 있거나 더 우수한 성능을 나타낸다. 본 연구 결과는 전력 제약 하에서의 탐색 기반 매핑이 엣지 환경의 NPU에서 실시간의 에너지 효율적인 추론을 구현할 잠재력이 있음을 시사한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.