AHCO-YOLO: An Algorithm–Hardware Co-Optimization Framework for Energy-Efficient and Real-Time Object Detection on Edge Devices | 김용우 교수 연구실 | 한국교원대학교 기술교육과

|김용우 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

Article|

인용수 0

·2025

AHCO-YOLO: An Algorithm–Hardware Co-Optimization Framework for Energy-Efficient and Real-Time Object Detection on Edge Devices

Jaemyung Kim, Jin-Ku Kang, Yongwoo Kim

IF 3.1 (2025) IEEE Transactions on Very Large Scale Integration (VLSI) Systems

초록

엣지 기기에서의 실시간 객체 탐지는 엄격한 계산량, 메모리, 전력 예산 하에서 수행된다. 기존 연구는 대체로 모델 압축과 하드웨어 가속을 독립적으로 다루어 정확도, 지연시간, 에너지 간의 최적이 아닌 절충을 초래한다. 본 연구에서는 모델 설계, 양자화, 설계 공간 탐색(DSE), 하드웨어 구현을 하나로 통합하는 알고리즘–하드웨어 공동 최적화 프레임워크(AHCO)인 AHCO-YOLO를 제시한다. 이 접근은 고립된 방법들이 갖는 한계를 극복하고 시너지 효과에 기반한 향상을 제공한다. 우리는 배치 정규화(BN)를 보존하는 양자화 방법을 적용한, 하드웨어 친화적이고 경량화된 You Only Look Once (YOLO) 모델을 도입하여, 낮은 정밀도에서도 정확도를 유지하면서 모델 크기를 감소시킨다. 또한 층(layer)별 특징을 바탕으로 최적의 데이터플로우를 선택하고, 지연시간 및 자원 제약 하에서 하드웨어 설계 파라미터를 탐색하는 층별 자원–지연시간 인지형 DSE(LSRLA-DSE) 방법을 제안한다. 더 나아가, 오프칩 트래픽을 최소화하면서 높은 처리 요소(PE) 활용률을 유지하는 층별 동적 데이터플로우를 갖춘 FIFO 기반 스트리밍 아키텍처를 제안한다. 또한 자원 효율성과 처리량을 향상시키는 의미 분할 및 재구성 전략(SPRG)을 도입한다. Xilinx ZCU104 FPGA에 구현된 AHCO-YOLO-T는 64.8%mAP에서 79.8 FPS를 달성했으며, 41.9 FPS/W 및 80.5 GOPS/W를 제공한다. 기존 YOLO 가속기들과의 비교 전반에서 AHCO-YOLO는 최첨단 효율을 보였고, 엣지 플랫폼에서의 실시간 에너지 효율적 객체 탐지에 적합함을 입증한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Object detectionDataflowInterfacingQuantization (signal processing)Field-programmable gate arrayEdge deviceDesign space explorationNormalization (sociology)Hardware acceleration

타입

Article

IF / 인용수

3.1 / 0

원문

https://doi.org/10.1109/tvlsi.2025.3621624

게재 연도

2025