YOLO 기반 객체 검출 모델은 높은 정확도와 빠른 추론 속도 덕분에 실시간 응용 분야에서 널리 사용된다. 그러나 복잡한 아키텍처와 높은 계산 요구량은 저전력 엣지 디바이스에 배포하는 데 있어 어려움을 야기한다. 이를 해결하기 위해, 하드웨어 친화적 양자화 기법인 LLTQ의 향상 버전인 LLTQ+를 제안한다. 제안된 접근법은 Quantization-Aware Training(QAT) 동안 배치 정규화(batch normalization) 계층을 보존하여 학습 안정성과 정확도를 유지하며, YOLO 네트워크의 핵심 구조 구성 요소인 RepConv의 표현력을 보존하는 양자화 전략을 도입한다. PASCAL VOC 데이터셋에 대한 실험 결과는 LLTQ+의 효과를 입증한다. YOLOv10-s에서 LLTQ+는 정수 전용 추론(integer-only inference) 조건에서 mAP(0.5) 80.6%, mAP(0.5:0.95) 61.8%를 달성했으며, 이는 각각 LLTQ 대비 0.9 및 1.7 퍼센트 포인트를 상회한다. YOLOv9-t에서는 LLTQ+가 mAP(0.5:0.95) 52.9%를 달성하여 LLTQ 대비 0.5 포인트 향상되었다. YOLOv7 및 YOLOv7-tiny와 같은 다른 아키텍처에서도 일관된 성능 향상이 관찰되었다. 이러한 결과는 LLTQ+가 최신의 더 복잡한 YOLO 네트워크에 대해서도 정수 양자화를 효과적으로 지원함을 확인해 주며, 정확도와 계산 효율 간의 균형을 이루는 실용적인 양자화 해법을 제공한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.