Edge Real-Time Vision Recognition via Quantization, Pruning, and Algorithm–Hardware Co-Optimization
연구 내용
양자화·프루닝·데이터플로 설계를 결합해 온디바이스에서 실시간 비전 인식이 가능하도록 CNN 추론을 정수 연산 중심으로 재구성하는 연구
온디바이스 환경에서는 제한된 메모리와 연산 자원 때문에 CNN 기반 비전 인식의 지연과 전력 사용이 병목이 됩니다. 본 연구는 QAT 기반 양자화와 정수 전용 추론을 통해 연산 복잡도를 낮추고, 필터 프루닝 및 네트워크 스케일링으로 불필요한 연산을 제거하는 방식으로 성능-비용 균형을 확보합니다. 또한 스킵 연결과 같은 구조적 제약을 고려한 하드웨어 데이터플로 설계 및 FPGA 스트리밍 아키텍처를 적용해 오프칩 트래픽과 내부 메모리 사용을 줄입니다. 알고리즘과 하드웨어를 함께 탐색하는 공동설계 관점으로 저지연·고효율 추론 구현을 지향합니다.
관련 연구 성과
관련 논문
5편
관련 특허
0건
관련 프로젝트
2건
연구 흐름
초기에는 임베디드 플랫폼에서 동작 가능한 정수 전용 CNN 추론을 목표로 양자화 방법을 하드웨어 친화적으로 확장하고 잔차 경로의 데이터처리 방식을 정리하는 연구를 수행했습니다. 이후 YOLO 계열 모델에서 프루닝과 FLOPs-추론시간 상관을 활용해 목표 추론시간에 맞춘 네트워크 구조를 생성하는 방향으로 확장했습니다. 이어서 학습 한 번으로 중복도를 반영하는 적응형 스케일링 프루닝을 도입해 다양한 백본과 데이터셋에서 자원-정확도 타협을 자동화했습니다. 최근에는 알고리즘–하드웨어 공동최적화 프레임워크를 통해 정규화 보존 양자화, 레이어별 자원·지연 인식 탐색, FIFO 기반 스트리밍 아키텍처로 통합 설계 전략을 구체화하고 있습니다.
활용 가능성
활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.
관련 논문
구분
제목
A Low-Cost Fully Integer-Based CNN Accelerator on FPGA for Real-Time Traffic Sign Recognition
Target Capacity Filter Pruning Method for Optimized Inference Time Based on YOLOv5 in Embedded Systems
Adaptive Scaling Filter Pruning Method for Vision Networks With Embedded Devices
LLTQ+: A Hardware-Friendly Quantization Framework for Modern YOLO Architectures
AHCO-YOLO: An Algorithm–Hardware Co-Optimization Framework for Energy-Efficient and Real-Time Object Detection on Edge Devices
관련 프로젝트
구분
제목
온 디바이스 AI를 위한 경량 모델 압축 및 저복잡도, 저전력 하드웨어 가속 기술 연구
온 디바이스 AI를 위한 경량 모델 압축 및 저복잡도, 저전력 하드웨어 가속 기술 연구