- 온 디바이스 AI를 위한 경량 모델 압축 기술(프루닝, 양자화) 연구- 에지 디바이스 상에서 실시간 객체 검출/추적 경량화 모델 개발-- 경량화된 모델을 구동하기 위한 하드웨어 가속 기술 연구- 저복잡도, 저전력 FPGA 딥러닝 하드웨어 가속기 개발
온디바이스 인공지능
에지 디바이스
하드웨어 가속기
압축 모델
네트워크 경량화
2
주관|
2022년 2월-2025년 2월
|31,440,000원
온 디바이스 AI를 위한 경량 모델 압축 및 저복잡도, 저전력 하드웨어 가속 기술 연구
- 실시간 딥러닝 객체 탐지/추적 기술을 개발하기 위해 단계별 요소기술을 세분화하고, 기술 간의 연계 및 보완을 통해 연구 결과의 완성도를 높임
- 객체 탐지/추적 기술 연구 동향 분석 및 딥러닝 네트워크 경량화 기술을 적용하여 네트워크 최적화
- 하드웨어 구현을 위한 경량화된 네트워크에 최적화된 양자화 기술 연구 및 적용 - FPGA 하드웨어 가속기 설계시 HLS (High-Level Synthesis)를 통한 빠른 Prototyping
- 객체 탐지/추적 알고리즘의 정수 연산 하드웨어 설계 완료 후 군집 드론 비행 시스템에 탑재 후 검증
본 과제는 차세대 반도체 분야를 이끌 인재를 만들기 위한 책임 있는 미래 인재양성 사업임.
연구목표는 다양한 전공 학생에게 진로 탐색 기회 제공을 위해 수준별 맞춤 교육을 운영하여 2,800명/년 이상 인력 양성 달성임. 핵심 연구내용은 초급·중급·고급·전문 단계 포함 11종 교과과정 운영, 산업체 요구 기반 PBL 강좌 연 18개 신설 및 45개 K-MOOC 개설, 유연학사제도 총 92건 운영, 교원 책임시수 감면·성과연봉 지원, 협약 100여개 기업 취업 연계 및 인턴·장학금 제공, KMOOC·교과과정 공동활용 확산과 재직자 교육 실행임. 기대효과는 반도체 비전공 인문·이공계 취업역량 강화 및 수료생의 현장 인터뷰 기반 직무능력 증대임
- 주관기관(경희대학교) : 최신 딥러닝 경량화 기법 습득 및 구현.
⦁가지치기, 양자화, 지식 증류에서 사용할 기법 선별
⦁논문을 통하여 코드 구현 절차 및 방법 설계
⦁각자 구현한 코드를 하나의 Baseline 코드에 모두 합침으로써 다양한 경량화 기법을 직렬적으로 적용할 수 있는 환경 구성.
⦁Baseline 코드를 내부적으로 공유.
- 주관기관(경희대학교)
⦁각각의 경량화 방법의 조합을 통한 최적의 조합 방법 모색
⦁조인트 학습을 통한 높은 압축률 대비 낮은 성능 열화를 가지는 경량화 알고리즘 연구 및 개발
- 공동연구기관 1(상명대학교)
⦁경량화 알고리즘에 맞는 하드웨어 연구 및 개발
- 주관기관(경희대학교) : 신경망의 경량화를 자동화하기 위한 프레임워크 개발
⦁주어진 데이터셋과 요구되는 작업에 좋은 성능을 보여주는 기본 신경망 훈련
⦁ 선행적으로 습득된 신경망 경량화 기술들 (지식 증류, 가지치기, 양자화) 혹은 이들의 결합 학습 방법들을 통합적으로 지원하는 프레임워크 개발
⦁ 아래 그림과 같이 다양한 경량화 방법을 활용하여 제한된 모바일 장치에서 기본 신경망을 성능의 하락을 최소화하며 최적으로 동작하는 자동 경량화 프레임워크 개발
⦁ 자동화된 프레임워크를 기반으로 당해년도 대회를 통해 성능 및 기능 검증
- 공동연구기관 1(상명대학교) : 경량화된 신경망이 모바일 장치에서 작동가능 하도록 개발
⦁ 경량화된 심층 신경망의 계산 복잡도를 측정해주는 시뮬레이터 개발
⦁ 위의 프레임워크를 통해 경량화된 심층 신경망이 모바일 장치에서도 원활하게 작동할 수 있도록 최적화 작업