본 과제는 산업계 수요를 반영한 반도체 교육 컨텐츠와 실험·실습 장비를 구축해 인재를 길러 공급 체계를 만드는 연구임.
연구 목표는 산업계와 공동 교과목 개발·개편을 통해 기업형·맞춤형 산학밀착형 교육프로그램을 운영하고, 반도체설계분야 트랙의 마이크로디그리·시스템/소자/설계 세부 운영과 산학협력 프로젝트, 인턴십 기반 PBL 융합형 교육을 구현하는 데 있음. 기대효과는 취업 및 창업 지원의 선순환, E-Learning·Open Course Ware 및 Virtual Classroom·Online Class 확산, 시스템 반도체 IP 개발 참여를 통한 전문 실무형 인재 양성, 석·박사 진학 유도와 특허·기술 이전 같은 가시적 성과 창출임.
본 연구는 multi-tenancy 환경의 queuing delay를 최소화하고, 다양한 numeric format으로 구현된 emerging DNN을 비용효율적으로 가속하는 GPU 기반 시스템 구조를 설계함. 본 연구는 제안하는 시스템을 통해 아래 세 가지 사항을 달성하는 것을 목표로 함. 첫째, 기존 GPU 기반 system 대비queuing delay...
심층신경망
그래픽스 처리 장치
시스템 소프트웨어
멀티테넌시 시스템
4
주관|
2022년 2월-2026년 2월
|148,185,000원
효율적인 차세대 심층 신경망 실행을 위한 다중 테넌트 GPU 가속 시스템 구조 연구
본 연구에서는 그림 와 같은 구조의 GPU 기반 DNN 가속 시스템을 설계함.
1년차: Multi-tenant DNN inference 시 queuing delay를 줄이는 software 기술 개발
2년차: Emerging DNN을 위한 GPU software framework
3년차: Emerging DNN을 위한 GPU microarchitecure
4년차: Open Source GPU 기반 Prototyping
최근 학계 및 산업계에서는 Deep Neural Network (DNN) 을 개발할 때, 다양한 numeric format을 활용하고 있음. 이러한 emerging DNN을 GPU 기반 system에서 실행할 때, 다음과 같은 문제가 발생함. 첫째, GPU 기반 multi-tenant system에서 inference 시, resource contention으로 인해 task 별 queuing delay가 증가함. 둘째, GPU hardware의 제한된 numeric format 지원으로 인해 emerging DNN 실행 시, GPU 핵심 hardware resource의 개별 utilization (하나의 register, CUDA core, tensor core 안의 resource 사용 비율 (하나의 register, arithmetic unit 안의 resource 사용 비율)이 저하됨. 이러한 문제를 해결하고 비용 효율적인 DNN 가속을 하기 위해 본 연구는 새로운 GPU 기반 시스템 구조를 연구함. 제안하는 시스템을 위해 본 연구는 다음의 세 가지 요소로 구성됨. 첫째, multi-tenant DNN inference 시 queuing delay를 줄이는 software 기술 개발함. 둘째, emerging DNN을 위한 GPU software framework을 구현함. 셋째, emerging DNN을 위한 GPU microarchitecure을 설계함.