수많은 거대 인공지능 추론 서비스 제공을 위한, 서버리스 컴퓨팅을 활용한 컴퓨팅 리소스 효율적인 모델 서빙 시스템 연구 - 단일 노드의 한정된 컴퓨팅 자원(CPU-GPU)의 활용(Utilization)을 극대화여 한정된 GPU 자원에서 기존 시스템보다 동시에 더 많은 거대 인공지능 모델들을 할당할 수 있는 효율적인 모델 할당 시스템 연구. - 클라우드 서버...
모델 서빙
서버리스
컴퓨팅 자원 효율
2
주관|
2021년 3월-2025년 12월
|2,000,000,000원
신경망 응용 자동생성 및 실행환경 최적화 배포를 지원하는 통합개발 프레임워크 기술개발
□ 주관연구개발기관 (한국전자통신연구원)
[신경망 자동생성 서브시스템]
ㅇ 신경망 분류 및 모듈화 기반 신경망 모델링 정의 기술
- 딥러닝 프레임워크 특성을 고려한 코드 레벨 신경망 모델링 정의
- 신경망 단위 모듈 및 모듈 간 토폴로지 특성을 고려한 구조 레벨 신경망 모델링 정의
- 신경망 모듈화의 시각화 및 소스 편집 기능 고려
ㅇ HW/SW 개발환경 구축 및 데이터 확보
- 프레임워크 개발을 위한 머신러닝/딥러닝 처리 시스템(HW/SW) 구성
- Open Stack, Kubernetes를 이용한 서비스 응용 개발이 용이한 스택 제공
- 타겟 응용 선정 및 시험 데이터 확보
[신경망 배포/탑재 서브시스템]
ㅇ 고속 추론 엔진 설계
- 국제 표준 신경망 모델(예 ONNX) 지원 추론 엔진 설계
- 국제 표준 신경망 모델 처리를 위한 파서 구현
- 비전 처리를 위한 기본 신경망 실행 함수 구현
ㅇ 신경망 경량화를 위한 최적화 기법 설계
-실행 속도 향상을 위한 quantization 기법 설계
- 신경망 경량화에 따른 성능 분석 모델 개발
ㅇ 신경망 고속 실행지원 배포/탑재 기술 설계
□ 공동연구개발기관 (래블업)
ㅇ 신경망 응용개발 파이프라인 프로세스 통합관리 기술 개발
- 데이터 전처리 – 데이터 검증 – 모델 학습 – 모델 검증 – 배포에 이르는 신경망 응용개발 파이프라인 통합 관리 인터페이스 구성
- 데이터 전처리 및 모델 개발과 최종 배포까지의 파이프라인 통합 관리 플랫폼 구축
ㅇ 온보드의 타겟 가속장치에 적응하는 실행 이미지 생성 기술 설계
- 타겟 장치의 아키텍처 및 지원하는 가속 SDK를 자동 파악할 수 있는 모듈 구현
- 타깃 장치의 아키텍처, 운영체제, 설치된 가속기 및 SDK 등의 정보를 수집하는 모듈 구현
□ 공동연구개발기관 (웨다)
ㅇ 응용의 기능 명세 및 실행환경 명세 기술
- 직관적인 UI의 응용 기능 및 실행환경 명세 개발
- 데이터 종류에 따른 학습 환경 명세
- 신경망이 배포될 HW 디바이스 환경 및 응용에 따른 추론환경 명세
□ 공동연구개발기관 (한국인공지능협회)
ㅇ 기업의 요구사항 수집 및 분석
ㅇ 통합개발 프레임워크 관련 생태계 활성화 지원
□ 위탁연구개발기관 (고려대산학협력단)
ㅇ 신경망 자동 구성 모듈의 구조 설계- 하이퍼 파라미터 최적화 모듈 설계- 신경망 검
1. 양자 심층 강화 학습(Q-DRL) 알고리즘에 대한 개발
◇ QAOA의 활용도 및 확장성 관련 심층 분석 연구
- low-depth QAOA의 고전 알고리즘 대비 성능 관점 NPO 문제별 비교 평가
- depth 증가에 따른 QAOA 매개변수 세팅 이슈에 대한 보완/해결책 연구
◇ QAOA와 DRL의 구성요소(CNN+RL)의 접목을 통한 Q-DRL 모델 연구
- CNN 및 QCNN과 QAOA를 활용할 수 있는 응용 양자 모델 연구
- QCNN을 활용한 양자 데이터 처리와 RL 프로세스를 이용한 모델 연구
◇ 새로운 관점에서의 확장 Q-DRL의 이론적 개선
- 역강화학습 및 모방학습 관점에서의 확장 Q-DRL 모델 개선
- 중앙집중형 다중 에이전트 강화학습과 접목하여 확장 Q-DRL 모델 개선
2. 양자 심층 강화 학습 알고리즘의 구현 및 소프트웨어 단계에서의 적용
◇ 양자 심층 강화 학습을 위한 선행 연구 조사 및 적절한 SW 플랫폼 비교 평가
- 양자 인공신경망 및 양자 강화 학습에 대한 R&D 현황조사 및 핵심 착안점
서베이
- 양자 SW 개발 관점에서의 양자 시뮬레이팅 프레임워크들에 대한 비교 평가
◇ 이동체 등 어플리케이션에 적용을 위한 SW 인프라 설계
- 이동체에 Q-DRL을 적용시키기 위한 무선통신환경 현황조사 및 접합성 검토
- 양자 자율주행 등의 응용에 필요한 소프트웨어적 기반 설계
◇ 이동체 등에 확장 Q-DRL을 적용한 모의실험 및 성능평가
- 고안된 확장 Q-DRL을 적용한 양자 자율주행 등의 어플리케이션 SW 설계
- 모의 실험 및 성능평가
1. 양자 심층 강화 학습(Q-DRL) 알고리즘에 대한 개발
◇ QAOA의 활용도 및 확장성 관련 심층 분석 연구
- low-depth QAOA의 고전 알고리즘 대비 성능 관점 NPO 문제별 비교 평가
- depth 증가에 따른 QAOA 매개변수 세팅 이슈에 대한 보완/해결책 연구
◇ QAOA와 DRL의 구성요소(CNN+RL)의 접목을 통한 Q-DRL 모델 연구
- CNN 및 QCNN과 QAOA를 활용할 수 있는 응용 양자 모델 연구
- QCNN을 활용한 양자 데이터 처리와 RL 프로세스를 이용한 모델 연구
◇ 새로운 관점에서의 확장 Q-DRL의 이론적 개선
- 역강화학습 및 모방학습 관점에서의 확장 Q-DRL 모델 개선
- 양자 action-reward policy 등에 게임이론을 접목하여 확장 Q-DRL 모델
개선
2. 양자 심층 강화 학습 알고리즘의 구현 및 소프트웨어 단계에서의 적용
◇ 양자 심층 강화 학습을 위한 선행 연구 조사 및 적절한 SW 플랫폼 비교 평가
- 양자 인공신경망 및 양자 강화 학습에 대한 R&D 현황조사 및 핵심 착안점
서베이
- 양자 SW 개발 관점에서의 양자 시뮬레이팅 프레임워크들에 대한 비교 평가
◇ 이동체 등 어플리케이션에 적용을 위한 SW 인프라 설계
- 이동체에 Q-DRL을 적용시키기 위한 고성능 분산 컴퓨팅 관점의 인프라 연구
- 양자 자율주행 등의 응용에 필요한 소프트웨어적 기반 설계
◇ 이동체 등에 확장 Q-DRL을 적용한 모의실험 및 성능평가
- 고안된 확장 Q-DRL을 적용한 양자 자율주행 등의 어플리케이션 SW 설계
- 모의 실험 및 성능평가
전국 확장형 미래 치안플랫폼 개발
지능형 영상분석 기반의 실종위험 예측모델 개발
1)영상에서 추출된 텍스트 기반 이벤트 데이터의 활용방안 구상
2)텍스트 기반 이벤트 데이터를 활용한 실종위험 예측모델 사전 연구/검증
3)실시간 이벤트 데이터, 기존 DB 데이터를 활용한 실시간 예측모델 연구