● 데이터 센터에서 대규모 AI 워크로드를 최적으로 실행하기 위한 NPU, PIM 등의 AI 반도체를 탑재하는 단일 서버 시스템 하드웨어 구성을 도출하기 위한 고속/고정밀 시뮬레이션/프로파일링 플랫폼 개발- 고속/고정밀 시뮬레이션/프로파일링 플랫폼을 통해 대규모 AI 워크로드에 따른 최적의 하드웨어 구성으로 유휴 하드웨어 자원을 최소화하여 구축 비용 및 에...
대규모 AI 워크로드 분석
서버 시스템 모델링
서버 시스템 프로파일링
AI 반도체 데이터센터
고속/고정밀 시뮬레이터
2
2022년 3월-2028년 12월
|786,000,000원
재구성형 PIM 디바이스 기반의 Memory-Centric 아키텍처 개발
■ 최종목표 : 범용성과 확장성을 가지면서 엣지, 모바일, 서버 등 다양한 응용 분야에 확장 적용 가능한 하드웨어/소프트웨어 재구성 가능 PIM 아키텍처 기술 개발 □ 하드웨어 수준의 PIM 연산기 재구성을 통해 범용성 및 신뢰성 특성 확보. □ 소프트웨어를 통해 다수의 PIM 간 연결을 재구성할 수 있는 시스템 수준의 PIM 아키텍처 기술 개발. □...
인 메모리 연산
하드웨어 재구성
소프트웨어 재구성
시스템 소프트웨어
딥 뉴럴 네트워크
3
2022년 3월-2025년 12월
|1,697,000,000원
데이터 플로우 구조 기반 PIM의 실행 및 프로그래밍 모델 개발
시스템 메인 메모리로서의 PIM 반도체와 이기종 가속기 플랫폼을 위한 데이터 플로우 기반의 프로그래밍 및 실행 모델, 컴파일러 및 개발 도구, 운영체제(드라이버, 메모리관리, 스케쥴러), 런타임 및 프레임워크 인공지능를 포함한 다양한 응용을 전용 라이브러리 개발을 통해 PIM 반도체용 컴퓨팅 구조 및 SW기술 핵심 원천기술을 확보하고자 함- 현재 가속기로 ...
인메모리컴퓨팅
시스템 소프트웨어
인공지능
운영체제
컴파일러
4
주관|
2022년 3월-2028년 12월
|786,000,000원
재구성형 PIM 디바이스 기반의 Memory-Centric 아키텍처 개발
■ 본 연구진이 산학과제를 통하여 기 개발한 Silent-PIM 플랫폼을 연구 기반 플랫폼으로 사용
■ H/W 재구성형 PIM 엔진 고도화를 위한 datapath 확장을 위한 소프트웨어 프레임워크 개발
□ Built-in 라이브러리로 제공되지 않을 경우 LUT 사용을 위한 효율적인 방법을 제안하고 개발함
■ H/W 재구성형 PIM 엔진의 발열 양상 분석을 위한 통합 시뮬레이션 프레임워크 개발
□ H/W 재구성형 PIM 엔진의 발열 양상을 분석하기 위한 통합 시뮬레이션 프레임워크를 개발함
■ 차세대 디바이스 연결 기술을 적용한 Pooled PIM 구축 연구
□ 활발히 연구가 진행 중인 연결망 프로토콜을 탐색 및 조사하여, Pooled PIM에 가장 적합한 고속 인터페이스 기술을 연구함.
■ Pooled PIM에서 데이터 일관성(data coherence) 지원에 관한 연구
■ 범용 애플리케이션을 PIM 코드로 자동으로 변환하는 컴파일러 개발
□ 애플리케이션 코드에 컴파일된 PIM 코드를 디바이스에서 수행할 수 있도록 offloading 하는 제어 코드를 추가하는 컴파일러 개발.
■ 탐색 된 최적화 기회를 바탕으로 PIM 컴파일러 고도화 수행
□ 1차년도에 탐색한 최적화 기회와 PIM의 HW/SW 특성을 바탕으로 PIM 코드 최적화 방법 고안 및 고도화
■ H/W 재구성형 PIM 아키텍처에 딥러닝 모델 3종 이식 및 성능 분석
□ H/W 재구성형 PIM 아키텍처에 적합한 딥러닝 모델 3종을 검증하고 다양한 성능지표 선정
■ PIM 설계연구센터, 수요기업과의 교류회를 통한 기술 소개 및 이전, 인적교류 수행
■ 본 연구진이 산학과제를 통하여 기 개발한 Silent-PIM 플랫폼을 연구 기반 플랫폼으로 사용
■ H/W 재구성형 PIM 엔진 고도화를 위한 datapath 확장
□ 연산이 복잡한 unary operand를 갖는 함수를 CPU의 정확도를 보장하면서 연산할 수 있도록 PIM datapath를 설계 확장함.
□ LUT datapath와 이전 MAC datapath를 융합하여 높은 재구성도를 제공하기 위하여 datapath를 재설계함.
■ H/W 재구성형 PIM 엔진의 발열에 따른 DRAM 신뢰성 모델링
□ PIM 디바이스 동작 환경을 실제 상용화 DRAM으로 모델링하여 DRAM 신뢰성을 확인함.
□ Heat chamber를 활용한 온도 제어 실험 환경을 구축하여 DRAM 신뢰성을 확인함.
■ S/W 재구성형 Pooled PIM 개발을 목표로 애플리케이션 특성 프로파일링
□ Pooled PIM을 활용할 경우, 단일 PIM 대비 확장된 용량 및 연산 처리량을 확보할 수 있음. Pooled PIM을 활용해 연산하기 적합할 것으로 예측되는 다양한 후보 애플리케이션(LSTM, Seq2Seq, BERT, PointPollar, DLRM, GPT-2 등) 탐색.
□ Pooled PIM에서 발생할 수 있는 메모리 문제를 확인하기 위해, 추가적인 프로파일링으로 메모리 의존도 및 대역폭 점유량 등을 확인.
■ 다수의 단일 PIM 디바이스를 연결하여 Pooled PIM 아키텍처를 모델링한 FPGA 환경 구현
□ 기존의 단일 PIM 디바이스인 ARM core 기반 Silent-PIM을 기반으로 다수의 PIM 디바이스를 point-to-point 방식으로 연결하여 제안하는 Pooled PIM을 모방한 환경 구축.
■ Pooled PIM에서의 성능 측정 및 개선
□ 구성한 FPGA 기반 에뮬레이션 환경을 활용하여 다양한 애플리케이션에 대한 프로파일링을 수행하고 성능 평가.
■ 범용 애플리케이션 대상 H/W 재구성형 PIM 코드 변환 메커니즘 개발 및 지원 라이브러리 개발
□ H/W 재구성형 PIM 특성 및 제약조건 분석 및 최적화 기회 탐색.
□ 범용 애플리케이션들의 H/W 재구성형 PIM에서의 실행을 위한 컴파일러 레벨 메커니즘 설계 및 검증.
■ NAS 기반 PIM 최적화 뉴럴 네트워크 모델 탐색
□ 낮은 메모리 지연시간, 고대역폭 등 PIM의 특성을 고려하여 자원 활용성을 극대화할 수 있는 뉴럴 네트워크 모델을 탐색.
■ H/W 재구성형 PIM 엔진을 위한 S/W 개발환경 및 검증 플랫폼 구축
□ 본 연구에서는 H/W 재구성형 PIM 아키텍처의