CMOS 공정호환 강유전체 트랜지스터 기반 초고효율 3D Vertical 컴퓨팅-인-메모리 집적 플랫폼 개발
강유전체 기반 다양한 어레이 구조 활용 고성능/고집적 CIM 기술 개발
강유전체
컴퓨팅-인-메모리
3D 구조
3단자 메모리
시뮬레이션 프레임워크
2
주관|
2023년 3월-2025년 12월
|750,000,000원
CMOS 공정호환 강유전체 트랜지스터 기반 초고효율 3D Vertical 컴퓨팅-인-메모리 집적 플랫폼 개발
[1차년도]
o 3D 강유전체 메모리 단위소자 개발 및 어레이 구조 설계
- 3D 강유전체 메모리 단위 소자 동작 특성 최적화 및 어레이 구조 설계
- 강유전체-산화물 반도체 채널을 조합한 3D 구조
o 시뮬레이션을 활용한 3D 어레이 구조 연구
- 정확한 SPICE 모델을 이용하여 다양한 3D 강유전체 메모리 어레이 구조 탐색
- 기존 시뮬레이터 framework를 멀티레벨 동작으로 확장하여 CIM 동작이 검증 및 IP 구조 확보
o 3D 구조 시뮬레이션 framework 구축
- 강유전체 트랜지스터의 측정 데이터 기반 SPICE 모델 자동 생성 소프트웨어 개발
- 강유전체 소자의 SPICE 모델을 이용한 어레이 동작 시뮬레이션 framework 구축
- 강유전체 기반의 다양한 CIM 아키텍처 및 3D 구조의 강유전체 CIM 아키텍처 동작 평가 시뮬레이션 framework 구축
o 고성능, 고집적 3D 어레이 구조 개발
- MAC과 CAM 연산을 위한 고성능, 고집적 3D 어레이 구조 개발
- SPICE 소자 모델 기반 어레이 구조 탐색
- 다양한 어레이 모델에 따른 성능 도출 및 비교 평가
- 멀티레벨 동작시 CIM 연산 효율 및 정확도 평가 수행
- CIM 동작을 위한 SoC 프로세서, 버스, 인터페이스 등의 기본 IP확보
[2차년도]
o 3D 강유전체 메모리 어레이 제작
- 강유전체-산화물 반도체 채널 소자를 이용한 3D 강유전체 메모리 어레이 제작
- 3D 강유전체 메모리 어레이 인터페이스 회로 설계 및 구현
o 3D 강유전체 메모리 어레이 동작 방식 개발
- 3D 강유전체 메모리 어레이 인터페이스 회로 설계 및 구현
- Sensing 오차 최소화 및 cell 어레이의 구조에 최적화된 알고리즘 및 연산자 연구
- 전기적 분석법을 통한 강유전체-산화물 반도체 채널 동작 원리 이해 및 신뢰성 개선
o 고성능 고집적 3D 강유전체 메모리 어레이 인터페이스 회로 (driver, readout 회로 등) 설계 및 구현
- Reconfigurable한 인터페이스 회로의 구조 설계 제시
- 인터페이스 회로의 schematic 시뮬레이션 및 설계
- 인터페이스 회로의 layout 설계
- 인터에이스 회로의 성능 평가 (소모 전력, 전압 구동 범위, 전압 분해능 등)
- 인터페이스 회로 칩 제작
- 인터페이스 회로의 핵심 아날로그 셀의 layout 자동생성 소프트웨어 개발
o 매핑 알고리즘 개발
- 다양한 매핑 알고리즘을 지원하는 시뮬레이션 framework 구축
- 3D 구조의 강유전체 CIM에 최적화되어 에너지 효율을 극대화하는 매핑 알고리즘 개발
[3차년도 (최종)]
o 3D FeNAND, FeAND, FeNOR 프로토타입 구현
- Full-chip 형태의 3D FeNAND, FeAND, FeNOR 어레이 제작 및 특성 평가
- 3D 강유전체 메모리 어레이 프로토타입 실험 및 결과 분석
- 아날로그 layout 자동생성 소프트웨어를 이용한 인터페이스 회로의 최적 설계 제시
o 3D cell 어레이 기반 CIM 개발
- Cell 특성에 최적화된 초정밀/고효율 알고리즘 설계 및 벤치마크
- 3D cell 어레이 기반 CIM 동작 실증을 위한 digital SoC 프로토타입 설계
o CIM 구조 개발 및 시뮬레이션 framework 구축
- MAC과 CAM 연산을 모두 지원하여 연산 목적에 따라 동작 과정이 변경 가능한 3D 강유전체 기반 CIM 구조 개발
- 3D 구조의 강유전체 CIM을 위한 다양한 CAM 시뮬레이션 framework 구축
o 3D CIM 구동 프로토타입 개발 및 데모
- 제작된 인터페이스 칩의 프로토타입 검증
- 3D 강유전체 CIM 및 인터페이스 회로 칩의 이종집적 프로토타입 구현
- 3D CIM 어레이와 인터페이스가 연동된 프로토타입 구현 및 CIM 동작 (MAC & CAM) 검증을 위한 인터페이스 동작 검증
IoT Intelligence용 eFLASH 파운드리 공정 기반 MPU/Connectivity/경량 신경망 통합 반도체 개발
1. eNAND PIM기반 지능형 ECG 신호처리 가속기 및 컴파일러 개발* 최종 결과물: ECG 신호 처리 AFE, eNAND PIM 및 BLE 통합 단일칩(SIP)* 핵심 기능: 단일칩 내부에서 환자의 ECG 신호를 분석하여, 세부 증상을 파악하고, 이를 의료진에게 전달 및 실시간 모니터링을 지원(SW와의 연동을 위한 SW-HW 컴파일러 제공)* 주요 ...
프로세싱-인-메모리
임베디드 낸드 플래쉬
지능형 반도체
컴파일러
인-스토리지 연산
4
주관|
2023년 3월-2026년 12월
|1,342,000,000원
IoT Intelligence용 eFLASH 파운드리 공정 기반 MPU/Connectivity/경량 신경망 통합 반도체 개발
1. eNAND PIM기반 지능형 ECG 신호처리 가속기 및 컴파일러 개발
* 소프트웨어/하드웨어 공동 최적화를 통한 에너지 효율 극대화
- ECG AFE, PIM, MCU, BLE 모듈이 통합된 단일 칩 제작
- 경량화 AI 모델 하드웨어 이식을 위한 Compiler 및 eNAND PIM 연산을 위한 RISC-V 기반 Compiler 구현
* 세부 핵심요소기술의 개발 및 내용
= ECG 모델에 대한 TinyML 기반 경량화 AI 모델 생성(Pruning, 양자화, NAS)
- Custom MLIR-based Graph Compiler를 구현하여 AI 모델을 바이너리화하여 가속기에 이식
= ECG 신호 검출(AFE) 및 통신(BLE) 모듈의 최적화 시스템 개발
- 신뢰도 높은 ECG 신호의 검출을 위한 impedance boosting 기술 개발
- 무선 통신 모듈(BLE) 최적화를 통한 저전력 ECG 신호 송/수신 기술 구현
- Reference board 제작 및 Firmware 개발을 통해 ECG 데이터 감지 및 처리 효율성 향상
= RISC-V 코어 기반 가속 시스템 설계
- eNAND PIM용 custom ISA를 구현함으로써, 탑재된 AI 모델의 저전력 연산을 위한 전처리 알고리즘 및 데이터 매핑 방식을 지원
= eNAND PIM 기반 고효율 MAC 연산기 구현
- Coupling capacitor의 낮은 PVT variation 이점을 활용해 연산을 수행함으로써, 높은 신뢰성과 집적도를 가지는 연산 구조 설계
- 단일 클럭을 활용한 다중비트 입력 지원 및 양/음 가중치 통합형 BL 연산 구조를 설계하여 빠른 연산 속도와 높은 전력 효율 달성
= AI모델의 효율적인 RISC-V + eNAND PIM 연산을 위한 컴파일러 개발
- MLIR 기반 소프트웨어 스택 개발(입력된 AI모델을 중간표현으로 변환시켜주는 트랜슬레이터 개발
- 연산자 병합, 연산자의 효율적 스케쥴링을 포함하는 MLIR 최적화 모듈을 개발(MLIR dialect를 설계하고 구현)
- LLVM 도구를 이용하여 LLVM IR로 변환하고 하드웨어에 대응되는 인스트럭션들로 변환하는 코드 생성 모듈 개발
* 실제 IoT 플랫폼 환경에서의 성능 평가
- 프로토타입 칩 설계(MPW)를 2차례 진행하여, 이를 검증 보드에 이식 후 경량화된 AI 모델과 실제 ECG 데이터를 입력으로 넣어 성능을 검증
2. 3D NAND Flash PIM을 활용한 문답형 AI 인-스토리지 컴퓨팅 시스템
* 세부 핵심요소기술의 개발 및 내용
= 인-스토리지 컴퓨팅을 활용한 문답형 AI 모델(GPT) 분할 연산 개발
- 문답형 AI모델인 GPT 종류의 모델의 연산 레이어들을 분석하고, 각 레이어 특성(데이터 재사용률, 벡터연산 가능성)을 고려하여 인-스토리지 컴퓨팅 활용.
- 그 외 연산에 대해서는 RISC-V 내의 벡터 연산기 또는 FPU 사용
- 3D NAND Flash PIM 연산을 추가함에 따라 스토리지 내부에서 두 가지 연산 옵션(자체 CPU/FPGA과 PIM)이 생겨 이를 효율적으로 스케쥴링하는 기법 개발
= AI 모델의 추론 및 학습을 지원하는 NAND Flash PIM 구조 설계
- 이를 지원하기 위한 가중치 전치(transpose) 연산을 지원하여 AI모델의 추론 및 학습이 동시수행 가능한 NAND PIM 가속기 구조 연구
= eNAND/NAND flash의 산포 영향(PVT 변이)을 수학적으로 모델링하고, 산포를 통해 결정되는 비트에러를 예측하여 PIM의 신뢰성 보장
- 수학적 모델을 3D NAND Flash PIM 시뮬레이션 환경에 반영
- 실제 BER 발생을 고려한 AI모델 추론에 대한 연구를 수행
*인-스토리지 컴퓨팅 시뮬레이션을 통한 성능 평가
- 본 연구팀에서 자체 개발한 cycle-accurate 3D NAND PIM 기반 인-스토리지 컴퓨팅 시뮬레이터를 통해 성능을 예측
PIM 반도체 설계연구센터의 1차년도 주요 개발 내용은 아래와 같으며, 3가지 부서의 역할을 각각 나누어 기술한다.
[PIM 기술개발부]
o 국내/외의 파편화된 PIM IP를 모은 PIM-IPX 구축 및 관리
- 기존에 대학과 연구소, 기업에서 개발된 PIM IP를 수집하여 PIM-IPX 구축
- 수집된 IP를 메모리 유닛 셀 종류, 구현 공정 및 연산 방식 등에 따른 분류 및 관리
o 연구 인력이 자유롭게 사용할 수 있는 국제적 개방형 PIM-HUB 구축
- IITP PIM 관련 과제 수행기관에서 접근 가능한 개방형 PIM IP 허브를 구축
- PIM IP 개발 과제에 수행 시 기존 IP를 활용하여 개발에 필요한 시간과 비용을 감축시켜 기존 IP에서 점진적 연구개발을 할 수 있는 연구 생태계 조성
- “싸고 쉽게 PIM IP 하드웨어 개발”이 PIM IP 허브를 통해 가능해짐
o 자체개발 PIM IP인 PMIC, PLL, ADC 개발을 위한 모델링, 프로토타입 개발
o 자체개발 하드웨어 플랫폼을 위한 라이브러리, 인터페이스 개발
o 자체개발 소프트웨어 플랫폼을 위한 드라이버, 벤치마크 개발
[PIM 기술지원부]
o PIM 반도체 협력 체계 Special Interset Group (SIG) 구축
- 연구자 중심으로 IP, EDA, Design house, Cloud, Value 등 분야의 SIG 모집 (이 중 PIM 설계를 위한 ARM 사의 IP들은 이미 확보 완료)
o PIM 반도체 웹서비스 `KPIM` 시행 프로세스 확립
- 공유 웹서비스를 통해 지원할 수 있는 사항들에 대해 대기업 (삼성, 하이닉스) 및 Design house, EDA 기관과 협력 논의 진행
- 연간 계획 취합 및 운영계획 공지, IP 및 EDA 툴 신청, 계정 및 권한 승인, 디자인, 디자인 리뷰 등 웹서비스 시행을 위한 일련의 프로세스 확립
[PIM 인력양성부]
o 교과 과정 개발
- PIM 반도체 설계의 기본기가 되는 세부 전공 지식을 바탕으로 ‘이론’ 교과 내용 선별
- 현존하는 PIM 반도체 기술을 바탕으로 핵심 설계 아이디어를 종합·분석하여 제공하는 ‘기술’ 교과 내용 구성
- PIM 반도체 설계의 전체 프로세스를 단계별로 나누어 구체적인 설계 방법을 제시한 ‘설계’ 교과 내용 구성
- 실질적인 설계에 필요한 소프트웨어 및 하드웨어 Tool을 활용한 PIM을 직접 디자인하는 ‘실습’ 교과 내용 구성
- 국내외 산·학·연 전문가를 초빙하여 각 커리큘럼의 강의 배정 및 개발
o 강좌를 위한 플랫폼 구축
- PIM 반도체 교육 프로그램의 전용 교재 개발
- 온라인 교육을 위한 전용 e-book tool 개발