주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
article
|
·
인용수 0
·
2025ROZK: An Energy-Efficient DNN Accelerator Based on Reconfigurable NoC and Local Zero-Skipping
Heetak Kim, Yunpyo Hong, Byung‐Soo Kim, Jongsun Park
IF 5.6 (2025)
IEEE Journal of Solid-State Circuits
제로 스킵(Zero-skipping)은 심층 신경망(DNN) 가속기의 에너지 효율을 향상시키는 유명한 기법이다. 제로 스킵을 무손실 압축을 이용해 인코딩된 데이터로 구현할 때, 압축률의 불일치로 인해 데이터의 크기가 불규칙하고 예측 불가능해지며, 이는 다음과 같은 여러 설계 문제를 유발한다: 1) 버퍼에 저장된 데이터의 불규칙성으로 인한 로드 불균형; 2) 누적(accumulation) 과정에 대한 복잡한 라우팅; 그리고 3) 예측 불가능한 메모리 점유(footprint) 할당. 본 연구에서는 ROZK라는 DNN 가속기를 제안하며, 이는 다음을 포함한다: 1) 각 처리 요소(PE)가 로컬 레지스터 파일을 갖추어 인코딩 데이터 없이 로컬 PE의 비정형 0에 대해 제로 스킵을 가능하게 하는 트리-정상(tri-stationary) 데이터플로우; 2) 저비용 룩업 테이블(LUT) 기반의 로컬 제로 스킵 방식; 그리고 3) 다양한 정상(stationary) 유형을 지원하는 재구성 가능 네트워크 온 칩(NoC) 아키텍처. 또한, 각 연산 유닛이 자신의 연산을 완료하는 즉시 입력을 전달함으로써 연산 활용도를 더 향상시키기 위해 사이클 예측 스케줄러(CPS)도 제안한다. 마지막으로, ROZK는 64비트 RISC-V 코어 기반 시스템 온 칩(SoC) 아키텍처에 연결된다. SoC 아키텍처는 28-nm 공정으로 제작되었고 다양한 DNN 워크로드를 통해 검증되었다. ROZK는 409-MHz 동작 주파수에서 191 giga operations per second(GOPS)(0% 활성 희소성)와 324 GOPS(60% 활성 희소성)를 달성한다.
https://doi.org/10.1109/jssc.2025.3604814
Footprint
Dataflow
Lookup table
Computation
Memory footprint
Encoding (memory)
Throughput
Process (computing)
Lossless compression
2
article
|
·
인용수 0
·
2025A Design Framework of Heterogeneous Approximate DCIM-Based Accelerator for Energy-Efficient NN Processing
Kyeongho Lee, Hye Yeong Lee, Jongsun Park
IF 5.2 (2025)
IEEE Transactions on Circuits and Systems I Regular Papers
정적 랜덤 액세스 메모리(SRAM) 기반 디지털 연산-메모리 내 컴퓨팅(DCIM)은 가산기 트리의 상당한 전력 오버헤드를 대가로 오류 복원력이 높은 연산을 제공한다. 최근의 연구들에서는 근사 컴퓨팅을 기반으로 한 DCIM 매크로를 통해 가산기 트리 오버헤드를 완화했으나, 전력과 신경망(NN) 정확도 사이의 상충관계에 직면한다. 이 상충관계는 배열 수준 CIM 아키텍처에서는 NN 모델의 출력 채널들이 근사 오차에 대해 서로 다른 민감도를 갖기 때문에 더욱 복잡해진다. 본 논문에서는 특정 NN 모델에 대해 양호한 에너지-정확도 상충관계를 달성하는 이질적(heterogeneous) 근사 DCIM 기반 가속기 설계 프레임워크를 제안한다. 해당 프레임워크는 세 가지 핵심 기능을 포함한다. 1) 진화 알고리즘 기반 탐색은 설계 공간을 가지치기(pruning)하여 비용 효율적인 근사 지점을 찾는다. 2) 유전 알고리즘 기반 채널별 매핑은 DCIM의 에너지 소비를 효과적으로 줄이면서도 높은 정확도를 유지하는 이질적 근사 방법을 생성한다. 3) 하드웨어 생성 전략은 DCIM 매크로의 개수와 크기를 결정하여, 주어진 NN 모델에 맞춘 에너지 효율적인 DCIM 기반 가속기를 산출한다. 실험 결과는 제안된 이질적 채널별 매핑을 적용할 때 동질적(homogeneous) 매핑에 비해 에너지 효율이 유의미하게 향상됨을 보여준다. 또한 제안된 프레임워크는 최신의 근사 DCIM 접근법보다 더 적은 에너지를 소비하는 이질적 DCIM 기반 가속기를 생성할 수 있다.
https://doi.org/10.1109/tcsi.2025.3530637
Computer science
Energy (signal processing)
Computational science
Electronic engineering
Parallel computing
Algorithm
Mathematics
Engineering
3
article
|
·
인용수 4
·
2024CAT SNN: Conversion Aware Training for High Accuracy and Hardware Friendly Spiking Neural Networks
Dongwoo Lew, Jongsun Park
IF 5.4 (2024)
IEEE Transactions on Emerging Topics in Computing
스파이킹 뉴럴 네트워크(SNN)의 다양한 학습 알고리즘 가운데, ANN-to-SNN 변환은 높은 정확도와 심층 네트워크로의 확장성 때문에 인기를 얻었다. 인공 신경망(ANN)을 SNN으로 변환하고 변환 손실 감소(conversion loss reduction) 기법을 활용함으로써, 기존의 ANN-to-SNN 변환 접근법들은 양호한 정확도를 달성하였다. 그러나 기존 연구들은 하드웨어에서 변환 손실 감소를 구현하는 데 따르는 오버헤드를 고려하지 않았으며, 그 결과 하드웨어 구현의 타당성이 제한되었다. 본 논문에서는 ANN 학습 동안 SNN을 SNN-유사 ANN을 얻기 위해 가능한 한 가깝게 시뮬레이션하는 변환 인지 학습(conversion aware training, CAT)을 제안한다. 따라서 제안하는 방법은 변환 이후 어떠한 변환 손실 감소 기법도 필요로 하지 않아 하드웨어 오버헤드를 줄이면서, 다양한 신경 코딩 방법을 사용한 SNN에서 최신(state-of-the-art) 정확도를 달성한다. 또한 하드웨어 친화적인 SNN을 얻기 위한 CAT의 적용으로서, CAT가 가능하게 하는 로그(logarithmic) 계산을 채택한 경량 time-to-first-spike(TTFS) 코딩을 시연한다. 로그 TTFS를 지원하는 SNN 프로세서는 28nm CMOS 공정으로 구현되었으며, 5비트 로그 가중치 VGG-16을 실행할 때 CIFAR-10/100/Tiny-ImageNet에서 정확도 91.7/67.9/57.4%, 추론 에너지 486.7/503.6/1426uJ를 달성한다. 주요 기여는 1) ANN-to-SNN 변환 지침으로서 CAT 제안 2) 다양한 신경 코딩에 CAT 적용 3) 공동 설계된 TTFS 코딩과 프로세서 제시이다.
https://doi.org/10.1109/tetc.2024.3435135
Computer science
Spiking neural network
Computer hardware
Artificial neural network
Training (meteorology)
Embedded system
Artificial intelligence
4
article
|
인용수 9
·
2024Spintronic Artificial Synapses Using Voltage‐Controlled Multilevel Magnetic States
Jimin Jeong, Yunho Jang, Min‐Gu Kang, Seungeon Hwang, Jongsun Park, Byong‐Guk Park
IF 5.3 (2024)
Advanced Electronic Materials
신경형(뉴로모픽) 컴퓨팅은 기존의 폰 노이만(von Neumann) 컴퓨팅에 비해 대규모 데이터 처리를 위한 에너지 효율적인 연산을 제공한다. 신경형 컴퓨팅에서 학습 및 기억 연산을 위한 핵심 요소인 인공 시냅스는 다중 상태 특성을 요구하며, 그 상태를 변경하고 저장할 수 있어야 한다. 비휘발성 메모리를 이용한 하드웨어 기반 인공 시냅스의 구현은 현재 사용되고 있는 CMOS 기반 대응체에 비해 에너지 소비와 회로 면적 측면에서 상당한 이점을 제공한다. 이러한 맥락에서 스핀트로닉 소자는 인공 시냅스에 대해 다중 레벨 형성 가능성(multilevel formability), 비휘발성(non-volatility), 우수한 기록 성능(outstanding writing performance)을 포함한 바람직한 특성으로 인해 유망한 후보로 부상해 왔다. 본 연구에서는 전압 제어 기반 다중 레벨 자기 상태를 활용하는 스핀트로닉 인공 시냅스와, 이에 연계된 에너지 및 면적 효율적인 인공 신경망 아키텍처를 시연한다. 다중 레벨 상태는 자기 쉬운축(magnetic easy-axis) 방향을 수직 방향에서 평면 내 방향으로, 그리고 그 반대로 점진적으로 조절함으로써 생성되며, 이는 게이트 전압 펄스를 순차적으로 적용하거나 게이트 전압의 펄스 폭을 조정함으로써 달성된다. 이러한 스핀트로닉 인공 시냅스를 기반으로 합성곱 신경망(convolutional neural network; CNN) 및 스파이킹 신경망(spiking neural network; SNN) 아키텍처를 구성하였으며, 향상된 에너지 효율과 감소된 회로 면적을 보이면서 MNIST 데이터셋에 대해 높은 인식 정확도를 보여준다.
https://doi.org/10.1002/aelm.202300889
Neuromorphic engineering
Spintronics
MNIST database
Computer science
Artificial neural network
Scalability
Materials science
Electronic engineering
Efficient energy use
Artificial intelligence
5
article
|
·
인용수 18
·
2023Large scale integrated IGZO crossbar memristor array based artificial neural architecture for scalable in-memory computing
Muhammad Naqi, Tae‐Hwan Kim, Yongin Cho, Pavan Pujar, Jongsun Park, Sunkook Kim
IF 8.2 (2023)
Materials Today Nano
https://doi.org/10.1016/j.mtnano.2023.100441
Memristor
Crossbar switch
Scalability
Computer architecture
Computer science
Scale (ratio)
Neuromorphic engineering
Architecture
Artificial neural network
Artificial intelligence