현대의 인공지능(AI) 워크로드는 다양한 텐서 수축(tensor contraction) 패턴을 효율적으로 처리할 수 있는 아키텍처를 요구한다. 고정 크기의 행렬 곱셈에 기반한 전통적 접근 방식은 종종 확장성과 유연성 측면에서 한계를 보인다. 제2세대 텐서 수축 프로세서인 RNGD(“Renegade”로 발음)는 텐서 연산에 내재된 병렬성과 데이터 국소성(data locality)을 활용하도록 설계된 혁신적인 아키텍처를 제안한다. 그 거친 입자(coarse-grained) 처리 요소(PE)는 단일의 대규모 단위로 동작하거나 여러 개의 독립적인 단위로 동작할 수 있어 다양한 텐서 형태에 대한 유연성을 제공한다. 회로 스위치 기반 페치 네트워크(circuit switch-based fetch network), 입력 브로드캐스팅(input broadcasting), 버퍼 기반 재사용(buffer-based reuse) 메커니즘과 같은 주요 혁신은 계산 효율을 한층 더 향상시킨다. RNGD는 차세대 AI 워크로드의 지속 가능한 연산을 위한 최적화된 성능과 에너지 효율을 제공하며, 프로세서 아키텍처에서의 중요한 발전을 의미한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.