완전 동형암호화(Fully homomorphic encryption, FHE)는 데이터 유출의 위험 없이 민감한 데이터에 대한 연산을 가능하게 하므로, 프라이버시 보호형 클라우드 컴퓨팅을 위한 유망한 해결책이다. FHE가 상당한 주목을 받아왔음에도 불구하고, 막대한 연산 및 메모리 요구로 인해 실제 응용에서의 적용 가능성은 매우 낮다. 본 연구는 GPU를 활용하여 이러한 문제를 해결하기 위한, 즉시 사용 가능하고 실용적인 하드웨어 솔루션을 제안한다. GPU는 수론적 변환(number-theoretic transform, NTT) 등 FHE의 복잡한 연산을 처리하기에 충분한 연산 및 메모리 자원을 갖추고 있으며, 대부분의 선행 연구는 이에 대해 깊이 있게 다루어 왔다. 그러나 상세한 분석을 통해, GPU에서의 성능 병목은 주로 더 단순한 원소별(element-wise) 연산에서 발생하며, 이는 오프칩 메모리(DRAM) 대역폭에 의해 제한됨을 발견한다. 이러한 관찰에 동기를 받아, 본 연구는 FHE를 위한 처리-내-메모리(processing-in-memory, PIM) 아키텍처 Anaheim을 개발한다. 또한 GPU와 함께 PIM을 사용하기 위한 최적화된 FHE 실행 흐름과 종단 간(end-to-end) 소프트웨어 프레임워크를 개발한다. 더불어, 다양한 모듈러 정수 산술 PIM 명령을 처리하는 범용 PIM 유닛을 설계하고, DRAM의 내부 구조를 활용하여 데이터 접근 오버헤드를 최소화하는 효율적인 데이터 매핑 및 이에 수반되는 PIM 실행 알고리즘을 함께 설계한다. 이러한 종합적인 노력을 통해, GPU에서 수행되는 다양한 FHE 워크로드의 성능과 에너지 효율이 크게 향상된다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.