RnDCircle Logo
안정호 연구실
서울대학교 지능정보융합학과 안정호 교수
컴퓨터 구조
병렬처리
메모리 시스템
연구 영역
기본 정보
논문·특허
과제
구성원

안정호 연구실

서울대학교 지능정보융합학과 안정호 교수

안정호 연구실은 컴퓨터 구조와 병렬처리 관점을 기반으로, DRAM 및 CXL 메모리 장치에서 발생하는 데이터 이동·연산 병목을 하드웨어-알고리즘 공동으로 최적화하는 연구를 수행합니다. 특히 Transformer 기반 생성 모델의 추론 단계에서 KV 처리와 attention 계산 효율을 높이기 위해 PIM과 메모리 오프로딩 구조를 설계하고, GPU 마이크로아키텍처에 맞춘 programmable 연산 및 행렬곱 최적화를 적용합니다. 동시에 동형암호 기반 프라이버시 보존 추론의 실행 오버헤드를 줄이기 위한 암호문 패킹과 부트스트래핑 가속을 연구하며, PRAC 및 DRAM 내부 구조 실험으로 신뢰성·보안 메커니즘의 실제 성능 특성도 규명합니다.

컴퓨터 구조병렬처리메모리 시스템in-memory computingCXL
대표 연구 분야
연구 영역 전체보기
동형암호 기반 프라이버시 보존 신경망 추론 가속 연구 thumbnail
동형암호 기반 프라이버시 보존 신경망 추론 가속 연구
Accelerated Private Inference for Homomorphic Encryption-Based Neural Networks
연구 분야 상세보기
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.
주요 논문
5
논문 전체보기
1
Article
|
인용수 3
·
2025
Per-Row Activation Counting on Real Hardware: Demystifying Performance Overheads
J. H. Kim, Seungmin Baek, Minbok Wi, Hwayong Nam, Michael Jaemin Kim, Sukhan Lee, Kyomin Sohn, Jung Ho Ahn
IF 1.4 (2025)
IEEE Computer Architecture Letters
행 단위 활성 카운팅(Per-Row Activation Counting, PRAC)은 DRAM 읽기 교란(disturbance)을 완화하는 방법으로, 핵심 DRAM 타이밍 파라미터를 수정하며 시뮬레이터 기반 연구에서 상당한 성능 오버헤드를 유발하는 것으로 보고되어 있다. 그러나 시뮬레이터와 실제 하드웨어 사이에 알려진 불일치가 존재하므로, PRAC의 성능을 정확히 추정하기 위해서는 실기(real-machine) 실험이 필수적이다. 본 연구는 PRAC에 대한 최초의 실기 기반 성능 분석을 제시한다. 마이크로벤치마크를 사용하여 최신 CPU에서 타이밍 수정 사항을 검증한 결과, SPEC CPU2017 워크로드에 대해 PRAC의 평균 및 최대 오버헤드는 각각 1.06%와 3.28%에 불과한 것으로 나타났으며, 이는 시뮬레이터 기반 보고치보다 최대 9.15배 낮은 수준이다. 더 나아가, 근접 페이지(close page) 정책이 임계 경로(critical path)에서 PRAC에 의해 야기되는 DRAM 행 프리차지(row precharge) 연장 연산을 효과적으로 은폐함으로써 이 오버헤드를 최소화함을 보여준다.
https://doi.org/10.1109/lca.2025.3587293
Computer science
Embedded system
Parallel computing
Computer architecture
Computer hardware
Operating system
2
Article
|
인용수 4
·
2025
Cosmos: A CXL-Based Full In-Memory System for Approximate Nearest Neighbor Search
Seoyoung Ko, Hyunjeong Shim, Wanju Doh, Sungmin Yun, Jinin So, Yongsuk Kwon, Sangsoo Park, Si-Dong Roh, Minyong Yoon, Taeksang Song, Jung Ho Ahn
IF 1.4 (2025)
IEEE Computer Architecture Letters
검색-강화 생성(Retrieval-Augmented Generation, RAG)은 외부 소스에서 추출한 적절한 문맥을 주입함으로써 대규모 언어 모델의 품질을 향상시키는 데 중요하다. RAG는 수십억 스케일의 벡터 데이터베이스에 대해 고처리량, 저지연의 근사 최근접 이웃 검색(Approximate Nearest Neighbor Search, ANNS)을 요구한다. 기존의 DRAM/SSD 기반 솔루션은 용량/지연 한계에 직면하는 반면, 특화 하드웨어나 RDMA 클러스터는 유연성이 부족하거나 네트워크 오버헤드를 유발한다. 우리는 COSMOS를 제안하는데, 이는 CXL 메모리 장치 내에 범용 코어를 통합하여 전체 ANNS 오프로딩을 가능하게 하고, 메모리 대역폭을 최대화하기 위해 순위 수준(rank-level) 병렬 거리 계산을 도입한다. 또한 클러스터 간 근접성을 기반으로 CXL 장치 전반에 걸쳐 검색 부하를 균형 있게 분산하는 인접성 인지(adjacency-aware) 데이터 배치를 제안한다. SIFT1B 및 DEEP1B 트레이스에 대한 평가는 COSMOS가 기준 CXL 시스템 대비 최대 6.72배 높은 처리량을, 그리고 최신 수준의 CXL 기반 솔루션 대비 2.35배 높은 처리량을 달성함을 보여주어 RAG 파이프라인의 확장성을 입증한다.
https://doi.org/10.1109/lca.2025.3570235
Computer science
k-nearest neighbors algorithm
Parallel computing
Artificial intelligence
3
Article
|
·
인용수 1
·
2025
Unlocking Private Computation at Scale: The Acceleration of Homomorphic Encryption
Jaiyoung Park, Sangpyo Kim, Jongmin Kim, Jung Ho Ahn
IF 2.3 (2025)
Computer
동형암호화(HE)는 암호화된 데이터를 처리할 수 있는 “완벽한 계산상의 하인”을 약속하지만, 그에 따른 오버헤드가 실용적 활용을 저해해 왔다. 현재 HE 가속과 관련된 핵심적인 돌파구들이 이 강력한 개인정보 보호 패러다임을 이론에서 현실로 가져오고 있다.
https://doi.org/10.1109/mc.2025.3613184
Homomorphic encryption
Encryption
Acceleration
Key (lock)
Computation
Process (computing)
최신 정부 과제
72
과제 전체보기
1
2025년 3월-2030년 12월
|1,415,561,000
AI 반도체 기반 기계학습 등 가속 라이브러리 기술 개발
국산AI 반도체를 다양한 산업에 활용할 수 있도록 하는 가속 라이브러리 및 도메인 특화 솔루션 기술 개발 및 실증
라이브러리
효율성
이식성
확장성
사용편의성
2
2025년 3월-2029년 12월
|3,171,700,000
동형암호 기반 K-클라우드 전용 Privacy Preserving AI 통합시스템 개발
> (배경) 클라우드는 특성상 외부와 접속이 빈번하고 다양한 내부자가 데이터에 접근할수 있어 해킹과 보안에 취약함. 정부와 산업체에서 안전하게 클라우드를 활용할수 있도록 안전성을 획기적으로 올리는 방안이 요구됨.> (최종 목표) 본 과제에서는 동형암호 기반 Privacy Preserving AI (PPAI) 통합시스템 개발을 제안함. PPAI 시스템에서는 ...
인공지능
인공지능 가속기
클라우드
동형암호
데이터 프라이버시
3
2025년 3월-2030년 12월
|1,920,748,000
AI 반도체 기반 기계학습 등 가속 라이브러리 기술 개발
국산AI 반도체를 다양한 산업에 활용할 수 있도록 하는 가속 라이브러리 및 도메인 특화 솔루션 기술 개발 및 실증
라이브러리
효율성
이식성
확장성
사용편의성
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
공개2025메모리 시스템 및 그 동작 방법1020250195434
등록2024반도체 장치 및 반도체 장치의 구동 방법1020240110034
공개2024동형암호 연산 방법 및 장치1020240041092
전체 특허

메모리 시스템 및 그 동작 방법

상태
공개
출원연도
2025
출원번호
1020250195434

반도체 장치 및 반도체 장치의 구동 방법

상태
등록
출원연도
2024
출원번호
1020240110034

동형암호 연산 방법 및 장치

상태
공개
출원연도
2024
출원번호
1020240041092