논문 | 안정호 교수 연구실 | 서울대학교 지능정보융합학과

|안정호 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

논문

연구 성과 추이

표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

주요 논문

*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.

Article

인용수 3

2025

Per-Row Activation Counting on Real Hardware: Demystifying Performance Overheads

J. H. Kim, Seungmin Baek, Minbok Wi, Hwayong Nam, Michael Jaemin Kim, Sukhan Lee, Kyomin Sohn, Jung Ho Ahn

IF 1.4 (2025)

IEEE Computer Architecture Letters

행 단위 활성 카운팅(Per-Row Activation Counting, PRAC)은 DRAM 읽기 교란(disturbance)을 완화하는 방법으로, 핵심 DRAM 타이밍 파라미터를 수정하며 시뮬레이터 기반 연구에서 상당한 성능 오버헤드를 유발하는 것으로 보고되어 있다. 그러나 시뮬레이터와 실제 하드웨어 사이에 알려진 불일치가 존재하므로, PRAC의 성능을 정확히 추정하기 위해서는 실기(real-machine) 실험이 필수적이다. 본 연구는 PRAC에 대한 최초의 실기 기반 성능 분석을 제시한다. 마이크로벤치마크를 사용하여 최신 CPU에서 타이밍 수정 사항을 검증한 결과, SPEC CPU2017 워크로드에 대해 PRAC의 평균 및 최대 오버헤드는 각각 1.06%와 3.28%에 불과한 것으로 나타났으며, 이는 시뮬레이터 기반 보고치보다 최대 9.15배 낮은 수준이다. 더 나아가, 근접 페이지(close page) 정책이 임계 경로(critical path)에서 PRAC에 의해 야기되는 DRAM 행 프리차지(row precharge) 연장 연산을 효과적으로 은폐함으로써 이 오버헤드를 최소화함을 보여준다.

https://doi.org/10.1109/lca.2025.3587293

Computer science

Embedded system

Parallel computing

Computer architecture

Computer hardware

Operating system

Article

인용수 4

2025

Cosmos: A CXL-Based Full In-Memory System for Approximate Nearest Neighbor Search

Seoyoung Ko, Hyunjeong Shim, Wanju Doh, Sungmin Yun, Jinin So, Yongsuk Kwon, Sangsoo Park, Si-Dong Roh, Minyong Yoon, Taeksang Song, Jung Ho Ahn

IF 1.4 (2025)

IEEE Computer Architecture Letters

검색-강화 생성(Retrieval-Augmented Generation, RAG)은 외부 소스에서 추출한 적절한 문맥을 주입함으로써 대규모 언어 모델의 품질을 향상시키는 데 중요하다. RAG는 수십억 스케일의 벡터 데이터베이스에 대해 고처리량, 저지연의 근사 최근접 이웃 검색(Approximate Nearest Neighbor Search, ANNS)을 요구한다. 기존의 DRAM/SSD 기반 솔루션은 용량/지연 한계에 직면하는 반면, 특화 하드웨어나 RDMA 클러스터는 유연성이 부족하거나 네트워크 오버헤드를 유발한다. 우리는 COSMOS를 제안하는데, 이는 CXL 메모리 장치 내에 범용 코어를 통합하여 전체 ANNS 오프로딩을 가능하게 하고, 메모리 대역폭을 최대화하기 위해 순위 수준(rank-level) 병렬 거리 계산을 도입한다. 또한 클러스터 간 근접성을 기반으로 CXL 장치 전반에 걸쳐 검색 부하를 균형 있게 분산하는 인접성 인지(adjacency-aware) 데이터 배치를 제안한다. SIFT1B 및 DEEP1B 트레이스에 대한 평가는 COSMOS가 기준 CXL 시스템 대비 최대 6.72배 높은 처리량을, 그리고 최신 수준의 CXL 기반 솔루션 대비 2.35배 높은 처리량을 달성함을 보여주어 RAG 파이프라인의 확장성을 입증한다.

https://doi.org/10.1109/lca.2025.3570235

Computer science

k-nearest neighbors algorithm

Parallel computing

Artificial intelligence

Article

인용수 1

2025

Unlocking Private Computation at Scale: The Acceleration of Homomorphic Encryption

Jaiyoung Park, Sangpyo Kim, Jongmin Kim, Jung Ho Ahn

IF 2.3 (2025)

Computer

동형암호화(HE)는 암호화된 데이터를 처리할 수 있는 “완벽한 계산상의 하인”을 약속하지만, 그에 따른 오버헤드가 실용적 활용을 저해해 왔다. 현재 HE 가속과 관련된 핵심적인 돌파구들이 이 강력한 개인정보 보호 패러다임을 이론에서 현실로 가져오고 있다.

https://doi.org/10.1109/mc.2025.3613184

Homomorphic encryption

Encryption

Acceleration

Key (lock)

Computation

Process (computing)

Article

인용수 0

2024

Hechi: A Hybrid Approach for Efficient Memory Reclamation Techniques in Mobile Systems

Wanju Doh, Seoyoung Ko, Michael Jaemin Kim, Jung Ho Ahn

IF 2 (2024)

IEEE Embedded Systems Letters

애플리케이션 시작 시간(application startup time)은 시작 후 애플리케이션이 사용자에게 보이기까지 걸리는 시간으로, 모바일 시스템에서 사용자 경험에 중대한 영향을 미치는 핵심 요인이다. 백그라운드에서 전환되는 애플리케이션의 시작 시간(전환 시간)은 저장소에서 읽어오는 페이지 수에 크게 좌우된다. 애플리케이션이 처음 실행되거나(최초 시작) 종료(killed)된 후 다시 로드(reload)될 때에는, 처음부터 다시 시작하므로 더 긴 시작 시간(콜드 런치 시간, cold-launch time)을 겪는다. 이를 완화하기 위해 본 메모리에 필수 데이터를 유지하면서 애플리케이션의 종료 횟수를 최소화하는 방법이 도움이 될 수 있으나, 이는 다음과 같은 상충관계가 따른다. 즉, 더 많은 파일 기반 페이지(file pages)를 회수하면, 이를 저장소에서 가져오는 오버헤드로 인해 전환이 느려지는 반면, 파일과 연관되지 않은 익명 페이지(anon pages)를 더 많이 회수하면 제한된 스왑 공간(swap space)으로 인해 앱이 종료될 위험이 있다. Hechi는 이러한 상충관계를 해결하기 위해 하이브리드 메모리 회수(hybrid memory reclamation) 접근 방식을 사용한다. 필수 파일 페이지의 회수를 우선순위에서 낮추고, 시스템 상태에 따라 두 유형의 페이지에 대한 회수 비율을 동적으로 조정함으로써, Hechi는 시작 시간을 최대 17%까지 개선한다.

https://doi.org/10.1109/les.2024.3494854

Computer science

Embedded system

Computer architecture

Distributed computing

Article

인용수 27

2023

HyPHEN: A Hybrid Packing Method and Its Optimizations for Homomorphic Encryption-Based Neural Networks

Donghwan Kim, Jaiyoung Park, Jongmin Kim, Sangpyo Kim, Jung Ho Ahn

IF 3.4 (2023)

IEEE Access

완전동형암호화(FHE)를 사용한 합성곱 신경망(CNN) 추론은 민감한 사용자 데이터의 프라이버시를 보호하면서 서버로 전체 연산 과정을 오프로드할 수 있게 해주는 FHE의 능력 덕분에 유망한 프라이빗 추론(PI) 솔루션이다. FHE 기반의 선행 CNN(HCNN) 연구에서는 FHE를 사용하여 ResNet과 같은 딥 신경망 아키텍처를 구축하는 것이 가능함을 보여주었다. 그러나 이러한 발전에도 불구하고, HCNN은 높은 계산 및 메모리 오버헤드로 인해 실용성 측면에서 여전히 중대한 과제에 직면해 있다. 이러한 제한을 극복하기 위해 본 연구에서는 새로운 합성곱 알고리즘(RAConv 및 CAConv), 데이터 패킹 방법(2D gap packing 및 PRCR scheme), 그리고 HCNN 구축에 특화된 최적화 기법을 통합한 딥 HCNN 구축인 HyPHEN을 제시한다. 이러한 개선을 통해 HyPHEN은 메모리 사용량의 크기와, 암호문 회전 및 부트스트래핑과 같은 값비싼 동형암호 연산의 횟수를 상당히 줄일 수 있다. 그 결과, HyPHEN은 HCNN CIFAR-10 추론의 지연 시간을 실용적인 수준인 1.4초(ResNet-20)로 낮추었으며, HCNN ImageNet 추론을 처음으로 14.7초(ResNet-18)에 도달하는 성능으로 시연하였다.

https://doi.org/10.1109/access.2023.3348170

Computer science

Homomorphic encryption

Inference

Convolutional neural network

Dram

Computer engineering

Overhead (engineering)

Ciphertext

Parallel computing

Encryption

전체 논문

186

Article

인용수 3

2025

Per-Row Activation Counting on Real Hardware: Demystifying Performance Overheads

J. H. Kim, Seungmin Baek, Minbok Wi, Hwayong Nam, Michael Jaemin Kim, Sukhan Lee, Kyomin Sohn, Jung Ho Ahn

IF 1.4 (2025)

IEEE Computer Architecture Letters

https://doi.org/10.1109/lca.2025.3587293

Computer science

Embedded system

Parallel computing

Computer architecture

Computer hardware

Operating system

Article

인용수 4

2025

Cosmos: A CXL-Based Full In-Memory System for Approximate Nearest Neighbor Search

Seoyoung Ko, Hyunjeong Shim, Wanju Doh, Sungmin Yun, Jinin So, Yongsuk Kwon, Sangsoo Park, Si-Dong Roh, Minyong Yoon, Taeksang Song, Jung Ho Ahn

IF 1.4 (2025)

IEEE Computer Architecture Letters

https://doi.org/10.1109/lca.2025.3570235

Computer science

k-nearest neighbors algorithm

Parallel computing

Artificial intelligence

Article

인용수 1

2025

Unlocking Private Computation at Scale: The Acceleration of Homomorphic Encryption

Jaiyoung Park, Sangpyo Kim, Jongmin Kim, Jung Ho Ahn

IF 2.3 (2025)

Computer

https://doi.org/10.1109/mc.2025.3613184

Homomorphic encryption

Encryption

Acceleration

Key (lock)

Computation

Process (computing)

Article

인용수 0

2024

Hechi: A Hybrid Approach for Efficient Memory Reclamation Techniques in Mobile Systems

Wanju Doh, Seoyoung Ko, Michael Jaemin Kim, Jung Ho Ahn

IF 2 (2024)

IEEE Embedded Systems Letters

https://doi.org/10.1109/les.2024.3494854

Computer science

Embedded system

Computer architecture

Distributed computing

Article

인용수 27

2023

HyPHEN: A Hybrid Packing Method and Its Optimizations for Homomorphic Encryption-Based Neural Networks

Donghwan Kim, Jaiyoung Park, Jongmin Kim, Sangpyo Kim, Jung Ho Ahn

IF 3.4 (2023)

IEEE Access

https://doi.org/10.1109/access.2023.3348170

Computer science

Homomorphic encryption

Inference

Convolutional neural network

Dram

Computer engineering

Overhead (engineering)

Ciphertext

Parallel computing

Encryption

Article

인용수 0

2026

RowArmor: Efficient and Comprehensive Protection Against DRAM Disturbance Attacks

Minbok Wi, Yoonyul Yoo, Yoojin Kim, Jaeho Shin, Jumin Kim, Yesin Ryu, Saeid Gorgin, Jung Ho Ahn, Jungrae Kim

https://doi.org/10.1145/3779212.3790213

Dram

Disturbance (geology)

Key (lock)

Component (thermodynamics)

Troubleshooting

Article

인용수 7

2025

Anaheim: Architecture and Algorithms for Processing Fully Homomorphic Encryption in Memory

Jongmin Kim, Sungmin Yun, Hyesung Ji, Wonseok Choi, Sangpyo Kim, Jung Ho Ahn

완전 동형암호화(Fully homomorphic encryption, FHE)는 데이터 유출의 위험 없이 민감한 데이터에 대한 연산을 가능하게 하므로, 프라이버시 보호형 클라우드 컴퓨팅을 위한 유망한 해결책이다. FHE가 상당한 주목을 받아왔음에도 불구하고, 막대한 연산 및 메모리 요구로 인해 실제 응용에서의 적용 가능성은 매우 낮다. 본 연구는 GPU를 활용하여 이러한 문제를 해결하기 위한, 즉시 사용 가능하고 실용적인 하드웨어 솔루션을 제안한다. GPU는 수론적 변환(number-theoretic transform, NTT) 등 FHE의 복잡한 연산을 처리하기에 충분한 연산 및 메모리 자원을 갖추고 있으며, 대부분의 선행 연구는 이에 대해 깊이 있게 다루어 왔다. 그러나 상세한 분석을 통해, GPU에서의 성능 병목은 주로 더 단순한 원소별(element-wise) 연산에서 발생하며, 이는 오프칩 메모리(DRAM) 대역폭에 의해 제한됨을 발견한다. 이러한 관찰에 동기를 받아, 본 연구는 FHE를 위한 처리-내-메모리(processing-in-memory, PIM) 아키텍처 Anaheim을 개발한다. 또한 GPU와 함께 PIM을 사용하기 위한 최적화된 FHE 실행 흐름과 종단 간(end-to-end) 소프트웨어 프레임워크를 개발한다. 더불어, 다양한 모듈러 정수 산술 PIM 명령을 처리하는 범용 PIM 유닛을 설계하고, DRAM의 내부 구조를 활용하여 데이터 접근 오버헤드를 최소화하는 효율적인 데이터 매핑 및 이에 수반되는 PIM 실행 알고리즘을 함께 설계한다. 이러한 종합적인 노력을 통해, GPU에서 수행되는 다양한 FHE 워크로드의 성능과 에너지 효율이 크게 향상된다.

https://doi.org/10.1109/hpca61900.2025.00089

Homomorphic encryption

Computer science

Architecture

Encryption

Algorithm

Parallel computing

Operating system

Article

인용수 0

2025

Efficient Memory Management Techniques for LLM Inference in Mobile System

Hyunjeong Shim, Sung-Jea Ko, Wanju Doh, Jung Ho Ahn

Journal of KIISE

서버 기반 LLM의 개인 프라이버시 우려와 네트워크 지연 문제로 인해 온디바이스 LLM이 새롭게 주목받고 있으나, 모바일 운영체제의 메모리 관리 정책은 LLM 추론 시 메모리 자원을 효율적으로 관리하기에 한계가 존재한다. 본 논문에서 제안한 초기 KV 캐시 스왑과 웨이트 지연 회수 기법은 사전 할당된 KV 캐시를 zRAM을 활용해 메모리 사용량을 개선하고, 모델 웨이트의 회수를 지연시킴으로써 스토리지 I/O를 최소화하여 LLM의 추론 성능을 향상시킨다. 제안한 기법은 기존 리눅스 커널 대비 최대 27%의 메모리 사용량 절감 효과를 보이며, 메모리 경쟁이 심한 모바일 환경에서의 LLM 추론 성능 최적화를 이끌 수 있다. 또한, 추측 디코딩과 같은 여러 후보 경로를 유지하는 추론 기법에서 경로의 수에 비례하여 더 큰 메모리 절감 효과를 보임으로써, 모바일 환경에서 다양한 LLM 추론 기법의 적용 가능성을 보여준다.

https://doi.org/10.5626/jok.2025.52.8.637

Computer science

Inference

Artificial intelligence

Article

인용수 7

2025

Marionette: A RowHammer Attack via Row Coupling

Seungmin Baek, Minbok Wi, Seonyong Park, Hwayong Nam, Michael Jaemin Kim, Nam Sung Kim, Jung Ho Ahn

https://doi.org/10.1145/3669940.3707242

Coupling (piping)

Computer science

Engineering

Mechanical engineering

Article

인용수 5

2025

PET: Proactive Demotion for Efficient Tiered Memory Management

Wanju Doh, Yaebin Moon, Seoyoung Ko, Seunghwan Chung, Kwanhee Kyung, Eojin Lee, Jung Ho Ahn

계층형 메모리는 DRAM을 상위 계층(빠른 메모리)으로, 느리지만 저렴한 바이트 주소 지정 가능 메모리를 하위 계층(느린 메모리)으로 사용함으로써 더 낮은 비용으로 주기억장치 용량을 늘릴 수 있는 유망한 접근법이다. 계층형 메모리를 효율적으로 사용하는 방법 중 하나인 사전적 디모션(proactive demotion)은 빠른 메모리에 충분한 빈 공간이 있더라도 차가운 데이터를 느린 메모리로 강등(demote)한다. 선행 연구에서는 사전적 디모션을 활용하여 빠른 메모리에서 애플리케이션의 상주 집합 크기(resident set size)를 줄임으로써 주기억장치의 높은 비용을 낮추는 데 사용해왔다. 또한 사전적 디모션은 뜨거운 데이터에 대한 수요가 급증하는 상황에서 빠른 메모리 부족으로 인해 발생하는 심각한 성능 저하를 완화하는 데도 도움이 된다. 그러나 우리는 애플리케이션의 할당 단위(allocation units) 내에서 메모리 접근 지역성을 활용하면, 시스템 오버헤드는 낮추면서 더 큰 빠른 메모리 절감 효과를 달성할 수 있음을 관찰하였다.

https://doi.org/10.1145/3689031.3717471

Demotion

Computer science

Political science

주요 논문

*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.

Article

인용수 3

2025

Per-Row Activation Counting on Real Hardware: Demystifying Performance Overheads

J. H. Kim, Seungmin Baek, Minbok Wi, Hwayong Nam, Michael Jaemin Kim, Sukhan Lee, Kyomin Sohn, Jung Ho Ahn

IF 1.4 (2025)

IEEE Computer Architecture Letters

https://doi.org/10.1109/lca.2025.3587293

Computer science

Embedded system

Parallel computing

Computer architecture

Computer hardware

Operating system

Article

인용수 4

2025

Cosmos: A CXL-Based Full In-Memory System for Approximate Nearest Neighbor Search

Seoyoung Ko, Hyunjeong Shim, Wanju Doh, Sungmin Yun, Jinin So, Yongsuk Kwon, Sangsoo Park, Si-Dong Roh, Minyong Yoon, Taeksang Song, Jung Ho Ahn

IF 1.4 (2025)

IEEE Computer Architecture Letters

https://doi.org/10.1109/lca.2025.3570235

Computer science

k-nearest neighbors algorithm

Parallel computing

Artificial intelligence

Article

인용수 1

2025

Unlocking Private Computation at Scale: The Acceleration of Homomorphic Encryption

Jaiyoung Park, Sangpyo Kim, Jongmin Kim, Jung Ho Ahn

IF 2.3 (2025)

Computer

https://doi.org/10.1109/mc.2025.3613184

Homomorphic encryption

Encryption

Acceleration

Key (lock)

Computation

Process (computing)

Article

인용수 0

2024

Hechi: A Hybrid Approach for Efficient Memory Reclamation Techniques in Mobile Systems

Wanju Doh, Seoyoung Ko, Michael Jaemin Kim, Jung Ho Ahn

IF 2 (2024)

IEEE Embedded Systems Letters

https://doi.org/10.1109/les.2024.3494854

Computer science

Embedded system

Computer architecture

Distributed computing

Article

인용수 27

2023

HyPHEN: A Hybrid Packing Method and Its Optimizations for Homomorphic Encryption-Based Neural Networks

Donghwan Kim, Jaiyoung Park, Jongmin Kim, Sangpyo Kim, Jung Ho Ahn

IF 3.4 (2023)

IEEE Access

https://doi.org/10.1109/access.2023.3348170

Computer science

Homomorphic encryption

Inference

Convolutional neural network

Dram

Computer engineering

Overhead (engineering)

Ciphertext

Parallel computing

Encryption

전체 논문

186

Article

인용수 3

2025

Per-Row Activation Counting on Real Hardware: Demystifying Performance Overheads

J. H. Kim, Seungmin Baek, Minbok Wi, Hwayong Nam, Michael Jaemin Kim, Sukhan Lee, Kyomin Sohn, Jung Ho Ahn

IF 1.4 (2025)

IEEE Computer Architecture Letters

https://doi.org/10.1109/lca.2025.3587293

Computer science

Embedded system

Parallel computing

Computer architecture

Computer hardware

Operating system

Article

인용수 4

2025

Cosmos: A CXL-Based Full In-Memory System for Approximate Nearest Neighbor Search

Seoyoung Ko, Hyunjeong Shim, Wanju Doh, Sungmin Yun, Jinin So, Yongsuk Kwon, Sangsoo Park, Si-Dong Roh, Minyong Yoon, Taeksang Song, Jung Ho Ahn

IF 1.4 (2025)

IEEE Computer Architecture Letters

https://doi.org/10.1109/lca.2025.3570235

Computer science

k-nearest neighbors algorithm

Parallel computing

Artificial intelligence

Article

인용수 1

2025

Unlocking Private Computation at Scale: The Acceleration of Homomorphic Encryption

Jaiyoung Park, Sangpyo Kim, Jongmin Kim, Jung Ho Ahn

IF 2.3 (2025)

Computer

https://doi.org/10.1109/mc.2025.3613184

Homomorphic encryption

Encryption

Acceleration

Key (lock)

Computation

Process (computing)

Article

인용수 0

2024

Hechi: A Hybrid Approach for Efficient Memory Reclamation Techniques in Mobile Systems

Wanju Doh, Seoyoung Ko, Michael Jaemin Kim, Jung Ho Ahn

IF 2 (2024)

IEEE Embedded Systems Letters

https://doi.org/10.1109/les.2024.3494854

Computer science

Embedded system

Computer architecture

Distributed computing

Article

인용수 27

2023

HyPHEN: A Hybrid Packing Method and Its Optimizations for Homomorphic Encryption-Based Neural Networks

Donghwan Kim, Jaiyoung Park, Jongmin Kim, Sangpyo Kim, Jung Ho Ahn

IF 3.4 (2023)

IEEE Access

https://doi.org/10.1109/access.2023.3348170

Computer science

Homomorphic encryption

Inference

Convolutional neural network

Dram

Computer engineering

Overhead (engineering)

Ciphertext

Parallel computing

Encryption

Article

인용수 0

2026

RowArmor: Efficient and Comprehensive Protection Against DRAM Disturbance Attacks

Minbok Wi, Yoonyul Yoo, Yoojin Kim, Jaeho Shin, Jumin Kim, Yesin Ryu, Saeid Gorgin, Jung Ho Ahn, Jungrae Kim

https://doi.org/10.1145/3779212.3790213

Dram

Disturbance (geology)

Key (lock)

Component (thermodynamics)

Troubleshooting

Article

인용수 7

2025

Anaheim: Architecture and Algorithms for Processing Fully Homomorphic Encryption in Memory

Jongmin Kim, Sungmin Yun, Hyesung Ji, Wonseok Choi, Sangpyo Kim, Jung Ho Ahn

https://doi.org/10.1109/hpca61900.2025.00089

Homomorphic encryption

Computer science

Architecture

Encryption

Algorithm

Parallel computing

Operating system

Article

인용수 0

2025

Efficient Memory Management Techniques for LLM Inference in Mobile System

Hyunjeong Shim, Sung-Jea Ko, Wanju Doh, Jung Ho Ahn

Journal of KIISE

https://doi.org/10.5626/jok.2025.52.8.637

Computer science

Inference

Artificial intelligence

Article

인용수 7

2025

Marionette: A RowHammer Attack via Row Coupling

Seungmin Baek, Minbok Wi, Seonyong Park, Hwayong Nam, Michael Jaemin Kim, Nam Sung Kim, Jung Ho Ahn

https://doi.org/10.1145/3669940.3707242

Coupling (piping)

Computer science

Engineering

Mechanical engineering

Article

인용수 5

2025

PET: Proactive Demotion for Efficient Tiered Memory Management

Wanju Doh, Yaebin Moon, Seoyoung Ko, Seunghwan Chung, Kwanhee Kyung, Eojin Lee, Jung Ho Ahn

https://doi.org/10.1145/3689031.3717471

Demotion

Computer science

Political science