논문 | 이어진 교수 연구실 | 인하대학교 본교(제1캠퍼스) 인공지능공학과

|이어진 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

논문

연구 성과 추이

표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

주요 논문

*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.

Article

인용수 0

2025

Fold-PIM: A Cost-Efficient LPDDR5-Based PIM for On-Device SLMs

Kyoungho Jeun, Hyeonu Kim, Eojin Lee

IF 1.4 (2025)

IEEE Computer Architecture Letters

온디바이스 AI 애플리케이션에 대한 수요가 증가함에 따라 모바일 환경에 최적화된 소형 언어 모델(Small Language Models, SLMs)에 대한 관심이 높아지고 있다. 그러나 LPDDR5 기반 시스템의 제한된 메모리 대역폭은, SLM 추론의 핵심 구성요소인 메모리 바운드 행렬-벡터 곱(matrix-vector multiplication) 연산을 효율적으로 수행하는 데 있어 중대한 문제를 야기한다. 본 논문에서는 이러한 문제를 해결하기 위해 LPDDR5 기반 처리-메모리(Processing-in-Memory, PIM) 아키텍처인 Fold-PIM을 제안한다. FoldPIM은 비용 효율성을 유지하면서 서브어레이 수준 병렬성을 활용하는 공유 PU 아키텍처를 특징으로 한다. 또한 다양한 행렬 크기에 걸쳐 GEMV 연산을 효율적으로 수행하기 위한 적응형 타일링(adaptive tiling), 버퍼 오버헤드를 최소화하기 위한 전치된 데이터 레이아웃(transposed data layout), 그리고 벡터 교체(vector replacement) 지연을 감소시키기 위한 맞춤형 프로토콜을 포함한 핵심 기법을 도입한다. 평가 결과, Fold-PIM은 PIM이 없는 기준 시스템(baseline system)과 비교하여 SLM 추론에서 토큰 생성 시간(token generation time)을 최대 3.9배까지 향상시키는 것으로 나타났다.

https://doi.org/10.1109/lca.2025.3566692

Computer science

Computer architecture

Article

인용수 0

2024

Architecting Compatible PIM Protocol for CPU-PIM Collaboration

Seunghyuk Yu, Hyeonu Kim, Kyoungho Jeun, Sun-Young Hwang, Eojin Lee

IF 1.4 (2024)

IEEE Computer Architecture Letters

메모리 내 처리(Processing in Memory, PIM) 기술은 여러 시제품 제품의 도입과 함께 주목을 받고 있다. 그러나 기존 PIM 장치의 인터페이스는 PIM 연산 중에 장시간 동안 일반 메모리 요청을 지연시켜 CPU 성능을 과도하게 저해한다. 본 논문에서는 제한된 명령 공간을 갖는 DRAM 표준을 중심으로, 다양한 PIM 장치와 호스트 프로세서 간의 호환성을 고려하여 새로운 PIM 명령과 프로토콜을 제안한다. 제안하는 명령인 PIM-ACT는 특정 PIM 연산을 할당하면서 다수의 뱅크를 동시에 활성화한다. 이는 메모리 컨트롤러의 손쉬운 제어를 위해 ACT 명령의 기능을 면밀히 따른다. 또한 본 연구에서는 기존 메모리 요청의 지연과 PIM 워크로드의 처리량을 균형 있게 조정하는 메모리 스케줄링 정책을 탐색한다. 평가는 본 접근법이 PIM 및 기존 워크로드 성능 모두를 최적화하는 데 효과적임을 보여준다.

http://dx.doi.org/10.1109/lca.2024.3432936

Computer science

Protocol (science)

Computer architecture

Embedded system

Operating system

Computer network

Article

인용수 9

2023

GraNDe: Efficient Near-Data Processing Architecture for Graph Neural Networks

Sungmin Yun, Hwayong Nam, Jaehyun Park, Byeongho Kim, Jung Ho Ahn, Eojin Lee

IF 3.6 (2023)

IEEE Transactions on Computers

그래프 신경망(Graph Neural Network, GNN) 모델은 그래프 데이터 해석에서 높은 정확도를 보이기 때문에 주목받고 있다. GNN 모델의 주요 구성 요소 중 하나는 집계(aggregation)로, 각 노드에 인접한 노드들에 해당하는 특징 벡터를 수집하고 평균 내는 과정을 수행한다. 집계는 인접 행렬과 특징 행렬을 곱함으로써 작동한다. 그러나 많은 현실적인 데이터셋에서 두 행렬의 크기는 온칩 캐시 용량을 초과하며, 인접 행렬은 매우 희소하다. 이러한 특성은 데이터 재사용을 거의 불가능하게 만들어 집계 과정에서 주기억장치에 대한 집중적인 접근이 발생한다. 따라서 집계는 메모리 집약적 특성을 가지며 전체 실행 시간의 대부분을 지배한다. 본 논문에서는 DRAM 데이터패스 근처에 NDP 모듈을 배치하여 랭크 수준 병렬성(rank-level parallelism)을 활용함으로써 메모리 집약적인 집계 연산을 가속하는 NDP 아키텍처인 GraNDe를 제안한다. GraNDe는 버퍼 칩을 메모리 채널 경로 사이에 삽입하여 호스트 프로세서에서의 전처리/후처리와 NDP 모듈에서의 감소(reduction)가 동시에 수행되도록 함으로써 대역폭 활용을 극대화한다. 피연산자 행렬의 DRAM 랭크에 대한 선호 데이터 매핑(preferred data mappings)을 탐색함으로써, GraNDe는 각 레이어의 차원과 메모리 시스템 구성에 따라 최적 매핑을 적용하는 적응형 행렬 매핑(adaptive matrix mapping)을 지원하도록 설계되었다. 또한 인접한 노드 간의 인접성(adjacency)을 고려한 타일링(tiling)을 활용하여 인접 행렬 데이터의 전송 시간을 줄이고 특징 벡터 데이터의 재사용성을 향상시키기 위한 adj-bundle 브로드캐스팅과 재-타일링(re-tiling) 최적화를 제안한다. GraNDe는 평균적으로 GCN 집계에 대해 기본 시스템과 GCN을 위한 최신 NDP 아키텍처 대비 각각 3.01× 및 1.69×의 성능 향상을 달성하며, 각각 최대

4.00 \times

및

1.98 \times

의 속도 향상을 보인다.

https://doi.org/10.1109/tc.2023.3283677

Computer science

Parallel computing

Adjacency matrix

Datapath

Adjacency list

Cache

Dram

Memory bandwidth

Graph

Theoretical computer science

Article

인용수 12

2022

GraNDe: Near-Data Processing Architecture With Adaptive Matrix Mapping for Graph Convolutional Networks

Sungmin Yun, Byeongho Kim, Jaehyun Park, Hwayong Nam, Jung Ho Ahn, Eojin Lee

IF 2.3 (2022)

IEEE Computer Architecture Letters

그래프 컨볼루션 네트워크(Graph Convolutional Network, GCN) 모델은 그래프 데이터 해석에서 높은 정확도를 바탕으로 주목받고 있다. GCN 모델의 주요 구성 요소 중 하나는 집계(aggregation)이며, 이는 각 정점에 인접한 정점들이 대응하는 특징 벡터를 수집하고 평균내는 과정을 의미한다. 집계는 인접 행렬과 특징 행렬을 곱함으로써 수행된다. 두 행렬 모두의 크기는 온칩 캐시 용량을 초과하며, 인접 행렬은 매우 희소하다. 이로 인해 데이터 재사용이 거의 일어나지 않아 집계 과정에서 다수의 주기억장치(main-memory) 접근이 발생한다. 따라서 집계는 메모리 집약적 특성을 보인다. 본 연구에서는 DRAM 데이터패스(datapath) 인근에 처리 요소를 배치하여 랭크(rank) 수준 병렬성을 활용함으로써 메모리 집약적인 집계 연산을 가속하는 NDP 아키텍처인 GraNDe를 제안한다. 연산자 행렬(operand matrices)의 데이터 매핑을 DRAM 랭크에 대응시켜 탐색한 결과, 최적 매핑은 특정 GCN 층의 구성에 따라 달라짐을 발견하였다. 층별 최적 매핑 방식을 적용함으로써, GraNDe는 오픈 그래프 벤치마크(open-graph benchmark) 데이터셋에서 기준 시스템(baseline system) 대비 최대 4.3×의 속도 향상을 보인다.

https://doi.org/10.1109/lca.2022.3182387

Computer science

Parallel computing

Speedup

Adjacency matrix

Datapath

Graph

Bipartite graph

Adjacency list

Dram

Dataflow

Article

인용수 7

2022

MaPHeA: A Framework for Lightweight Memory Hierarchy-aware Profile-guided Heap Allocation

Deok-Jae Oh, Yaebin Moon, Do Kyu Ham, Tae Jun Ham, Yongjun Park, Jae W. Lee, Jung Ho Ahn, Eojin Lee

IF 2 (2022)

ACM Transactions on Embedded Computing Systems

하드웨어 성능 모니터링 유닛(Performance Monitoring Units, PMU)은 현대 마이크로프로세서의 표준 기능으로, 풍부한 마이크로아키텍처 이벤트 샘플러의 집합을 제공한다. 최근 다수의 프로파일 기반 최적화(profile-guided optimization, PGO) 프레임워크는 기존의 계측(instrumentation) 기반 프레임워크에 비해 훨씬 낮은 프로파일링 오버헤드를 제공하는 방식으로 이를 활용해 왔다. 그러나 기존의 PGO 프레임워크는 주로 바이너리의 배치(layout)를 최적화하는 데 집중하며, 메모리 계층(memory hierarchy)에 걸친 데이터 접근 행태에 대해 PMU가 제공하는 풍부한 정보를 간과한다. 따라서 본 연구에서는 MaPHeA를 제안한다. MaPHeA는 경량의 “M emory hierarchy- a ware P rofile-guided He ap A llocation” 프레임워크로, HPC와 임베디드 시스템 모두에 적용 가능하다. MaPHeA는 매우 낮은 프로파일링 오버헤드로, 그리고 추가적인 사용자 개입 없이 애플리케이션 성능을 향상시키기 위해 동적으로 할당된 힙(heap) 객체의 최적화된 할당을 안내하고 적용한다. MaPHeA의 효과를 입증하기 위해, 이를 떠오르는 DRAM-NVM 이기종 메모리 시스템(HMS)에서 힙 객체 할당 최적화, 선택적 huge-page(대형 페이지) 활용, 그리고 시간적 지역성(temporal locality)이 낮은 객체에 대한 캐시 가능성(cacheability) 제어에 적용한다. HMS에서 MaPHeA는 자주 접근되는 힙 객체를 fast DRAM 영역에 식별·배치함으로써, DRAM을 느린 NVM의 하드웨어 관리 캐시로 사용하는 기본 설정에 비해 메모리 집약적 그래프 처리(graph-processing) 및 Redis 워크로드의 성능을 평균 56.0% 향상시킨다. 또한 MaPHeA는 TLB 미스가 빈번하게 발생하게 하는 큰 힙 객체를 식별하여 huge page에 할당함으로써, Linux의 transparent huge-page 구현에 비해 Redis의 읽기 및 업데이트 작업 성능을 10.6% 향상시킨다. 더 나아가 시간적 지역성이 낮아 캐시 오염(cache pollution)을 유발하는 객체들을 구별하고, 이에 대해 write-combining을 적용함으로써, MaPHeA는 캐시 가능성 제어가 없는 시스템에 비해 STREAM 및 RADIX 워크로드의 성능을 평균 20.0% 향상시킨다.

https://doi.org/10.1145/3527853

Computer science

Heap (data structure)

Memory hierarchy

Dram

Profiling (computer programming)

Operating system

Cache

Locality

Embedded system

Overlay

전체 논문

Article

인용수 0

2025

Fold-PIM: A Cost-Efficient LPDDR5-Based PIM for On-Device SLMs

Kyoungho Jeun, Hyeonu Kim, Eojin Lee

IF 1.4 (2025)

IEEE Computer Architecture Letters

https://doi.org/10.1109/lca.2025.3566692

Computer science

Computer architecture

Article

인용수 0

2024

Architecting Compatible PIM Protocol for CPU-PIM Collaboration

Seunghyuk Yu, Hyeonu Kim, Kyoungho Jeun, Sun-Young Hwang, Eojin Lee

IF 1.4 (2024)

IEEE Computer Architecture Letters

http://dx.doi.org/10.1109/lca.2024.3432936

Computer science

Protocol (science)

Computer architecture

Embedded system

Operating system

Computer network

Article

인용수 9

2023

GraNDe: Efficient Near-Data Processing Architecture for Graph Neural Networks

Sungmin Yun, Hwayong Nam, Jaehyun Park, Byeongho Kim, Jung Ho Ahn, Eojin Lee

IF 3.6 (2023)

IEEE Transactions on Computers

4.00 \times

및

1.98 \times

의 속도 향상을 보인다.

https://doi.org/10.1109/tc.2023.3283677

Computer science

Parallel computing

Adjacency matrix

Datapath

Adjacency list

Cache

Dram

Memory bandwidth

Graph

Theoretical computer science

Article

인용수 7

2022

MaPHeA: A Framework for Lightweight Memory Hierarchy-aware Profile-guided Heap Allocation

Deok-Jae Oh, Yaebin Moon, Do Kyu Ham, Tae Jun Ham, Yongjun Park, Jae W. Lee, Jung Ho Ahn, Eojin Lee

IF 2 (2022)

ACM Transactions on Embedded Computing Systems

https://doi.org/10.1145/3527853

Computer science

Heap (data structure)

Memory hierarchy

Dram

Profiling (computer programming)

Operating system

Cache

Locality

Embedded system

Overlay

Article

인용수 12

2022

GraNDe: Near-Data Processing Architecture With Adaptive Matrix Mapping for Graph Convolutional Networks

Sungmin Yun, Byeongho Kim, Jaehyun Park, Hwayong Nam, Jung Ho Ahn, Eojin Lee

IF 2.3 (2022)

IEEE Computer Architecture Letters

https://doi.org/10.1109/lca.2022.3182387

Computer science

Parallel computing

Speedup

Adjacency matrix

Datapath

Graph

Bipartite graph

Adjacency list

Dram

Dataflow

Article

인용수 0

2025

Optimizing HBM-PIM Throughput through DRAM ACT and PRE Hiding

Hyeonu Kim, Eojin Lee

Journal of KIISE

현대의 대규모 언어 모델(LLM)과 같은 응용프로그램은 높은 메모리 대역폭을 요구하며, 기존 메모리 장치만으로 이를 충족시키기는 어렵다. 메모리 대역폭의 부족은 호스트 프로세서와 메모리 간의 데이터 전송 시간을 증가시켜 성능 병목 현상을 초래한다. 이를 해결하기 위해 Processing in memory (PIM) 구조는 메모리 뱅크 근처에 연산 유닛을 배치하여 호스트의 작업을 분산시키고, DRAM 내부 대역폭을 활용한다. 본 논문에서는 DRAM 마이크로 아키텍처를 고려하여 실제로 개발된 PIM 장치 중 하나인 HBM-PIM의 동작을 심층 분석한다. 이를 바탕으로, HBM-PIM의 구조적 특성을 활용하여 하드웨어 변경 없이 수행할 수 있는 최적화 기법을 제안한다. PIM 명령어 순서와 데이터 매핑 방식을 조정하고, 메모리 배리어 배치를 최적화함으로써, DRAM 행 버퍼 충돌로 인한 지연시간을 최소화하고 HBM-PIM의 성능을 개선한다.

https://doi.org/10.5626/jok.2025.52.7.557

Dram

Throughput

Computer science

Embedded system

Reliability engineering

Computer architecture

Parallel computing

Computer hardware

Operating system

Engineering

Article

인용수 5

2025

PET: Proactive Demotion for Efficient Tiered Memory Management

Wanju Doh, Yaebin Moon, Seoyoung Ko, Seunghwan Chung, Kwanhee Kyung, Eojin Lee, Jung Ho Ahn

계층형 메모리는 DRAM을 상위 계층(빠른 메모리)으로, 느리지만 저렴한 바이트 주소 지정 가능 메모리를 하위 계층(느린 메모리)으로 사용함으로써 더 낮은 비용으로 주기억장치 용량을 늘릴 수 있는 유망한 접근법이다. 계층형 메모리를 효율적으로 사용하는 방법 중 하나인 사전적 디모션(proactive demotion)은 빠른 메모리에 충분한 빈 공간이 있더라도 차가운 데이터를 느린 메모리로 강등(demote)한다. 선행 연구에서는 사전적 디모션을 활용하여 빠른 메모리에서 애플리케이션의 상주 집합 크기(resident set size)를 줄임으로써 주기억장치의 높은 비용을 낮추는 데 사용해왔다. 또한 사전적 디모션은 뜨거운 데이터에 대한 수요가 급증하는 상황에서 빠른 메모리 부족으로 인해 발생하는 심각한 성능 저하를 완화하는 데도 도움이 된다. 그러나 우리는 애플리케이션의 할당 단위(allocation units) 내에서 메모리 접근 지역성을 활용하면, 시스템 오버헤드는 낮추면서 더 큰 빠른 메모리 절감 효과를 달성할 수 있음을 관찰하였다.

https://doi.org/10.1145/3689031.3717471

Demotion

Computer science

Political science

Article

인용수 9

2024

CLAY: CXL-based Scalable NDP Architecture Accelerating Embedding Layers

Sungmin Yun, Hwayong Nam, Kwanhee Kyung, Jaehyun Park, Byeongho Kim, Yongsuk Kwon, Eojin Lee, Jung Ho Ahn

임베딩 계층(embedding layer)은 특히 추천 시스템과 그래프 신경망(graph neural networks)에서 심층 신경망의 가장 핵심적인 구성 요소들 중 하나이다. 임베딩 계층은 큰 메모리 요구량과 연산에서의 데이터 재사용이 거의 없다는 점 때문에 전체 실행 시간의 상당 부분을 지배한다. 임베딩 계층을 가속하기 위해, 듀얼 인라인 메모리 모듈(DIMM) 기반 near-data processing 아키텍처가 제안되었다. 이들은 DIMM의 버퍼에 처리 장치를 추가함으로써 대역폭을 증폭한다. 그러나 기존 아키텍처는 메모리 채널 수의 제한으로 인해 용량 확장성이 낮다. 결정적으로, 이들은 처리 장치와 호스트 사이에 멀티드롭 버스 구조가 있는 DIMM 기반 메모리 시스템의 제약과 로드 불균형(load imbalance) 문제로 인해 성능 향상에 한계가 있다.

https://doi.org/10.1145/3650200.3656595

Computer science

Scalability

Embedding

Parallel computing

Distributed computing

Computer network

Embedded system

Operating system

Artificial intelligence

Article

인용수 8

2024

IDT: Intelligent Data Placement for Multi-tiered Main Memory with Reinforcement Learning

Juneseo Chang, Wanju Doh, Yaebin Moon, Eojin Lee, Jung Ho Ahn

DRAM 기반 단일 티어가 주기억장치의 종합적 요구를 충족하는 데 한계가 있다는 점을 해결하기 위해, 다중 티어 메모리 시스템이 널리 채택되고 있다. 이러한 시스템을 지원하기 위해, 응용 프로그램의 메모리 접근 패턴을 분석하고 데이터가 적절한 메모리 티어에 배치되도록 보장하는 운영체제 수준의 해결책은 광범위하게 연구되어 왔다.

https://doi.org/10.1145/3625549.3658659

Computer science

Reinforcement learning

Human–computer interaction

Artificial intelligence

Computer architecture

Article

인용수 37

2023

SHADOW: Preventing Row Hammer in DRAM with Intra-Subarray Row Shuffling

Minbok Wi, Jaehyun Park, Seoyoung Ko, Michael Jaemin Kim, Nam Sung Kim, Eojin Lee, Jung Ho Ahn

행 단위 로우 해머(Row Hammer, RH) 공격은 컴퓨터 시스템에 대한 핵심적인 위협으로 여겨져 왔으며, 이에 따라 다수의 하드웨어 기반(HWbased) RH 완화 전략이 제안되어 왔다. 그러나 비인접(non-adjacent) RH 공격의 출현과 더 낮은 RH 임계값의 도입은, 이들 선행 솔루션의 보수적인 설계 특성으로 인해 해당 솔루션들의 면적 및 성능 오버헤드를 크게 증가시킨다. 우리는 Shuffling Aggressor DRAM Rows (SHADOW)라는 새로운 in-DRAM RH 보호 솔루션을 제안한다. SHADOW는 DRAM 로우 매핑 정보를 동적으로 무작위화하여, 공격자가 중요 데이터를 보유할 수 있는 특정 희생자(victim) 로우를 표적으로 삼지 못하게 한다. SHADOW는 in-DRAM 로우 셔틀(row-shuffle) 기법을 활용하기 때문에 비인접 RH 공격에 대해 강건하다. in-DRAM 로우 셔틀 동작을 낮은 성능 및 전력 오버헤드로 구현하기 위해, 우리는 새로운 DRAM 마이크로아키텍처 최적화 기법을 사용한다. 또한 최근에 도입된 JEDEC RFM 인터페이스를 활용하여 DRAM 인터페이스 변경 없이 in-DRAM RH 완화를 가능하게 한다. 추가적인 subarray당 DRAM 로우를 이용함으로써, SHADOW는 RFM 인터페이스를 위한 본질적 카운터(intrinsic counters) 이외에는 SRAM 또는 CAM 기반의 비용이 큰 추적(tracking) 구조를 요구하지 않는다. 우리는 적대적(adversarial) 패턴 분석을 통해 SHADOW의 RH 공격에 대한 강력한 확률적 보호 성능을 입증하고, 최신 하드웨어 기반 RH 예방 솔루션들과 비교하여 설득력 있는 성능, 면적 및 전력 오버헤드를 강조한다.

https://doi.org/10.1109/hpca56546.2023.10070966

Dram

Computer science

Universal memory

Overhead (engineering)

Shuffling

Row

Interface (matter)

Pyramid (geometry)

Static random-access memory

Embedded system

주요 논문

*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.

Article

인용수 0

2025

Fold-PIM: A Cost-Efficient LPDDR5-Based PIM for On-Device SLMs

Kyoungho Jeun, Hyeonu Kim, Eojin Lee

IF 1.4 (2025)

IEEE Computer Architecture Letters

https://doi.org/10.1109/lca.2025.3566692

Computer science

Computer architecture

Article

인용수 0

2024

Architecting Compatible PIM Protocol for CPU-PIM Collaboration

Seunghyuk Yu, Hyeonu Kim, Kyoungho Jeun, Sun-Young Hwang, Eojin Lee

IF 1.4 (2024)

IEEE Computer Architecture Letters

http://dx.doi.org/10.1109/lca.2024.3432936

Computer science

Protocol (science)

Computer architecture

Embedded system

Operating system

Computer network

Article

인용수 9

2023

GraNDe: Efficient Near-Data Processing Architecture for Graph Neural Networks

Sungmin Yun, Hwayong Nam, Jaehyun Park, Byeongho Kim, Jung Ho Ahn, Eojin Lee

IF 3.6 (2023)

IEEE Transactions on Computers

4.00 \times

및

1.98 \times

의 속도 향상을 보인다.

https://doi.org/10.1109/tc.2023.3283677

Computer science

Parallel computing

Adjacency matrix

Datapath

Adjacency list

Cache

Dram

Memory bandwidth

Graph

Theoretical computer science

Article

인용수 12

2022

GraNDe: Near-Data Processing Architecture With Adaptive Matrix Mapping for Graph Convolutional Networks

Sungmin Yun, Byeongho Kim, Jaehyun Park, Hwayong Nam, Jung Ho Ahn, Eojin Lee

IF 2.3 (2022)

IEEE Computer Architecture Letters

https://doi.org/10.1109/lca.2022.3182387

Computer science

Parallel computing

Speedup

Adjacency matrix

Datapath

Graph

Bipartite graph

Adjacency list

Dram

Dataflow

Article

인용수 7

2022

MaPHeA: A Framework for Lightweight Memory Hierarchy-aware Profile-guided Heap Allocation

Deok-Jae Oh, Yaebin Moon, Do Kyu Ham, Tae Jun Ham, Yongjun Park, Jae W. Lee, Jung Ho Ahn, Eojin Lee

IF 2 (2022)

ACM Transactions on Embedded Computing Systems

https://doi.org/10.1145/3527853

Computer science

Heap (data structure)

Memory hierarchy

Dram

Profiling (computer programming)

Operating system

Cache

Locality

Embedded system

Overlay

전체 논문

Article

인용수 0

2025

Fold-PIM: A Cost-Efficient LPDDR5-Based PIM for On-Device SLMs

Kyoungho Jeun, Hyeonu Kim, Eojin Lee

IF 1.4 (2025)

IEEE Computer Architecture Letters

https://doi.org/10.1109/lca.2025.3566692

Computer science

Computer architecture

Article

인용수 0

2024

Architecting Compatible PIM Protocol for CPU-PIM Collaboration

Seunghyuk Yu, Hyeonu Kim, Kyoungho Jeun, Sun-Young Hwang, Eojin Lee

IF 1.4 (2024)

IEEE Computer Architecture Letters

http://dx.doi.org/10.1109/lca.2024.3432936

Computer science

Protocol (science)

Computer architecture

Embedded system

Operating system

Computer network

Article

인용수 9

2023

GraNDe: Efficient Near-Data Processing Architecture for Graph Neural Networks

Sungmin Yun, Hwayong Nam, Jaehyun Park, Byeongho Kim, Jung Ho Ahn, Eojin Lee

IF 3.6 (2023)

IEEE Transactions on Computers

4.00 \times

및

1.98 \times

의 속도 향상을 보인다.

https://doi.org/10.1109/tc.2023.3283677

Computer science

Parallel computing

Adjacency matrix

Datapath

Adjacency list

Cache

Dram

Memory bandwidth

Graph

Theoretical computer science

Article

인용수 7

2022

MaPHeA: A Framework for Lightweight Memory Hierarchy-aware Profile-guided Heap Allocation

Deok-Jae Oh, Yaebin Moon, Do Kyu Ham, Tae Jun Ham, Yongjun Park, Jae W. Lee, Jung Ho Ahn, Eojin Lee

IF 2 (2022)

ACM Transactions on Embedded Computing Systems

https://doi.org/10.1145/3527853

Computer science

Heap (data structure)

Memory hierarchy

Dram

Profiling (computer programming)

Operating system

Cache

Locality

Embedded system

Overlay

Article

인용수 12

2022

GraNDe: Near-Data Processing Architecture With Adaptive Matrix Mapping for Graph Convolutional Networks

Sungmin Yun, Byeongho Kim, Jaehyun Park, Hwayong Nam, Jung Ho Ahn, Eojin Lee

IF 2.3 (2022)

IEEE Computer Architecture Letters

https://doi.org/10.1109/lca.2022.3182387

Computer science

Parallel computing

Speedup

Adjacency matrix

Datapath

Graph

Bipartite graph

Adjacency list

Dram

Dataflow

Article

인용수 0

2025

Optimizing HBM-PIM Throughput through DRAM ACT and PRE Hiding

Hyeonu Kim, Eojin Lee

Journal of KIISE

https://doi.org/10.5626/jok.2025.52.7.557

Dram

Throughput

Computer science

Embedded system

Reliability engineering

Computer architecture

Parallel computing

Computer hardware

Operating system

Engineering

Article

인용수 5

2025

PET: Proactive Demotion for Efficient Tiered Memory Management

Wanju Doh, Yaebin Moon, Seoyoung Ko, Seunghwan Chung, Kwanhee Kyung, Eojin Lee, Jung Ho Ahn

https://doi.org/10.1145/3689031.3717471

Demotion

Computer science

Political science

Article

인용수 9

2024

CLAY: CXL-based Scalable NDP Architecture Accelerating Embedding Layers

Sungmin Yun, Hwayong Nam, Kwanhee Kyung, Jaehyun Park, Byeongho Kim, Yongsuk Kwon, Eojin Lee, Jung Ho Ahn

https://doi.org/10.1145/3650200.3656595

Computer science

Scalability

Embedding

Parallel computing

Distributed computing

Computer network

Embedded system

Operating system

Artificial intelligence

Article

인용수 8

2024

IDT: Intelligent Data Placement for Multi-tiered Main Memory with Reinforcement Learning

Juneseo Chang, Wanju Doh, Yaebin Moon, Eojin Lee, Jung Ho Ahn

https://doi.org/10.1145/3625549.3658659

Computer science

Reinforcement learning

Human–computer interaction

Artificial intelligence

Computer architecture

Article

인용수 37

2023

SHADOW: Preventing Row Hammer in DRAM with Intra-Subarray Row Shuffling

Minbok Wi, Jaehyun Park, Seoyoung Ko, Michael Jaemin Kim, Nam Sung Kim, Eojin Lee, Jung Ho Ahn

https://doi.org/10.1109/hpca56546.2023.10070966

Dram

Computer science

Universal memory

Overhead (engineering)

Shuffling

Row

Interface (matter)

Pyramid (geometry)

Static random-access memory

Embedded system