논문 | 김용우 교수 연구실 | 한국교원대학교 기술교육과

|김용우 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

논문

연구 성과 추이

표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

주요 논문

*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.

Article

인용수 0

2025

Efficient Hardware-Assisted Heap Memory Safety for Embedded RISC-V Systems

Hyunjae Park, Yonghae Kim, Dongwook Kang, Hongil Ju, Gaeil An, Yongwoo Kim

IF 3.6 (2025)

IEEE Access

최근 수년간 임베디드 환경에서의 메모리 안전성 이슈는 큰 주목을 받아 왔으며, 힙 메모리에서 발생하는 공간적 및 시간적 메모리 위반은 중요한 보안 위협으로 부상하고 있다. 이러한 과제에 대응하기 위해, 본 논문은 RISC-V 순차(in-order) 프로세서를 대상으로 하는 효율적인 태그 기반 메모리 검증 시스템을 제안한다. 제안된 시스템은 하드웨어 수준의 리플레이(replay) 메커니즘을 통합함으로써 성능 오버헤드를 최소화하도록 설계되었으며, Heap Check Cache(HC-Cache), FIFO Buffer, Store Head Buffer/Clear Head Buffer(SHB/CHB)를 포함한다. 소프트웨어 측면에서는 메타데이터 관리와 태그 생성의 자동화를 위해 확장된 RISC-V ISA 명령 및 수정된 Newlib C 라이브러리를 채택하였고, 사용자 애플리케이션에 대한 추가적인 수정 요구 없이 동작한다. 본 시스템은 Xilinx VC707 보드를 사용한 FPGA 플랫폼에서 구현되었다. 구현 결과, BRAM(0.66%) 및 LUTRAM(0.99%)에 대해서는 최소 오버헤드를 유지하면서 LUT는 16.07% 증가, Flip-Flops는 58.25% 증가하는 것으로 나타났다. Mibench, Olden, SPEC2006과 같은 워크로드를 이용한 성능 평가는 기존 연구에 비해 평균 성능 오버헤드가 유의하게 낮음을 보여주었다. 또한 NIST Juliet Test Suite 1.3을 사용한 검증 결과, 본 시스템은 1,924건의 힙 기반 오버플로우, 803건의 double-free 오류, 394건의 use-after-free 오류를 포함한 힙 관련 취약점의 100%를 성공적으로 탐지하였다. 이러한 결과는 제안된 시스템이 자원이 제한된 임베디드 환경에서도 높은 보안성과 성능 효율을 제공함을 입증한다.

https://doi.org/10.1109/access.2025.3570777

Computer science

Embedded system

Memory safety

Heap (data structure)

Memory protection

Operating system

Parallel computing

Computer hardware

Memory management

Overlay

Article

인용수 1

2025

LLTQ+: A Hardware-Friendly Quantization Framework for Modern YOLO Architectures

Yugwon Seo, Jaemyung Kim, Jin-Ku Kang, Yongwoo Kim

IF 3.6 (2025)

IEEE Access

YOLO 기반 객체 검출 모델은 높은 정확도와 빠른 추론 속도 덕분에 실시간 응용 분야에서 널리 사용된다. 그러나 복잡한 아키텍처와 높은 계산 요구량은 저전력 엣지 디바이스에 배포하는 데 있어 어려움을 야기한다. 이를 해결하기 위해, 하드웨어 친화적 양자화 기법인 LLTQ의 향상 버전인 LLTQ+를 제안한다. 제안된 접근법은 Quantization-Aware Training(QAT) 동안 배치 정규화(batch normalization) 계층을 보존하여 학습 안정성과 정확도를 유지하며, YOLO 네트워크의 핵심 구조 구성 요소인 RepConv의 표현력을 보존하는 양자화 전략을 도입한다. PASCAL VOC 데이터셋에 대한 실험 결과는 LLTQ+의 효과를 입증한다. YOLOv10-s에서 LLTQ+는 정수 전용 추론(integer-only inference) 조건에서 mAP(0.5) 80.6%, mAP(0.5:0.95) 61.8%를 달성했으며, 이는 각각 LLTQ 대비 0.9 및 1.7 퍼센트 포인트를 상회한다. YOLOv9-t에서는 LLTQ+가 mAP(0.5:0.95) 52.9%를 달성하여 LLTQ 대비 0.5 포인트 향상되었다. YOLOv7 및 YOLOv7-tiny와 같은 다른 아키텍처에서도 일관된 성능 향상이 관찰되었다. 이러한 결과는 LLTQ+가 최신의 더 복잡한 YOLO 네트워크에 대해서도 정수 양자화를 효과적으로 지원함을 확인해 주며, 정확도와 계산 효율 간의 균형을 이루는 실용적인 양자화 해법을 제공한다.

https://doi.org/10.1109/access.2025.3603536

Computer science

Quantization (signal processing)

Computer architecture

Environmentally friendly

Architecture

Embedded system

Computer vision

Article

인용수 3

2023

MASCAR: Multidomain Adaptive Spatial–Spectral Variable Compression Artifact Removal Network for Multispectral Remote Sensing Images

Jaemyung Kim, Hyun-Ho Kim, Doochun Seo, Jaeheon Jeong, Jin-Ku Kang, Yongwoo Kim

IF 7.5 (2023)

IEEE Transactions on Geoscience and Remote Sensing

원격탐사 환경에서 영상 압축은 제한된 대역폭과 저장 용량으로 인해 고해상도 영상을 효율적으로 전송하고 저장하기 위해 필수적이다. 그러나 압축은 흔히 영상 품질 저하를 초래하며, 이로 인해 후처리 단계에서 압축 아티팩트 제거 기술이 요구된다. 딥 신경망은 영상 복원에서 주목할 만한 성능을 보여 왔지만, 기존의 대부분 방법은 원격탐사 환경에 특화된 압축 조건을 충분히 고려하지 못했으며 주로 합성 데이터셋에서 평가되었다. 이러한 문제를 해결하기 위해, 본 연구에서는 원격탐사 환경에서 압축된 영상의 지표면 상세 정보를 효과적으로 복원하는 다중도메인 적응형 공간–분광 변수 압축 아티팩트 제거 네트워크(MASCAR)를 제안한다. 입력 국소 패치를 서로 다른 도메인으로 분해하여 다양한 특징을 추출하는 다중도메인 국소-패치 협업 학습 전략을 도입한다. 또한, 미세 텍스처 상세 복원으로 네트워크의 초점을 유도하고 국소 패치의 픽셀 분포에 상당한 편차가 있는 원격탐사 영상을 안정적으로 학습할 수 있도록 하는 상세 중심화 접근법을 제안한다. 더 나아가, 복원된 영상의 디테일을 향상시키기 위한 디테일 향상 접근법도 제시한다. 아울러, 원격탐사 환경에서 알려지지 않은 압축 비율에 유연하게 대응하기 위해 통합된 압축 영상 품질 적응 메커니즘을 제안한다. 제안한 방법을 적용한 MASCAR의 성능은 합성 및 실제 원격탐사 데이터셋에서 평가하였다. 실험 결과는 제안 방법이 기존 방법에 비해 정량적 성능과 시각적 품질이 더 우수함을 보여준다.

https://doi.org/10.1109/tgrs.2023.3347518

Computer science

Multispectral image

Remote sensing

Image compression

Artificial intelligence

Compressed sensing

Data compression

Computer vision

Pixel

Image resolution

Article

인용수 15

2022

Target Capacity Filter Pruning Method for Optimized Inference Time Based on YOLOv5 in Embedded Systems

Jihun Jeon, Jaemyung Kim, Jin-Ku Kang, SungTae Moon, Yongwoo Kim

IF 3.9 (2022)

IEEE Access

최근 컴퓨터 비전 분야에서 우수한 성능을 보이는 합성곱 신경망(CNNs)이 주목받고 있다. 그러나 정확도를 높이기 위해 네트워크를 더 넓게 만들수록 매개변수 수와 연산 비용이 지수적으로 증가한다. 따라서 제한된 자원, 연산 성능 및 전력을 갖춘 임베디드 환경에서는 딥러닝 네트워크를 사용하기가 어렵다. 또한 CNN은 추론(inference)에 많은 시간이 소요된다. 이러한 문제를 해결하기 위해 본 연구에서는 목표 용량 및 추론 가속을 위한 최적의 네트워크 아키텍처를 제공하는 실용적인 필터 가지치기(filter pruning) 방법을 제안한다. 추론 시간과 FLOPs 간의 상관관계를 규명한 후, 원하는 추론 시간을 갖는 네트워크를 생성하는 방법을 제안하였다. 제안된 필터 가지치기 방법의 성능을 평가하기 위해 다양한 객체 검출(object detection) 데이터셋을 사용하였다. 가지치기된 네트워크의 추론 시간은 NVIDIA Jetson Xavier NX 플랫폼을 사용하여 측정하고 분석하였다. 그 결과, PASCAL VOC 데이터셋에서 YOLOv5 네트워크의 매개변수 수 및 FLOPs를 각각 30%, 40%, 50% 가지치기했을 때 mAP는 각각 0.6%, 2.3%, 2.9% 감소한 반면, 추론 시간은 각각 14.3%, 26.4%, 34.5% 개선되었다.

https://doi.org/10.1109/access.2022.3188323

FLOPS

Inference

Computer science

Pruning

Convolutional neural network

Artificial intelligence

Pascal (unit)

Filter (signal processing)

Deep learning

Machine learning

Article

인용수 21

2022

A Low-Cost Fully Integer-Based CNN Accelerator on FPGA for Real-Time Traffic Sign Recognition

Jaemyung Kim, Jin-Ku Kang, Yongwoo Kim

IF 3.9 (2022)

IEEE Access

교통 표지 인식(Traffic sign recognition, TSR) 기술은 차량이 카메라를 통해 도로 표지를 인식하고 이를 주행에 활용할 수 있게 한다. 교통 안전을 위해 TSR은 첨단 운전자 보조 시스템(Advanced driver assistance systems, ADAS)을 구성하는 핵심 기술 중 하나이며, 여러 연구가 수행되어 왔다. 합성곱 신경망(Convolutional neural networks, CNN)의 등장은 특히 ADAS 환경에서 자동차 분야에 새로운 가능성을 열어 주었다. 그러나 대부분의 CNN이 높은 연산 자원과 메모리 사용을 요구하므로, 자원 제약이 있는 ADAS에서 실시간 TSR 애플리케이션을 배치하는 것은 어렵다. 이 문제를 해결하기 위해 임베디드 플랫폼에서의 최적화를 고려한 일부 연구가 진행되어 왔으나, 기존 연구는 많은 하드웨어 자원을 사용하거나 연산 성능이 낮은 것으로 나타났다. 본 논문에서는 저비용의 CNN 기반 실시간 TSR 하드웨어 가속기를 제안한다. 첫째, 계산 복잡도를 줄이기 위해 새롭고 하드웨어 친화적인 양자화 방법을 확장한다. 이 양자화 방법은 CNN을 재구성하여 잔차 블록(residual blocks)의 skip connection 경로를 포함한 모든 연산이 정수 연산만을 사용하도록 하며, 양자화 선형 매핑(affine mapping) 과정을 시프트 연산으로 대체함으로써 계산 오버헤드를 감소시킨다. 둘째, 제안하는 하드웨어 가속기는 실시간 추론과 자원 소모 간의 균형을 맞추기 위해 두 가지 병렬화 전략을 적용한다. 또한 잔차 블록의 skip connection 경로를 처리하는 단순하면서도 효과적인 하드웨어 설계 방안을 제시한다. 이 설계 방안은 skip connection 경로의 데이터플로우를 최적화하고, 추가적인 내부 메모리 사용을 줄일 수 있다. 실험 결과, 재구성된 완전 정수 기반 CNN은 24M 정수 연산(operations, IOPs)만을 필요로 하며 모델 크기는 0.17MB이다. 기존 연구와 비교할 때, 제안된 CNN 모델 크기는 ×105만큼 감소하였고 연산 수는 ×58만큼 감소하였다. 또한 제안된 CNN은 TSR 정확도 99.07%를 달성할 수 있으며, 임베디드 플랫폼에서 구현된 CNN 기반 TSR 연구들 중 가장 높은 정확도이다. 제안된 하드웨어 가속기는 Xilinx ZC706 SoC에서 구현 시 960 MOPS의 연산 성능과 40 FPS의 프레임 레이트를 달성한다. 결과적으로 본 연구는 기존 연구에 비해 연산 성능과 프레임 레이트에서 각각 ×11.87 및 ×36.7만큼 향상시킨다.

https://doi.org/10.1109/access.2022.3197906

Computer science

Field-programmable gate array

Quantization (signal processing)

Traffic sign recognition

Convolutional neural network

Hardware acceleration

Computer engineering

Speedup

Computer hardware

Computation

전체 논문

Article

인용수 0

2025

Efficient Hardware-Assisted Heap Memory Safety for Embedded RISC-V Systems

Hyunjae Park, Yonghae Kim, Dongwook Kang, Hongil Ju, Gaeil An, Yongwoo Kim

IF 3.6 (2025)

IEEE Access

https://doi.org/10.1109/access.2025.3570777

Computer science

Embedded system

Memory safety

Heap (data structure)

Memory protection

Operating system

Parallel computing

Computer hardware

Memory management

Overlay

Article

인용수 1

2025

LLTQ+: A Hardware-Friendly Quantization Framework for Modern YOLO Architectures

Yugwon Seo, Jaemyung Kim, Jin-Ku Kang, Yongwoo Kim

IF 3.6 (2025)

IEEE Access

https://doi.org/10.1109/access.2025.3603536

Computer science

Quantization (signal processing)

Computer architecture

Environmentally friendly

Architecture

Embedded system

Computer vision

Article

인용수 3

2023

MASCAR: Multidomain Adaptive Spatial–Spectral Variable Compression Artifact Removal Network for Multispectral Remote Sensing Images

Jaemyung Kim, Hyun-Ho Kim, Doochun Seo, Jaeheon Jeong, Jin-Ku Kang, Yongwoo Kim

IF 7.5 (2023)

IEEE Transactions on Geoscience and Remote Sensing

https://doi.org/10.1109/tgrs.2023.3347518

Computer science

Multispectral image

Remote sensing

Image compression

Artificial intelligence

Compressed sensing

Data compression

Computer vision

Pixel

Image resolution

Article

인용수 15

2022

Target Capacity Filter Pruning Method for Optimized Inference Time Based on YOLOv5 in Embedded Systems

Jihun Jeon, Jaemyung Kim, Jin-Ku Kang, SungTae Moon, Yongwoo Kim

IF 3.9 (2022)

IEEE Access

https://doi.org/10.1109/access.2022.3188323

FLOPS

Inference

Computer science

Pruning

Convolutional neural network

Artificial intelligence

Pascal (unit)

Filter (signal processing)

Deep learning

Machine learning

Article

인용수 21

2022

A Low-Cost Fully Integer-Based CNN Accelerator on FPGA for Real-Time Traffic Sign Recognition

Jaemyung Kim, Jin-Ku Kang, Yongwoo Kim

IF 3.9 (2022)

IEEE Access

https://doi.org/10.1109/access.2022.3197906

Computer science

Field-programmable gate array

Quantization (signal processing)

Traffic sign recognition

Convolutional neural network

Hardware acceleration

Computer engineering

Speedup

Computer hardware

Computation

Article

인용수 0

2025

Design and Analysis of an Optimized Cache Structure based on 32-bit RISC-V RV32I using FPGA

Hwa-Joon Oh, Yongwoo Kim

Journal of the Institute of Electronics and Information Engineers

임베디드 시스템은 대부분 ARM 기반 Cortex-R, Cortex-M 계열 마이크로 컨트롤러가 많이 사용되며, 고성능을 위해 캐시가 필수적으로 사용된다. 하지만, 최근에 활발하게 연구되고 있는 개방형 프로세서인 RISC-V 프로세서는 적합한 캐시 구조 및 크기별 성능과 자원 사용량을 종합적으로 분석한 연구가 부족하다. 따라서, 본 연구에서는 임베디드 RISC-V 기반의 32비트 RV32I 5단계 파이프라인 프로세서에 다양한 캐시 구조(Direct Mapped Cache, 4-Way Set-Associate Cache, Fully Associate Cache)를 명령어 캐시와 데이터 캐시로 구현하고, Dhrystone과 Coremark 벤치마크 프로그램을 통해 평가하여 최적의 캐시 구조와 크기를 도출하였다. FPGA 보드인 Artix-7 Nexys A7-100T를 사용하여 최대 동작 주파수 50MHz를 목표로 합성 및 구현을 통해 하드웨어 자원 사용량을 분석하였으며, FPGA에서 캐시 동작을 검증하였다. 성능 평가용 벤치마크 프로그램 점수와 캐시 실패율, 그리고 하드웨어 자원 사용량을 종합적으로 고려한 결과, 최적의 명령어 캐시 구조 및 크기는 16KiB 크기의 4-Way Set-Associate Cache, 데이터 캐시는 4KiB 크기의 4-Way Set-Associate Cache로 분석되었다.

https://doi.org/10.5573/ieie.2025.62.4.27

Cache

Field-programmable gate array

Computer science

Parallel computing

Embedded system

Reduced instruction set computing

Computer architecture

32-bit

Instruction set

Article

인용수 0

2025

A Study on Hardware-friendly Quantization for Object Detection Networks using Integer-only Arithmetic Operations

Yugwon Seo, Jin-Ku Kang, Yongwoo Kim

Journal of the Institute of Electronics and Information Engineers

최근 하드웨어 기술의 발전으로 딥러닝 기술이 컴퓨터 비전을 비롯한 다양한 분야에서 활발하게 활용되고 있다. 특히 컴퓨터 비전 분야에서는 높은 성능을 위해 CNN을 사용하는데, 더 많은 컨볼루션 계층을 구성할수록 성능이 향상된다. 그러나 많은 메모리와 연산 자원을 소모하기 때문에 임베디드 환경에서 적용하기 어렵다. 이를 해결하기 위한 방법 중 하나로 32비트 부동소수점 데이터를 더 낮은 비트의 정수 데이터로 변환하는 양자화 기법이 있다. 양자화 기법 중 스케일 인자를 2의 거듭제곱으로 나타내는 등의 방법을 적용하여 하드웨어 친화적으로 양자화를 진행하는 방법이 존재하는데, 이러한 방법은 양자화 인식 훈련을 진행하기 전 배치 정규화 계층 융합을 진행하기 때문에 재훈련 과정에서 배치 정규화 계층의 이점을 받을 수 없다. 본 논문에서는 배치 정규화 계층의 융합 방식을 변형하여, 양자화 인식 훈련 중에도 배치 정규화 계층의 장점을 유지할 수 있는 하드웨어 친화적인 양자화 인식 훈련 기법을 제안한다. 제안된 방법을 YOLOv7-tiny 객체 탐지 모델에 적용하여 성능을 검증한 결과, 기존 방법에 비해 mAP(0.5)에서 최대 1.5%p의 성능 향상을 확인하였다. 또한, 양자화 인식 훈련을 마친 모델을 정수 연산만을 사용하는 네트워크로 변환한 모델에서도 성능을 검증한 결과, mAP(0.5)에서 최대 2.5%p의 성능 향상을 보였다.

https://doi.org/10.5573/ieie.2025.62.4.75

Arithmetic

Quantization (signal processing)

Computer science

Integer (computer science)

Object (grammar)

Computer hardware

Parallel computing

Algorithm

Mathematics

Artificial intelligence

Article

인용수 0

2025

PanSAM-HAT: A Hybrid Attention Transformer With Panchromatic Spectral Attention Module for Compression Artifacts Removal in Satellite Imagery

Hyun-Ho Kim, Jaemyung Kim, Doochun Seo, Jaeheon Jeong, Yongwoo Kim

IF 3.6 (2025)

IEEE Access

다중분광(MS) 위성 영상은 전송 대역폭과 센서 스캐닝 능력의 제약으로 인해 공간-분광 가변 압축(SSVC)을 자주 받는다. 이러한 압축 과정은 공간 위치와 분광 밴드에 따라 달라지며, 특히 압축 비율을 알 수 없는 경우 심각한 왜곡과 블록 아티팩트를 유발할 수 있다. 본 연구에서는 이러한 문제를 해결하기 위해 SSVC로 압축된 MS 영상에서 아티팩트 제거를 효과적으로 수행하기 위한 하이브리드 어텐션 트랜스포머(PanSAM-HAT)를 제안한다. PanSAM-HAT는 새로운 팬크로마틱 분광 어텐션 모듈(PanSAM)을 포함하여 SSVC 압축 MS 영상의 아티팩트 제거를 지원한다. PanSAM은 픽셀 단위 어텐션 메커니즘을 통해 MS의 분광 정보를 고해상도 팬크로마틱(PAN) 영상의 공간 구조와 적응적으로 통합함으로써 공간 및 분광 충실도의 견고한 복원을 가능하게 한다. 또한, 압축 아티팩트 제거(CAR) 네트워크의 성능을 분석하고 해석하기 위한 새로운 어트리뷰션 매핑 기법인 JPEG LAM을 제시한다. JPEG LAM은 JPEG 아티팩트에 대한 네트워크의 주의를 강조하기 위해 압축 인식 보간 경로와 그래디언트 기반 블록 경계 분석을 도입한다. 합성 및 실제 원격탐사 데이터셋에 대한 광범위한 실험 결과, 제안하는 PanSAM-HAT는 SSVC 시나리오에서 압축 아티팩트를 감소시키고 영상 품질을 향상시키는 데 있어 기존의 합성곱 신경망 기반 방법과 트랜스포머 기반 방법을 일관되게 능가함을 보여주었다.

https://doi.org/10.1109/access.2025.3602150

Panchromatic film

Computer science

Satellite broadcasting

Satellite

Transformer

Satellite imagery

Data compression

Remote sensing

Computer vision

Artificial intelligence

Article

인용수 0

2025

AHCO-YOLO: An Algorithm–Hardware Co-Optimization Framework for Energy-Efficient and Real-Time Object Detection on Edge Devices

Jaemyung Kim, Jin-Ku Kang, Yongwoo Kim

IF 3.1 (2025)

IEEE Transactions on Very Large Scale Integration (VLSI) Systems

엣지 기기에서의 실시간 객체 탐지는 엄격한 계산량, 메모리, 전력 예산 하에서 수행된다. 기존 연구는 대체로 모델 압축과 하드웨어 가속을 독립적으로 다루어 정확도, 지연시간, 에너지 간의 최적이 아닌 절충을 초래한다. 본 연구에서는 모델 설계, 양자화, 설계 공간 탐색(DSE), 하드웨어 구현을 하나로 통합하는 알고리즘–하드웨어 공동 최적화 프레임워크(AHCO)인 AHCO-YOLO를 제시한다. 이 접근은 고립된 방법들이 갖는 한계를 극복하고 시너지 효과에 기반한 향상을 제공한다. 우리는 배치 정규화(BN)를 보존하는 양자화 방법을 적용한, 하드웨어 친화적이고 경량화된 You Only Look Once (YOLO) 모델을 도입하여, 낮은 정밀도에서도 정확도를 유지하면서 모델 크기를 감소시킨다. 또한 층(layer)별 특징을 바탕으로 최적의 데이터플로우를 선택하고, 지연시간 및 자원 제약 하에서 하드웨어 설계 파라미터를 탐색하는 층별 자원–지연시간 인지형 DSE(LSRLA-DSE) 방법을 제안한다. 더 나아가, 오프칩 트래픽을 최소화하면서 높은 처리 요소(PE) 활용률을 유지하는 층별 동적 데이터플로우를 갖춘 FIFO 기반 스트리밍 아키텍처를 제안한다. 또한 자원 효율성과 처리량을 향상시키는 의미 분할 및 재구성 전략(SPRG)을 도입한다. Xilinx ZCU104 FPGA에 구현된 AHCO-YOLO-T는 64.8%mAP에서 79.8 FPS를 달성했으며, 41.9 FPS/W 및 80.5 GOPS/W를 제공한다. 기존 YOLO 가속기들과의 비교 전반에서 AHCO-YOLO는 최첨단 효율을 보였고, 엣지 플랫폼에서의 실시간 에너지 효율적 객체 탐지에 적합함을 입증한다.

https://doi.org/10.1109/tvlsi.2025.3621624

Object detection

Dataflow

Interfacing

Quantization (signal processing)

Field-programmable gate array

Edge device

Design space exploration

Normalization (sociology)

Hardware acceleration

Article

인용수 0

2025

The Study on FPGA Implementation of Metadata Table-based In-order RISC-V Processor for Heap Memory Vulnerability Detection

Hyunjae Park, Jin-Ku Kang, Yongwoo Kim

Journal of the Institute of Electronics and Information Engineers

RISC-V 프로세서는 버클리 대학에서 개발된 오픈소스 ISA를 기반으로 하는 프로세서로, 저전력 소모와 높은 확장성을 바탕으로 다양한 임베디드 시스템에 널리 활용되고 있다. 그러나 C/C++와 같은 메모리 안전성이 보장되지 않는 프로그래밍 언어의 사용으로 인해 메모리 취약점 문제가 지속적으로 대두되고 있다. 본 논문에서는 순차(In-Order) 방식의 RISC-V 프로세서에서 낮은 성능 오버헤드로 힙 메모리 취약점을 탐지할 수 있는 하드웨어 설계를 제안한다. 순차 프로세서는 단순한 설계로 인한 낮은 비용과 전력 효율성을 바탕으로 많은 임베디드 시스템에서 널리 사용되지만, 제한된 자원으로 인해 메모리 안전성을 보장하기 위한 추가적인 탐지 기법 구현에 어려움이 있다. 이를 극복하기 위해, 본 논문에서는 메타데이터 테이블과 경계 검사 기법을 결합한 하드웨어 구조를 제안하여 성능 저하를 최소화하면서도 메모리 안전성을 강화하였다. 제안된 방법을 VC707 FPGA 평가보드에 적용하여 성능을 검증한 결과, 실행 시간에서 평균 13.08%의 오버헤드가 발생함을 확인하였다. 또한, Juliet Test Suite를 활용한 검증에서 Double-Free, Use-After-Free, Overflow와 같은 주요 취약점을 대부분 탐지하는 성능을 확인하였다. 이를 통해 제안된 순차 RISC-V 프로세서 기반 하드웨어 구조가 낮은 성능 오버헤드로 힙 메모리 취약점을 효과적으로 탐지할 수 있음을 검증하였다.

https://doi.org/10.5573/ieie.2025.62.4.36

Heap (data structure)

Computer science

Metadata

Field-programmable gate array

Vulnerability (computing)

Parallel computing

Operating system

Table (database)

Embedded system

Database

주요 논문

*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.

Article

인용수 0

2025

Efficient Hardware-Assisted Heap Memory Safety for Embedded RISC-V Systems

Hyunjae Park, Yonghae Kim, Dongwook Kang, Hongil Ju, Gaeil An, Yongwoo Kim

IF 3.6 (2025)

IEEE Access

https://doi.org/10.1109/access.2025.3570777

Computer science

Embedded system

Memory safety

Heap (data structure)

Memory protection

Operating system

Parallel computing

Computer hardware

Memory management

Overlay

Article

인용수 1

2025

LLTQ+: A Hardware-Friendly Quantization Framework for Modern YOLO Architectures

Yugwon Seo, Jaemyung Kim, Jin-Ku Kang, Yongwoo Kim

IF 3.6 (2025)

IEEE Access

https://doi.org/10.1109/access.2025.3603536

Computer science

Quantization (signal processing)

Computer architecture

Environmentally friendly

Architecture

Embedded system

Computer vision

Article

인용수 3

2023

MASCAR: Multidomain Adaptive Spatial–Spectral Variable Compression Artifact Removal Network for Multispectral Remote Sensing Images

Jaemyung Kim, Hyun-Ho Kim, Doochun Seo, Jaeheon Jeong, Jin-Ku Kang, Yongwoo Kim

IF 7.5 (2023)

IEEE Transactions on Geoscience and Remote Sensing

https://doi.org/10.1109/tgrs.2023.3347518

Computer science

Multispectral image

Remote sensing

Image compression

Artificial intelligence

Compressed sensing

Data compression

Computer vision

Pixel

Image resolution

Article

인용수 15

2022

Target Capacity Filter Pruning Method for Optimized Inference Time Based on YOLOv5 in Embedded Systems

Jihun Jeon, Jaemyung Kim, Jin-Ku Kang, SungTae Moon, Yongwoo Kim

IF 3.9 (2022)

IEEE Access

https://doi.org/10.1109/access.2022.3188323

FLOPS

Inference

Computer science

Pruning

Convolutional neural network

Artificial intelligence

Pascal (unit)

Filter (signal processing)

Deep learning

Machine learning

Article

인용수 21

2022

A Low-Cost Fully Integer-Based CNN Accelerator on FPGA for Real-Time Traffic Sign Recognition

Jaemyung Kim, Jin-Ku Kang, Yongwoo Kim

IF 3.9 (2022)

IEEE Access

https://doi.org/10.1109/access.2022.3197906

Computer science

Field-programmable gate array

Quantization (signal processing)

Traffic sign recognition

Convolutional neural network

Hardware acceleration

Computer engineering

Speedup

Computer hardware

Computation

전체 논문

Article

인용수 0

2025

Efficient Hardware-Assisted Heap Memory Safety for Embedded RISC-V Systems

Hyunjae Park, Yonghae Kim, Dongwook Kang, Hongil Ju, Gaeil An, Yongwoo Kim

IF 3.6 (2025)

IEEE Access

https://doi.org/10.1109/access.2025.3570777

Computer science

Embedded system

Memory safety

Heap (data structure)

Memory protection

Operating system

Parallel computing

Computer hardware

Memory management

Overlay

Article

인용수 1

2025

LLTQ+: A Hardware-Friendly Quantization Framework for Modern YOLO Architectures

Yugwon Seo, Jaemyung Kim, Jin-Ku Kang, Yongwoo Kim

IF 3.6 (2025)

IEEE Access

https://doi.org/10.1109/access.2025.3603536

Computer science

Quantization (signal processing)

Computer architecture

Environmentally friendly

Architecture

Embedded system

Computer vision

Article

인용수 3

2023

MASCAR: Multidomain Adaptive Spatial–Spectral Variable Compression Artifact Removal Network for Multispectral Remote Sensing Images

Jaemyung Kim, Hyun-Ho Kim, Doochun Seo, Jaeheon Jeong, Jin-Ku Kang, Yongwoo Kim

IF 7.5 (2023)

IEEE Transactions on Geoscience and Remote Sensing

https://doi.org/10.1109/tgrs.2023.3347518

Computer science

Multispectral image

Remote sensing

Image compression

Artificial intelligence

Compressed sensing

Data compression

Computer vision

Pixel

Image resolution

Article

인용수 15

2022

Target Capacity Filter Pruning Method for Optimized Inference Time Based on YOLOv5 in Embedded Systems

Jihun Jeon, Jaemyung Kim, Jin-Ku Kang, SungTae Moon, Yongwoo Kim

IF 3.9 (2022)

IEEE Access

https://doi.org/10.1109/access.2022.3188323

FLOPS

Inference

Computer science

Pruning

Convolutional neural network

Artificial intelligence

Pascal (unit)

Filter (signal processing)

Deep learning

Machine learning

Article

인용수 21

2022

A Low-Cost Fully Integer-Based CNN Accelerator on FPGA for Real-Time Traffic Sign Recognition

Jaemyung Kim, Jin-Ku Kang, Yongwoo Kim

IF 3.9 (2022)

IEEE Access

https://doi.org/10.1109/access.2022.3197906

Computer science

Field-programmable gate array

Quantization (signal processing)

Traffic sign recognition

Convolutional neural network

Hardware acceleration

Computer engineering

Speedup

Computer hardware

Computation

Article

인용수 0

2025

Design and Analysis of an Optimized Cache Structure based on 32-bit RISC-V RV32I using FPGA

Hwa-Joon Oh, Yongwoo Kim

Journal of the Institute of Electronics and Information Engineers

https://doi.org/10.5573/ieie.2025.62.4.27

Cache

Field-programmable gate array

Computer science

Parallel computing

Embedded system

Reduced instruction set computing

Computer architecture

32-bit

Instruction set

Article

인용수 0

2025

A Study on Hardware-friendly Quantization for Object Detection Networks using Integer-only Arithmetic Operations

Yugwon Seo, Jin-Ku Kang, Yongwoo Kim

Journal of the Institute of Electronics and Information Engineers

https://doi.org/10.5573/ieie.2025.62.4.75

Arithmetic

Quantization (signal processing)

Computer science

Integer (computer science)

Object (grammar)

Computer hardware

Parallel computing

Algorithm

Mathematics

Artificial intelligence

Article

인용수 0

2025

PanSAM-HAT: A Hybrid Attention Transformer With Panchromatic Spectral Attention Module for Compression Artifacts Removal in Satellite Imagery

Hyun-Ho Kim, Jaemyung Kim, Doochun Seo, Jaeheon Jeong, Yongwoo Kim

IF 3.6 (2025)

IEEE Access

https://doi.org/10.1109/access.2025.3602150

Panchromatic film

Computer science

Satellite broadcasting

Satellite

Transformer

Satellite imagery

Data compression

Remote sensing

Computer vision

Artificial intelligence

Article

인용수 0

2025

AHCO-YOLO: An Algorithm–Hardware Co-Optimization Framework for Energy-Efficient and Real-Time Object Detection on Edge Devices

Jaemyung Kim, Jin-Ku Kang, Yongwoo Kim

IF 3.1 (2025)

IEEE Transactions on Very Large Scale Integration (VLSI) Systems

https://doi.org/10.1109/tvlsi.2025.3621624

Object detection

Dataflow

Interfacing

Quantization (signal processing)

Field-programmable gate array

Edge device

Design space exploration

Normalization (sociology)

Hardware acceleration

Article

인용수 0

2025

The Study on FPGA Implementation of Metadata Table-based In-order RISC-V Processor for Heap Memory Vulnerability Detection

Hyunjae Park, Jin-Ku Kang, Yongwoo Kim

Journal of the Institute of Electronics and Information Engineers

https://doi.org/10.5573/ieie.2025.62.4.36

Heap (data structure)

Computer science

Metadata

Field-programmable gate array

Vulnerability (computing)

Parallel computing

Operating system

Table (database)

Embedded system

Database