주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
article
|
인용수 0
·
2025A Hierarchical Dispatcher for Scheduling Multiple Deep Neural Networks (DNNs) on Edge Devices
Hyung Kook Jun, Taeho Kim, Sang Cheol Kim, Young Ik Eom
IF 3.5 (2025)
Sensors
본 논문은 이질적인 처리 장치(PU)를 갖춘 엣지 디바이스에서 다수의 심층 신경망(DNN)의 실행을 효율적으로 스케줄링하기 위한 계층적 디스패처 아키텍처를 제시한다. 제안된 아키텍처는 PU가 단일 엣지 디바이스에 통합되어 있거나 여러 디바이스에 분산되어 있는 시스템에 적용 가능하다. 우리는 디스패처와 스케줄링 정책을 분리한다. 본 프레임워크에서 디스패처는 다양한 PU에 걸쳐 DNN의 서브그래프를 할당, 실행 및 관리하는 메커니즘으로 작동하며, 스케줄링 정책은 최적화된 스케줄링 순서를 생성한다. 본 연구는 고수준 및 저수준 디스패처로 구성된 계층적 구조를 정식화하였고, 이는 다양한 DNN 워크로드에 대해 확장 가능하고 유연한 스케줄링 지원을 함께 제공한다. 고수준 디스패처는 서브그래프의 분할 및 분배를 감독하는 반면, 저수준 디스패처는 할당된 PU에서 서브그래프의 실행과 조정을 담당한다. 이러한 책임의 분리는 동종 및 이종 환경 모두에서 워크로드를 효율적으로 관리할 수 있게 해준다. 엣지 디바이스에 대한 사례 연구를 통해 제안된 아키텍처의 실용성을 입증한다. 적절한 스케줄링 정책을 통합함으로써, 본 접근법은 평균 성능을 51.6% 향상시키며, 이질적인 엣지 시스템에 딥러닝 모델을 배치하기 위한 확장 가능하고 적응 가능한 해법을 제공한다.
https://doi.org/10.3390/s25072243
Computer science
Scheduling (production processes)
Scalability
Distributed computing
Architecture
Edge device
Homogeneous
Execution time
Artificial neural network
Deep neural networks
2
article
|
인용수 2
·
2025A Practical Cache Partitioning Method for Multi-Core Processor on a Commercial Safety-Critical Partitioned RTOS
Taeho Kim
IF 3.6 (2025)
IEEE Access
현대 항공 비행 시스템에서 소프트웨어는 기능, 안전 및 성능 요구사항을 충족하는 데 핵심적인 역할을 한다. 성능 향상과 Space, Weight, and Power(SWaP)를 위해 Integrated Modular Avionics(IMA)와 멀티코어 프로세서(MCP) 또한 하드웨어에 채택되고 있다. MCP는 효율을 개선하지만, 자원 경합(resource contention)으로 인해 비결정적(non-deterministic) 거동이 발생하며, 항공전자(avionics) 시스템의 안전성을 확보하는 데 어려움을 야기한다. 본 연구는 MCP 상에서 상용 실시간 운영체제(Real-Time Operating Systems, RTOS)를 대상으로 캐시 분할(cache partitioning)을 위한 실용적 방법을 제안하여 캐시 경합을 줄이고 항공전자 시스템의 안전성과 성능을 향상시키고자 한다. DO-178 및 CAST 32A에 기반한 체계적인 절차를 개발하여 공유 자원을 식별하고 간섭을 방지하였다. 또한 각 애플리케이션에 대해 최적의 캐시 분할을 결정하기 위한 캐시 분할 가이드 도구를 개발하였다. 본 연구는 PowerPC T2080 프로세서에서 WindRiver VxWorks 653을 사용한 결과, 공유 L2 캐시가 최대 88%에 이르는 심각한 성능 저하를 유발할 수 있음을 입증하였다. 제안된 분할 기법을 적용함으로써 시스템은 0% 성능 저하를 달성하여 캐시 경합을 제거하고 애플리케이션 성능의 일관성을 확보하였다. 분할 접근법은 또한 안전성-치명적(safety-critical) 시스템에서 핵심적인 요구사항인 결정적(deterministic) 애플리케이션 거동을 보장하였다. 비행 시뮬레이션 환경에서의 검증을 통해 본 방법이 실제 환경에서의 적용 가능성을 확인하였다.
https://doi.org/10.1109/access.2025.3538540
Computer science
Cache
Multi-core processor
Real-time operating system
Embedded system
Parallel computing
Smart Cache
Operating system
CPU cache
Cache algorithms
3
article
|
인용수 26
·
2024Framework for evaluating code generation ability of large language models
Sangyeop Yeo, Yu‐Seung Ma, Sang Cheol Kim, Hyungkook Jun, Taeho Kim
IF 1.6 (2024)
ETRI Journal
대규모 언어 모델(LLMs)은 자연어 처리 분야의 다양한 응용에서 혁신을 가져왔으며 프로그래밍 코드 생성에서의 역량을 보여주었다. 본 연구는 LLM의 코드 생성 능력을 평가하기 위한 프레임워크를 제안하고, 테스트 케이스의 통과율에 따라 정확도의 세분성을 포착하는 새로운 지표를 도입한다. 이 프레임워크는 프롬프트 생성, 추론 수행, 생성된 코드의 실행에 수반되는 반복 작업을 처리하기 위해 완전 자동화된 형태로 설계되었다. 프롬프트의 상세 수준, 문제의 게시일, 난이도 수준에 초점을 둔 예비 평가는 우리의 프레임워크가 LeetCode 코딩 플랫폼과 성공적으로 통합되었음을 보여주며, 해당 지표의 적용 가능성을 강조한다.
https://doi.org/10.4218/etrij.2023-0357
Computer science
Granularity
Code (set theory)
Metric (unit)
Coding (social sciences)
Code generation
Programming language
Software engineering
Engineering
Computer security
4
preprint
|
인용수 0
·
2024Assessing the Answerability of Queries in Retrieval-Augmented Code Generation
Geonmin Kim, Jaeyeon Kim, Hancheol Park, Wooksu Shin, Taeho Kim
arXiv (Cornell University)
대규모 언어 모델(LLM)의 전례 없는 언어 이해 및 생성 역량 덕분에, 검색 보강 코드 생성(Retrieval-augmented Code Generation, RaCG)은 최근 소프트웨어 개발자들 사이에서 널리 활용되고 있다. 이는 생산성을 높였지만, 여전히 오답 코드가 제시되는 경우가 빈번하다. 특히, 주어진 질의와 API 설명만으로는 답할 수 없는 사용자 질의에 대해 그럴듯하지만 잘못된 코드가 생성되는 사례가 있다. 본 연구는 RaCG에서 사용자의 질의와 검색된 API를 바탕으로 유효한 답이 생성될 수 있는지를 평가하는 답변 가능성(answerability) 평가 과제를 제안한다. 또한, 이 과제를 수행하는 모델의 성능을 평가하기 위한 벤치마크 데이터셋인 Retrieval-augmented Code Generability Evaluation(RaCGEval)을 구축한다. 실험 결과, 이 과제는 매우 어려운 수준을 유지하고 있으며, 기준(baseline) 모델은 46.7%의 낮은 성능을 보였다. 더 나아가, 본 연구에서는 성능을 유의미하게 향상시킬 수 있는 방법들에 대해 논의한다.
http://arxiv.org/abs/2411.05547
Computer science
Code (set theory)
Information retrieval
Theoretical computer science
Programming language
5
article
|
인용수 18
·
2022Quantune: Post-training quantization of convolutional neural networks using extreme gradient boosting for fast deployment
Jemin Lee, Misun Yu, Yongin Kwon, Taeho Kim
IF 7.5 (2022)
Future Generation Computer Systems
자원 제약이 있는 다양한 대상에 합성곱 신경망(CNN)을 적용하기 위해서는, 정밀도 표현을 더 낮은 비트 표현으로 변환하는 양자화(quantization)를 수행하여 CNN 모델을 압축할 필요가 있다. 학습 데이터셋의 민감성, 높은 계산 요구량, 큰 시간 소모와 같은 문제를 극복하기 위해, 재학습을 필요로 하지 않는 후(後)학습 양자화(post-training quantization) 방법들이 제안되어 왔다. 또한 재학습 없이 정확도 저하를 보상하기 위해, 기존의 후학습 양자화 연구에서는 보정(calibration), 스킴(schemes), 클리핑(clipping), 과립도(granularity), 혼합정밀도(mixed-precision) 등 여러 보완적 방법을 제안하였다. 최소한의 오차를 갖는 양자화 모델을 생성하기 위해서는, 각 방법이 상호 보완적이며 CNN 모델이 서로 다른 특성을 가지므로 모든 가능한 방법 조합을 연구할 필요가 있다. 그러나 완전 탐색 또는 휴리스틱 탐색은 지나치게 많은 시간이 소요되거나 성능이 최적이 아니기 쉽다. 이러한 도전을 해결하기 위해, 양자화 설정(configuration)의 탐색을 가속하고 양자화 오차를 감소시키는 Quantune으로 알려진 자동 튜너(auto-tuner)를 제안한다. Quantune은 그라디언트 트리 부스팅(gradient tree boosting) 모델을 구축하여 양자화 구성의 탐색을 가속한다. 우리는 Quantune을 무작위(random), 격자(grid), 유전 알고리즘(genetic algorithms)과 비교·평가하였다. 실험 결과는 Quantune이 여섯 개의 CNN 모델(취약한 모델들인 MobileNet, SqueezeNet, ShuffleNet 포함)에서 정확도 손실 0.07–0.65%를 유지하면서 양자화 탐색 시간을 약 36.5배 감소시킴을 보여준다. 또한 여러 대상에 대응하고 지속적으로 발전하는 양자화 작업을 수용하기 위해, Quantune은 공개 소스 프로젝트로서 딥러닝을 위한 완전한 컴파일러(full-fledged compiler)에 구현되어 있다.
https://doi.org/10.1016/j.future.2022.02.005
Computer science
Quantization (signal processing)
Convolutional neural network
Boosting (machine learning)
Artificial intelligence
Algorithm
Machine learning
Computer engineering