논문 | 김태호 교수 연구실 | 서울여자대학교

김태호 교수 연구실

홈

기본 정보

연구 분야

논문

구성원

논문

연구 성과 추이

표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

11총합

5개년 연도별 피인용 수

73총합

주요 논문

*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.

article

인용수 0

2025

A Hierarchical Dispatcher for Scheduling Multiple Deep Neural Networks (DNNs) on Edge Devices

Hyung Kook Jun, Taeho Kim, Sang Cheol Kim, Young Ik Eom

IF 3.5 (2025)

Sensors

본 논문은 이질적인 처리 장치(PU)를 갖춘 엣지 디바이스에서 다수의 심층 신경망(DNN)의 실행을 효율적으로 스케줄링하기 위한 계층적 디스패처 아키텍처를 제시한다. 제안된 아키텍처는 PU가 단일 엣지 디바이스에 통합되어 있거나 여러 디바이스에 분산되어 있는 시스템에 적용 가능하다. 우리는 디스패처와 스케줄링 정책을 분리한다. 본 프레임워크에서 디스패처는 다양한 PU에 걸쳐 DNN의 서브그래프를 할당, 실행 및 관리하는 메커니즘으로 작동하며, 스케줄링 정책은 최적화된 스케줄링 순서를 생성한다. 본 연구는 고수준 및 저수준 디스패처로 구성된 계층적 구조를 정식화하였고, 이는 다양한 DNN 워크로드에 대해 확장 가능하고 유연한 스케줄링 지원을 함께 제공한다. 고수준 디스패처는 서브그래프의 분할 및 분배를 감독하는 반면, 저수준 디스패처는 할당된 PU에서 서브그래프의 실행과 조정을 담당한다. 이러한 책임의 분리는 동종 및 이종 환경 모두에서 워크로드를 효율적으로 관리할 수 있게 해준다. 엣지 디바이스에 대한 사례 연구를 통해 제안된 아키텍처의 실용성을 입증한다. 적절한 스케줄링 정책을 통합함으로써, 본 접근법은 평균 성능을 51.6% 향상시키며, 이질적인 엣지 시스템에 딥러닝 모델을 배치하기 위한 확장 가능하고 적응 가능한 해법을 제공한다.

https://doi.org/10.3390/s25072243

Computer science

Scheduling (production processes)

Scalability

Distributed computing

Architecture

Edge device

Homogeneous

Execution time

Artificial neural network

Deep neural networks

article

인용수 2

2025

A Practical Cache Partitioning Method for Multi-Core Processor on a Commercial Safety-Critical Partitioned RTOS

Taeho Kim

IF 3.6 (2025)

IEEE Access

현대 항공 비행 시스템에서 소프트웨어는 기능, 안전 및 성능 요구사항을 충족하는 데 핵심적인 역할을 한다. 성능 향상과 Space, Weight, and Power(SWaP)를 위해 Integrated Modular Avionics(IMA)와 멀티코어 프로세서(MCP) 또한 하드웨어에 채택되고 있다. MCP는 효율을 개선하지만, 자원 경합(resource contention)으로 인해 비결정적(non-deterministic) 거동이 발생하며, 항공전자(avionics) 시스템의 안전성을 확보하는 데 어려움을 야기한다. 본 연구는 MCP 상에서 상용 실시간 운영체제(Real-Time Operating Systems, RTOS)를 대상으로 캐시 분할(cache partitioning)을 위한 실용적 방법을 제안하여 캐시 경합을 줄이고 항공전자 시스템의 안전성과 성능을 향상시키고자 한다. DO-178 및 CAST 32A에 기반한 체계적인 절차를 개발하여 공유 자원을 식별하고 간섭을 방지하였다. 또한 각 애플리케이션에 대해 최적의 캐시 분할을 결정하기 위한 캐시 분할 가이드 도구를 개발하였다. 본 연구는 PowerPC T2080 프로세서에서 WindRiver VxWorks 653을 사용한 결과, 공유 L2 캐시가 최대 88%에 이르는 심각한 성능 저하를 유발할 수 있음을 입증하였다. 제안된 분할 기법을 적용함으로써 시스템은 0% 성능 저하를 달성하여 캐시 경합을 제거하고 애플리케이션 성능의 일관성을 확보하였다. 분할 접근법은 또한 안전성-치명적(safety-critical) 시스템에서 핵심적인 요구사항인 결정적(deterministic) 애플리케이션 거동을 보장하였다. 비행 시뮬레이션 환경에서의 검증을 통해 본 방법이 실제 환경에서의 적용 가능성을 확인하였다.

https://doi.org/10.1109/access.2025.3538540

Computer science

Cache

Multi-core processor

Real-time operating system

Embedded system

Parallel computing

Smart Cache

Operating system

CPU cache

Cache algorithms

article

인용수 26

2024

Framework for evaluating code generation ability of large language models

Sangyeop Yeo, Yu‐Seung Ma, Sang Cheol Kim, Hyungkook Jun, Taeho Kim

IF 1.6 (2024)

ETRI Journal

대규모 언어 모델(LLMs)은 자연어 처리 분야의 다양한 응용에서 혁신을 가져왔으며 프로그래밍 코드 생성에서의 역량을 보여주었다. 본 연구는 LLM의 코드 생성 능력을 평가하기 위한 프레임워크를 제안하고, 테스트 케이스의 통과율에 따라 정확도의 세분성을 포착하는 새로운 지표를 도입한다. 이 프레임워크는 프롬프트 생성, 추론 수행, 생성된 코드의 실행에 수반되는 반복 작업을 처리하기 위해 완전 자동화된 형태로 설계되었다. 프롬프트의 상세 수준, 문제의 게시일, 난이도 수준에 초점을 둔 예비 평가는 우리의 프레임워크가 LeetCode 코딩 플랫폼과 성공적으로 통합되었음을 보여주며, 해당 지표의 적용 가능성을 강조한다.

https://doi.org/10.4218/etrij.2023-0357

Computer science

Granularity

Code (set theory)

Metric (unit)

Coding (social sciences)

Code generation

Programming language

Software engineering

Engineering

Computer security

preprint

인용수 0

2024

Assessing the Answerability of Queries in Retrieval-Augmented Code Generation

Geonmin Kim, Jaeyeon Kim, Hancheol Park, Wooksu Shin, Taeho Kim

arXiv (Cornell University)

대규모 언어 모델(LLM)의 전례 없는 언어 이해 및 생성 역량 덕분에, 검색 보강 코드 생성(Retrieval-augmented Code Generation, RaCG)은 최근 소프트웨어 개발자들 사이에서 널리 활용되고 있다. 이는 생산성을 높였지만, 여전히 오답 코드가 제시되는 경우가 빈번하다. 특히, 주어진 질의와 API 설명만으로는 답할 수 없는 사용자 질의에 대해 그럴듯하지만 잘못된 코드가 생성되는 사례가 있다. 본 연구는 RaCG에서 사용자의 질의와 검색된 API를 바탕으로 유효한 답이 생성될 수 있는지를 평가하는 답변 가능성(answerability) 평가 과제를 제안한다. 또한, 이 과제를 수행하는 모델의 성능을 평가하기 위한 벤치마크 데이터셋인 Retrieval-augmented Code Generability Evaluation(RaCGEval)을 구축한다. 실험 결과, 이 과제는 매우 어려운 수준을 유지하고 있으며, 기준(baseline) 모델은 46.7%의 낮은 성능을 보였다. 더 나아가, 본 연구에서는 성능을 유의미하게 향상시킬 수 있는 방법들에 대해 논의한다.

http://arxiv.org/abs/2411.05547

Computer science

Code (set theory)

Information retrieval

Theoretical computer science

Programming language

article

인용수 18

2022

Quantune: Post-training quantization of convolutional neural networks using extreme gradient boosting for fast deployment

Jemin Lee, Misun Yu, Yongin Kwon, Taeho Kim

IF 7.5 (2022)

Future Generation Computer Systems

자원 제약이 있는 다양한 대상에 합성곱 신경망(CNN)을 적용하기 위해서는, 정밀도 표현을 더 낮은 비트 표현으로 변환하는 양자화(quantization)를 수행하여 CNN 모델을 압축할 필요가 있다. 학습 데이터셋의 민감성, 높은 계산 요구량, 큰 시간 소모와 같은 문제를 극복하기 위해, 재학습을 필요로 하지 않는 후(後)학습 양자화(post-training quantization) 방법들이 제안되어 왔다. 또한 재학습 없이 정확도 저하를 보상하기 위해, 기존의 후학습 양자화 연구에서는 보정(calibration), 스킴(schemes), 클리핑(clipping), 과립도(granularity), 혼합정밀도(mixed-precision) 등 여러 보완적 방법을 제안하였다. 최소한의 오차를 갖는 양자화 모델을 생성하기 위해서는, 각 방법이 상호 보완적이며 CNN 모델이 서로 다른 특성을 가지므로 모든 가능한 방법 조합을 연구할 필요가 있다. 그러나 완전 탐색 또는 휴리스틱 탐색은 지나치게 많은 시간이 소요되거나 성능이 최적이 아니기 쉽다. 이러한 도전을 해결하기 위해, 양자화 설정(configuration)의 탐색을 가속하고 양자화 오차를 감소시키는 Quantune으로 알려진 자동 튜너(auto-tuner)를 제안한다. Quantune은 그라디언트 트리 부스팅(gradient tree boosting) 모델을 구축하여 양자화 구성의 탐색을 가속한다. 우리는 Quantune을 무작위(random), 격자(grid), 유전 알고리즘(genetic algorithms)과 비교·평가하였다. 실험 결과는 Quantune이 여섯 개의 CNN 모델(취약한 모델들인 MobileNet, SqueezeNet, ShuffleNet 포함)에서 정확도 손실 0.07–0.65%를 유지하면서 양자화 탐색 시간을 약 36.5배 감소시킴을 보여준다. 또한 여러 대상에 대응하고 지속적으로 발전하는 양자화 작업을 수용하기 위해, Quantune은 공개 소스 프로젝트로서 딥러닝을 위한 완전한 컴파일러(full-fledged compiler)에 구현되어 있다.

https://doi.org/10.1016/j.future.2022.02.005

Computer science

Quantization (signal processing)

Convolutional neural network

Boosting (machine learning)

Artificial intelligence

Algorithm

Machine learning

Computer engineering

전체 논문

article

인용수 0

2025

A Hierarchical Dispatcher for Scheduling Multiple Deep Neural Networks (DNNs) on Edge Devices

Hyung Kook Jun, Taeho Kim, Sang Cheol Kim, Young Ik Eom

IF 3.5 (2025)

Sensors

https://doi.org/10.3390/s25072243

Computer science

Scheduling (production processes)

Scalability

Distributed computing

Architecture

Edge device

Homogeneous

Execution time

Artificial neural network

Deep neural networks

article

인용수 2

2025

A Practical Cache Partitioning Method for Multi-Core Processor on a Commercial Safety-Critical Partitioned RTOS

Taeho Kim

IF 3.6 (2025)

IEEE Access

https://doi.org/10.1109/access.2025.3538540

Computer science

Cache

Multi-core processor

Real-time operating system

Embedded system

Parallel computing

Smart Cache

Operating system

CPU cache

Cache algorithms

article

인용수 26

2024

Framework for evaluating code generation ability of large language models

Sangyeop Yeo, Yu‐Seung Ma, Sang Cheol Kim, Hyungkook Jun, Taeho Kim

IF 1.6 (2024)

ETRI Journal

https://doi.org/10.4218/etrij.2023-0357

Computer science

Granularity

Code (set theory)

Metric (unit)

Coding (social sciences)

Code generation

Programming language

Software engineering

Engineering

Computer security

preprint

인용수 0

2024

Assessing the Answerability of Queries in Retrieval-Augmented Code Generation

Geonmin Kim, Jaeyeon Kim, Hancheol Park, Wooksu Shin, Taeho Kim

arXiv (Cornell University)

http://arxiv.org/abs/2411.05547

Computer science

Code (set theory)

Information retrieval

Theoretical computer science

Programming language

article

인용수 18

2022

Quantune: Post-training quantization of convolutional neural networks using extreme gradient boosting for fast deployment

Jemin Lee, Misun Yu, Yongin Kwon, Taeho Kim

IF 7.5 (2022)

Future Generation Computer Systems

https://doi.org/10.1016/j.future.2022.02.005

Computer science

Quantization (signal processing)

Convolutional neural network

Boosting (machine learning)

Artificial intelligence

Algorithm

Machine learning

Computer engineering

article

인용수 0

2026

Deep Learning-Assisted Early Detection of Skin Cancer from Dermoscopic Images in Underserved Clinical Settings

Anchal Kumari, Punam Rattan, Anand Kumar Shukla, Sita Rani, Aman Kataria, Hong Min, Taeho Kim

IF 3.7 (2026)

Bioengineering

피부암은 DNA 손상이 복구되지 않아 표피에 변이가 발생한 뒤, 이상 세포가 통제되지 않은 방식으로 증식하면서 발생한다. 대부분의 피부암은 태양광, 선탠 베드 또는 선램프에서 비롯되는 높은 수준의 자외선(UV) 노출로 인해 발생한다. 사회문화적 장벽, 전문 피부과 진료에 대한 제한된 접근성, 낮은 대중 인식으로 인해 인도를 포함한 많은 국가에서 사망률이 높고 질병이 진행된 말기 단계에서의 진단이 흔하다. 특히 농촌 및 저개발 지역에서의 전문 피부과 치료의 불균등한 분포는 검출과 치료를 더욱 어렵게 한다. 사망률이 높은 가장 흔한 악성종양 중 하나인 피부암에서 조기 발견은 매우 중요하다. 본 연구는 이러한 문제를 해결하기 위해 히마찰프라데시(Himachal Pradesh)의 두 개 클리닉에서 1200개의 피부경(dermoscopic) 영상을 수집하였다. 피부경 임상 이미지를 흑색종(melanoma)과 비흑색종 피부암(non-melanoma skin cancer) 범주로 자동 분류하기 위해, 본 연구는 VGG16과 ResNet-50을 비교하였다. 제안된 접근법에는 전처리, 병변 분할, 분류가 모두 포함된다. 임상 주석이 포함된 1200개의 피부경 영상 수집 자료를 사용하여 모델의 성능을 향상시켰다. ResNet-50은 시험에서 VGG16을 능가했으며, 정확도는 93%, AUC-ROC는 96%로 각각 89%와 94%에 비해 우수하였다. 이러한 결과는 진단 성능에 있어 모델 선택과 전처리가 얼마나 중요한지를 강조한다. AI 보조 피부과 진단 도구의 구현을 촉진하기 위해 앙상블 방법, 다중 클래스 분류, 설명가능성(explainability) 통합, 임상적 검증을 추가로 조사할 예정이다.

https://doi.org/10.3390/bioengineering13040456

Skin cancer

Cancer

Melanoma

Skin lesion

Lesion

Preprocessor

preprint

인용수 0

2025

Versatile and Fast Location-Based Private Information Retrieval with Fully Homomorphic Encryption over the Torus

Joon Soo Yoo, Taeho Kim, Ji Won Yoon

ArXiv.org

위치 기반 서비스는 종종 사용자가 민감한 위치 데이터의 공유를 요구하며, 이로 인해 신뢰할 수 없는 서버에 의한 오용 또는 악용 가능성 때문에 프라이버시 우려가 제기된다. 이에 대응하여 본 연구에서는 사용자 프라이버시를 보존하면서도 효율적이고 확장 가능한 질의 처리를 가능하게 하는 다목적 위치 기반 프라이빗 정보 검색(PIR) 시스템인 VeLoPIR를 제안한다. VeLoPIR는 정보 및 긴급 알림을 포함하는 다양한 실제 응용을 지원하기 위해, 구간 검증, 좌표 검증, 식별자 매칭의 세 가지 운영 모드를 도입한다. 성능을 향상시키기 위해 VeLoPIR는 병렬 구조를 포함한 다단계 알고리즘 최적화를 적용하여 CPU 및 GPU 플랫폼 모두에서 유의미한 확장성을 달성한다. 또한 표준적인 암호학적 가정 하에서 시스템의 견고성을 확인하는 형식적 보안 및 프라이버시 증명을 제공한다. 실제 데이터셋에 대한 광범위한 실험 결과, VeLoPIR는 기존 기준 대비 최대 11.55배의 속도 향상을 달성함을 보여준다. VeLoPIR의 구현은 https://github.com/PrivStatBool/VeLoPIR 에서 공개되어 있다.

http://arxiv.org/abs/2506.12761

Homomorphic encryption

Scalability

Robustness (evolution)

Cryptography

Encryption

Identifier

Private information retrieval

Information sensitivity

article

인용수 1

2024

Survey on Recent Large Language Models for Code Generation

Sangyeop Yeo, Yu‐Seung Ma, Hyungkook Jun, Taeho Kim, SangCheol Kim

KIISE Transactions on Computing Practices

https://doi.org/10.5626/ktcp.2024.30.8.372

Computer science

Programming language

Code (set theory)

article

인용수 16

2023

Clock Offset Estimation for Systems With Asymmetric Packet Delays

Young-Mok Ha, Eunji Pak, Jongkil Park, Taeho Kim, Ji Won Yoon

IF 3 (2023)

IEEE/ACM Transactions on Networking

본 논문은 정밀한 시계 동기화를 위해 원치 않는 링크 비대칭을 완화하는 새로운 클록 오프셋 추정 방식을 제안한다. 주요 기여는 IEEE 1588 표준 정밀 시각 프로토콜(PTP)이 클록 오프셋을 추정할 때 교환되는 패킷의 지연이 대칭이라는 가정을 두는, 전통적인 설계상의 핵심 문제를 해결하는 데 있다. 이 문제를 완화하기 위해, PTP가 시간 스텝에 대한 타임스탬프의 미분(derivative)을 통해 비대칭 변화를 측정한다는 점에 주목한다. 제안하는 방식은 이러한 변화의 측정을 활용하여 비대칭을 선형 미분 방정식(LDE)의 형태로 정의하고, LDE를 이용해 비대칭으로 인한 오차를 정의 및 배제한다. 또한 비대칭의 상태 천이를 명확히 도출한다. 이어서, 본 접근법으로부터 새로운 상태공간 모델을 도출한다. 이 모델은 PTP 클록 오프셋 추정을 완벽히 기술하며 최적의 클록 오프셋 추정을 가능하게 한다. 실제 데이터를 통해 제안 방법의 이론적 타당성을 검증한다. 제안하는 방식은 비대칭 통신 링크에서 수십 내지 수백 나노초 수준의 정확도를 달성함과 동시에 PTP 정확도를 1,000배 이상 향상시킨다. 본 접근법은 특수 하드웨어의 비용 없이 PTPv2와 비교할 만한 정확도를 구현한다.

https://doi.org/10.1109/tnet.2022.3229407

Offset (computer science)

Computer science

Asymmetry

Clock synchronization

Timestamp

Network packet

Synchronization (alternating current)

Frequency offset

Clock skew

Clock domain crossing

article

인용수 0

2022

Time-Invariant Features-Based Online Learning for Long-Term Notification Management: A Longitudinal Study

Jemin Lee, Sihyeong Park, Taeho Kim, Hyungshin Kim

IF 2.7 (2022)

Applied Sciences

스마트폰과 웨어러블 기기에서 발생하는 일일 알림의 수가 증가함에 따라 정신적 부담이 커지고 생산성이 저하되며 에너지 낭비가 발생한다. 이러한 현상은 스마트폰, 스마트워치, AirPods, 태블릿과 같은 개인용 모바일 기기들을 점점 더 많이 착용하고 사용하는 신종 사용 사례가 등장하면서 더욱 악화된다. 모든 기기에서 동시에 중복 알림이 생성될 수 있기 때문이다. 따라서 주의 분산뿐 아니라 여러 기기에서 동시에 유발된 중복 알림은 에너지 낭비를 초래한다. 선행 연구에서는 개인화된 모델에 기반하여 알림의 발생을 자동으로 조작하는 알림 관리 시스템 PASS를 제안하였다. 그러나 선행 연구는 시간이 지남에 따른 사용자 행태 변화에 대해 조사하지 않았기 때문에, 기계학습 기반 모델은 새로 유입되는 알림에 대해 성능이 좋지 않다. 모델이 장기간 사용될 때 모델링과 실제 배치 간의 격차를 줄이기 위해, 우리는 장기간 동안 데이터 수집을 수행한 종단 연구를 실시하였다. 우리는 추가로 11,258개의 알림을 수집하였고, 원래의 데이터셋을 포함하여 총 18,407개의 알림을 분석하였다. 본 연구의 전체 기간은 2년이다. 통계적 검정을 통해, 학습에 충분히 활용할 수 있는 시간 불변(time-invariant) 특성을 확인하였다. 새롭게 발생하는 데이터로 인해 발생하는 정확도 저하를 극복하기 위해, 우리는 창(window) 기반 시간 불변 온라인 학습(WTOL)을 설계하였다. 새롭게 수집된 데이터셋에서 WTOL은 시간 민감도에 따라 온라인 학습과 윈도잉 특성을 결합함으로써, 배치 학습에 기반한 기존 모델의 F-score를 44.3%에서 69.0%로 향상시킨다.

https://doi.org/10.3390/app12115432

Computer science

Wearable computer

Software deployment

Mobile device

Machine learning

Smartwatch

Artificial intelligence

Wearable technology

Human–computer interaction

Real-time computing

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)