주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
Article
|
·
인용수 1
·
2025NeuroBalancer: Balancing System Frequencies With Punctual Laziness for Timely and Energy-Efficient DNN Inferences
Kyungmin Bin, Seyeon Kim, Sangtae Ha, Song Chong, Kyunghan Lee
IF 9.2 (2025)
IEEE Transactions on Mobile Computing
온디바이스 딥 신경망(DNN) 추론은 사용자 경험과 프라이버시 측면에서 종종 바람직하다. 기존의 솔루션들은 추론 지연 시간을 최소화하기 위해 자원을 충분히 활용해 왔다. 그러나 이러한 방식은 서비스 구간에 필요한 시간보다 훨씬 일찍 DNN 추론을 완료함으로써 심각한 에너지 비효율을 초래한다. 이는 정해진 시간에 맞추면서도 에너지 효율적으로 DNN 추론을 수행하는 방법이라는 새로운 과제를 제기한다. 이 과제를 해결하기 위해, 우리는 DNN 처리에 대한 새로운 자원 할당 전략인 punctual laziness를 제안하며, 이는 엄격한 지연 제약 내에서 작업 부하를 가능한 한 효율적으로 시간에 분산시키는 방식이다. 이 전략은 DNN이 지연 시간과 에너지 소모가 예측 가능한 일련의 인기 연산자들로 구성된다는 점에서 특히 신경 워크로드에 유리하다. 이러한 이해를 바탕으로, 우리는 그 연산자들을 고려한 연산자-인식(operator-aware) 코어 및 메모리 주파수 스케일링 프레임워크인 NeuroBalancer를 제안하여, 적절한 추론 시점을 보장하면서도 해당 주파수들을 가능한 한 효율적으로 균형 있게 조정한다. 우리는 상용(시판) 안드로이드 기기에서 여러 최신 DNN 모델로 NeuroBalancer를 구현하고 평가한다. 그 결과, NeuroBalancer는 주어진 추론 지연 요구사항을 성공적으로 충족하면서, CPU와 GPU에서 각각 안드로이드의 기본 governor 대비 최대 43.9% 및 21.1%까지, 그리고 CPU와 GPU에서 각각 최신 모바일 governor인 SysScale 대비 최대 42.1% 및 18.6%까지 에너지 소모를 절감함을 보여준다.
https://doi.org/10.1109/tmc.2024.3524628
Computer science
Inference
Energy consumption
Reboot
Latency (audio)
Frequency scaling
Distributed computing
Android (operating system)
Workload
Inefficiency
2
Article
|
·
인용수 0
·
2025nCTX: A Neural Network-Powered Lossless Compressive Transmission Using Shared Information
Wooseung Nam, Sungyong Lee, Joohyun Lee, Kyunghan Lee
IF 9.2 (2025)
IEEE Transactions on Mobile Computing
본 연구에서는 무손실 데이터 전송을 위한 새로운 전달 방식, 즉 압축전송(compressive transmission)의 가능성을 탐색한다. 이는 송신자와 수신자 사이에서 공유되는 맞춤형 정보를 활용함으로써 실행 시 전송 데이터의 용량을 최소화하는 것을 목표로 한다. 공유 정보를 압축에 활용하기 위한 두 가지 접근법으로는 1) 공유 정보의 대리(proxy)로서 DNN 기반 코덱을 사용하는 방법과 2) 중복 제거(deduplication)를 통한 중복성 제거(redundancy elimination) 방법이 있다. 그러나 이러한 접근법들은 압축률과 공유 정보의 양 사이의 상충관계를 활용하기 위해 깊이 있게 연구되지 않았다. 이들 접근법에 비해 압축전송은 양측에서 이용 가능한 정보의 풍부함을 전적으로 활용하며, 이는 의도적으로 선택되고 배치된다. 이러한 개념을 현실화하기 위해, 우리는 생성 모델(generative model)과 매칭 블록(matching blocks)을 적응적으로 활용하는 신경망 기반 압축전송 시스템인 nCTX를 제안한다. nCTX는 입력 데이터로부터 최적의 의미론적 데이터를 추출하고, 공유 정보를 활용하여 원본을 보다 가깝게 모사한 뒤 오프셋(즉, 차이)으로 이를 보완한다. 모바일 플랫폼에서의 광범위한 평가는 nCTX가, 계산 시간이 비교 가능하거나 더 짧은 조건에서 각각 FLIF 및 RC(최첨단 이미지 코덱) 대비 전송 용량을 유의하게 25.8% 및 23.3% 감소시킴을 확인하였다.
https://doi.org/10.1109/tmc.2025.3530950
Computer science
Lossless compression
Transmission (telecommunications)
Artificial neural network
Computer network
Information transmission
Data compression
Telecommunications
Artificial intelligence
3
Article
|
·
인용수 6
·
2023Enabling Delay-Guaranteed Congestion Control With One-Bit Feedback in Cellular Networks
Junseon Kim, Youngbin Im, Kyunghan Lee
IF 3 (2023)
IEEE/ACM Transactions on Networking
과도한 트래픽 유입으로 인해 막대한 네트워크 큐잉이 발생함에 따라, 셀룰러 네트워크에서는 예상보다 큰 패킷 지연이 흔히 관측된다. 이러한 대기열의 큰 문제를 해결하기 위해, 많은 혼잡 제어 알고리즘은 네트워크가 수용할 수 있는 트래픽의 양을 측정하거나 네트워크 성능을 측정함으로써 또는 명시적 정보를 직접 제공함으로써 이를 파악하려고 한다. 그러나 큐 성장의 관측을 전제로 하는 제어의 특성 또는 전체 네트워크 아키텍처를 수정해야 할 필요성 때문에, 기존 알고리즘들은 큐를 엄격한 상한 내에 유지하는 데 어려움을 겪고 있다. 본 논문에서는 전통적인 네트워크 아키텍처에 이미 제공되어 있는 1비트 신호만을 사용하여 한정된 큐잉 지연을 제공할 수 있는 단순 피드백 기반의 새로운 혼잡 제어 알고리즘 ECLAT을 제안한다. 이를 위해, ECLAT을 실행하는 기지국 또는 라우터는 1) 각 플로우가 전송해야 할 패킷 수를 계산하고 2) 플로우의 패킷 전송을 목표 전송률에 맞추기 위해 혼잡 피드백을 어느 시점에 전달해야 하는지를 분석한다. 자체 테스트베드에서 수행한 광범위한 실험 결과, ECLAT은 동적인 셀룰러 네트워크 환경에서도 엄격한 큐잉 지연 상한을 달성함을 확인하였다.
https://doi.org/10.1109/tnet.2023.3268721
Computer science
Queuing delay
Computer network
Network congestion
Active queue management
Network packet
Flow control (data)
Testbed
Queueing theory
Router
4
Article
|
·
인용수 4
·
2022Toward Enabling Performance-Guaranteed Networking in Next-Generation Cellular Networks
Junseon Kim, Byonghyo Shim, Kyunghan Lee
IF 11.2 (2022)
IEEE Communications Magazine
5G 이동통신 네트워크에서의 초저지연을 위한 설계 청사진(blueprint)은, 소형 데이터 단위(예: 패킷 또는 프레임)를 신속하게 전달해야 하는 초신뢰 저지연 통신 서비스를 가능하게 하기 위해 고안되었다. 그러나 시간에 민감한 것으로 상정되는 미래형 응용은 데이터 단위가 통상 매우 크기 때문에, 이 청사진이 처리할 수 있는 것보다 훨씬 더 많은 요구를 필요로 한다. 데이터 크기가 증가함에 따라, 지연은 네트워크가 단위 시간당 전송할 수 있는 데이터 양(즉, 대역폭)에 크게 영향을 받는다. 대역폭이 지연에 미치는 이러한 영향은, 지연이 원하는 시간 이내에 유지되도록 필요한 대역폭을 보장할 필요로 이어진다. 5G에서는 성능을 보장하기 위해 네트워크 슬라이싱이 도입되었으나, 시간에 따라 변하는 데이터 단위 크기와 무선 채널 품질이라는 본질적 특성을 어떻게 처리할지는 여전히 해결되지 않은 문제로 남아 있다. 이 글에서는 상세한 이해를 위해 먼저, 애플리케이션 수준에서의 종단 간 지연을 첫 바이트 지연(first-byte delay)과 나머지 바이트에 대한 전송 지연(transmission delay) 관점에서 논의한다. 이어서 최근의 기술들이 종단 간 지연 감소와 어떻게 관련되는지를 조사하고, 그것들의 본질로 인해 발생하는 도전적인 이슈들을 제시한다. 이러한 이슈를 다루기 위해, 성능 보장을 제공하기 위한 차세대(6G) 이동통신 네트워크의 새로운 설계를 제안하고, 해당 네트워크 설계에서의 미해결 과제들을 논의한다.
https://doi.org/10.1109/mcom.003.2200051
Computer science
Computer network
Latency (audio)
Byte
Network packet
Cellular network
Quality of service
Telecommunications
Computer hardware
5
Article
|
·
인용수 7
·
2022DeepVehicleSense: An Energy-Efficient Transportation Mode Recognition Leveraging Staged Deep Learning Over Sound Samples
Sungyong Lee, Jinsung Lee, Kyunghan Lee
IF 7.9 (2022)
IEEE Transactions on Mobile Computing
본 논문에서는 스마트폰을 위한 새로운 교통수단 인식 시스템인 DeepVehicleSense를 제시한다. DeepVehicleSense는 모바일 상황인지 서비스에 널리 적용될 수 있다. DeepVehicleSense는 후보 교통수단 상태에 있는 동안 내장 마이크로 포착되는 음향 특성을 활용함으로써 동시에 높은 정확도, 낮은 지연, 낮은 전력 소모의 세 가지 성능 목표를 달성하는 것을 지향한다. 높은 에너지 효율을 달성하기 위해, DeepVehicleSense는 스마트폰의 마이크 활성화를 최소화하는 계층적 가속도계 기반 트리거를 채택한다. 또한 높은 정확도와 낮은 지연을 달성하기 위해, DeepVehicleSense는 교통수단 음향 샘플을 가장 잘 추출할 수 있는 비선형 필터를 활용한다. 다섯 가지 서로 다른 교통수단 모드 인식을 위해, 복수 브랜치를 갖는 새로운 딥 신경망 아키텍처를 바탕으로 딥러닝 기반 음향 분류기를 설계한다. 단계적 추론 기법은 대부분의 샘플에서 높은 정확도를 유지하면서 실행 시간과 에너지 소비를 유의미하게 감소시킬 수 있다. 서로 다른 7종의 Android 전화 모델에서 수집한 263시간 데이터셋을 통해, DeepVehicleSense가 하루 종일 모니터링을 위한 평균 전력 소모 35.08 mW에서 단 2초의 음향 샘플만으로도 97.44%의 인식 정확도를 달성함을 보여준다.
https://doi.org/10.1109/tmc.2022.3141392
Computer science
Mode (computer interface)
Deep learning
Sound (geography)
Speech recognition
Artificial intelligence
Human–computer interaction
Acoustics