주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
article
|
인용수 0
·
2025In-Context Policy Adaptation via Cross-Domain Skill Diffusion
Minjong Yoo, Wookyung Kim, Honguk Woo
Proceedings of the AAAI Conference on Artificial Intelligence
본 연구에서는 장기 지평(multi-horizon) 다중과제 환경을 위한 문맥 내 정책 적응(in-context policy adaptation, ICPAD) 프레임워크를 제시하며, 교차 도메인 환경에서 확산 기반 기술(스킬) 학습 기법을 탐구한다. 이 프레임워크는 특히 모델 업데이트가 불가능하고 목표 도메인 데이터가 제한적인 엄격한 제약 하에서, 기술 기반 강화학습 정책을 다양한 목표 도메인에 대해 신속하게 적응할 수 있도록 한다. 구체적으로, 본 프레임워크는 교차 도메인 기술 확산(cross-domain skill diffusion) 방식을 활용하는데, 도메인 비특화(prototype) 기술과 도메인 기반(domain-grounded) 기술 어댑터를 교차 도메인 일관성 확산 과정으로 오프라인 데이터셋으로부터 함께 학습하며 효과적으로 결합한다. 도메인 비특화 기술은 장기 지평 정책의 공통 행동 표현을 위한 기본 요소(primitives)로 작용하여, 서로 다른 도메인을 연결하는 공용 언어(lingua franca) 역할을 한다. 또한 문맥 내 적응 성능을 향상시키기 위해, 확산 기반 기술 어댑터가 목표 도메인과 더 잘 정렬(alignment)되도록 유도하는 동적 도메인 프롬프팅(dynamic domain prompting) 방식을 개발한다. Metaworld에서의 로봇 조작과 CARLA에서의 자율주행 실험을 통해, 본 ICPAD 프레임워크가 환경 역학, 에이전트 신체(embodiment), 과제의 지평(horizon) 차이를 포함하는 다양한 교차 도메인 구성에서, 목표 도메인 데이터가 제한된 조건 하에서도 우수한 정책 적응 성능을 달성함을 보여준다.
https://doi.org/10.1609/aaai.v39i21.34373
Adaptation (eye)
Context (archaeology)
Diffusion
Domain adaptation
Domain (mathematical analysis)
Computer science
Psychology
Cognitive psychology
Artificial intelligence
Geography
2
article
|
인용수 1
·
2025Aspect-augmented distillation of task-oriented dialogues to small language models
Jongmoon Jun, Woo Kyung Kim, Hyunseong Na, Honguk Woo, Jeehyeong Kim
IF 7.5 (2025)
Expert Systems with Applications
• 사용자 측면을 고려하면 과업 지향 대화 성능이 향상된다 • 대규모 언어 모델은 사용자 측면에 적응하지만, 소규모 모델은 측면 인식이 부족하다 • 대규모 언어 모델은 증류를 위한 측면 특화 합성 대화를 생성한다 • 대규모에서 소규모 언어 모델로 측면 인식 역량을 증류한다
대규모 언어 모델(LLM)을 활용한 대화 시스템 개발에 관한 연구는 광범위하게 진행되어 왔으며, 주로 LLM의 능력을 활용하여 문맥적으로 미묘한 응답을 생성하는 데 의존해 왔다. 그러나 이러한 접근법은 특히 과업 지향 대화(ToD) 시나리오에서, 대화 시스템이 인간과의 개인화된 상호작용에 참여해야 하는 상황에서는, 소규모 언어 모델(sLM)로의 전이가 용이하지 않다. 본 논문에서는 sLM 기반 ToD 시스템을 위한 LLM 증류(distillation) 접근법을 조사하고, Aspect-Augmented Dialogue Distillation(A2D2) 프레임워크를 제안한다. 이 프레임워크는 과업별 요구사항의 충족을 보장하면서, LLM의 인간 측면 인식 역량을 sLM에 압축하는 것을 목표로 한다. 해당 프레임워크는 LLM 기반 ToD 데이터 생성에 인간의 측면들을 개별적으로 통합하여 LLM-to-sLM 증류 과정의 효과성과 효율성을 향상시키며, 그 결과 다양한 사용자에게 적응 가능하고 과업 성공률이 더 높은 강건한 sLM 기반 ToD 시스템을 구축한다. A2D2를 통해 도출된 sLM 기반 ToD 시스템은, 새로운 과업 설정을 포함하여 다양한 ToD 시나리오에서 경쟁력 있는 성능을 보이며, 복수의 측면으로 특징지어지는 폭넓은 합성 사용자들에 적응함을 보여준다.
https://doi.org/10.1016/j.eswa.2025.130494
Distillation
Task (project management)
Set (abstract data type)
Language model
Language understanding
Range (aeronautics)
3
article
|
인용수 2
·
2023A Configurable Model-Based Reinforcement Learning Framework for Disaggregated Storage Systems
Seunghwan Jeong, Honguk Woo
IF 3.4 (2023)
IEEE Access
데이터 집약적 작업의 급속한 증가와 저장 장치에 서로 다른 하드웨어가 사용됨에 따라, 데이터센터의 운영 비용 효율을 개선하기 위해 분산형 저장(disaggregated storage) 아키텍처 시스템이 활용되고 있다. 분산형 저장 시스템의 하드웨어 이질성 및 혼합 구성과 더불어 다양한 워크로드의 존재는, 관리자들이 이를 최적으로 운영하는 데 어려움을 야기하는 경우가 많다. 본 연구에서는 셀프 관리형 저장 시스템에서 다양한 시스템 설정과 워크로드 전반에 걸쳐 저장 성능을 유지하면서 자동화된 시스템 운영을 개발하기 위한 모델 기반 강화학습(RL) 기법을 조사한다. 구체적으로, 시스템 환경을 저장 장치의 2계층 계층구조와 플랫폼의 관점에서 추상화하여, 주어진 시스템 사양에 따라 환경을 재구성할 수 있는 새로운 구성 가능(configurable) 모델 구조를 제안한다. 이러한 새로운 모델 구조를 기반으로, 우리는 CoMoRL이라는 구성 가능 모델 기반 RL 프레임워크를 구현하였으며, RL 에이전트는 다양한 저장 시스템 사양을 나타내는 모델 변형(model variants)을 통해 학습된다. 따라서 실제 저장 시스템의 다양한 운영 조건에 대해 학습된 관리 정책은 높은 강인성을 가질 수 있다. 우리는 NVMe-oF 장치에 의존하는 저장 클러스터를 사용하여 CoMoRL 프레임워크를 평가하고, Kubernetes의 볼륨 배치(volume placement) 시나리오와 Ceph의 주(prim ary) 애피니티(primary affinity) 제어 시나리오 등 서로 다른 시나리오에 프레임워크가 적응 가능함을 보여준다. 학습된 관리 정책은 모델 및 정책의 재학습 없이도, 다양한 Kubernetes 시스템 사양에 대해서는 IOPS 기반 휴리스틱 방법 대비 0.7%~5.1%, 모델 기반 방법 대비 11.8%~29.7% 더 우수하며, 다양한 Ceph 시스템 사양에 대해서는 각각 1.6%~5.6% 및 8.2%~16.5% 더 우수하다. 본 프레임워크의 제로샷(zero-shot) 적응 우수성은, 시스템 변경이 빈번한 데이터센터에서 RL 기반 셀프 관리형 저장 시스템을 구현할 수 있게 한다.
http://dx.doi.org/10.1109/access.2023.3244388
Computer science
Reinforcement learning
Computer data storage
Variety (cybernetics)
Heuristic
Distributed computing
Hierarchy
Embedded system
Operating system
Artificial intelligence
4
article
|
인용수 9
·
2023A Maturity Model for Trustworthy AI Software Development
Seunghwan Cho, Ingyu Kim, Jin-Han Kim, Honguk Woo, Wan-Seon Shin
IF 2.5 (2023)
Applied Sciences
최근 AI 소프트웨어가 급속히 성장하고 있으며 금융, 의학, 로보틱스, 자율주행과 같은 다양한 산업 분야에서 널리 사용되고 있다. 요구사항에 따라 개발자들이 특정 기능과 규칙을 정의하고 구현해야 하는 전통적인 소프트웨어와 달리, AI 소프트웨어는 관련 데이터를 수집하고 학습함으로써 이러한 요구사항을 학습한다. 따라서 학습 데이터에 의도치 않은 편향이 존재하는 경우 AI 소프트웨어는 공정성과 안전성 측면의 문제를 야기할 수 있다. 이러한 과제를 해결하기 위해, 전통적인 성숙도 모델인 SPICE(ISO/IEC 15504) 내에서 공통적인 AI 프로세스와 공정성 특화 프로세스를 고려함으로써 신뢰할 수 있고 신뢰성 있는 AI 소프트웨어를 보장하기 위한 성숙도 모델인 AI-MM을 제안한다. AI-MM의 효과를 검증하기 위해, 본 연구는 13개의 실제 AI 프로젝트에 이 모델을 적용하였고 이에 대한 통계적 평가를 제공하였다. 그 결과는 AI-MM이 AI 프로젝트의 성숙도 수준을 효과적으로 측정할 뿐 아니라 성숙도 수준을 향상시키기 위한 실질적인 지침도 제공함을 보여준다.
https://doi.org/10.3390/app13084771
Capability Maturity Model
Maturity (psychological)
Computer science
Software engineering
Software
Trustworthiness
Artificial intelligence
Computer security
5
article
|
인용수 10
·
2022Sample-Efficient Deep Learning Techniques for Burn Severity Assessment with Limited Data Conditions
Hyun‐Kyung Shin, Hyeonung Shin, Wonje Choi, Jaesung Park, Minjae Park, Euiyul Koh, Honguk Woo
IF 2.7 (2022)
Applied Sciences
진단을 돕기 위한 의료 데이터 및 영상의 자동 분석은 최근 딥러닝 적용 분야에서 주요한 연구 영역이 되었다. 일반적으로 딥러닝 기법은 모델 훈련을 위한 충분히 큰 규모의 고품질 데이터셋이 이용 가능할 때 효과적일 수 있다. 따라서, 적절한 수의 잘 주석된 고품질 훈련 샘플을 확보하는 데 상당한 비용과 노력이 필요하다는 점에서, 특히 의료 영상 분석 분야에서는 샘플 효율적인 학습 기법에 대한 필요성이 제기된다. 본 논문에서는 샘플 부족 하에서의 딥 신경망 훈련 문제를 다루기 위해 여러 샘플 효율적인 딥러닝 기법을 조사한다. 우리는 이러한 기법을 피부 화상 이미지 분석 및 분류에 적용하는 데에 초점을 둔다. 먼저 피부 화상 영상에 대한 대규모의 전문적으로 주석된 데이터셋을 구축하여, 화상 중증도 평가를 위한 정밀한 성능의 합성곱 신경망(CNN) 모델 수립을 가능하게 한다. 그 다음 데이터 제한 조건을 의도적으로 설정하고, 전이 학습(TL), 자기지도 학습(SSL), 연합 학습(FL), 생성적 적대 신경망(GAN) 기반 데이터 증강과 같은 몇 가지 샘플 효율적인 기법을 해당 조건에 맞게 적용한다. 포괄적인 실험을 통해 화상 중증도 평가에서의 샘플 효율적인 딥러닝 기법을 평가하였으며, 특히 작은 과제-특화 데이터셋에서 학습한 SSL 모델이 여섯 배 더 큰 데이터셋에서 학습한 기준 모델과 비교 가능한 정확도를 달성할 수 있음을 보인다. 또한 딥러닝 모델이 채택되는 의료 및 보건 분야에서 흔히 발생하는 서로 다른 데이터 제한 조건 하에서 FL 및 GAN이 모델 훈련에 적용 가능함을 함께 입증한다.
https://doi.org/10.3390/app12147317
Deep learning
Artificial intelligence
Computer science
Convolutional neural network
Machine learning
Sample (material)
Artificial neural network
Data mining