주요 논문
3
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
Article
|
인용수 0
·
2026GroupLoRA: Enhancing Rank Effectiveness Through Group-Wise Decomposition for Low-Rank Adaptation
Jaesung Jun, Youngmin Ro
IEEE Access
대규모 언어 모델(LLMs)과 대규모 비전 모델(LVMs)의 빠른 발전은 획기적인 성능을 달성했지만, 종종 1000억(10^11) 개 이상의 매개변수를 초과하는 방대한 규모로 인해 상당한 배포상의 어려움도 함께 야기하였다. 매개변수 효율적 미세조정(Parameter-Efficient Fine-tuning, PEFT) 방법, 특히 저랭크 적응(Low-Rank Adaptation, LoRA)은 가중치 업데이트를 저랭크 행렬들의 곱으로 근사함으로써 이 문제를 해결하여, 경쟁력 있는 성능을 유지하면서 학습 가능한 매개변수의 수를 극적으로 감소시킨다. 그러나 LoRA의 효과성은 근본적으로 업데이트 행렬의 제한된 유효 랭크에 의해 제약되며, 복잡한 적응 과제를 위해 요구되는 풍부하고 고차원적인 변화를 포착하는 데 한계를 가진다. 본 연구는 이 한계를 극복하기 위해 분할 정복(divide-and-conquer) 전략을 도입한 GroupLoRA를 제안한다. GroupLoRA는 가중치 행렬을 g개 그룹으로 분할하고, 각 그룹에 대해 독립적인 LoRA 모듈을 적용함으로써 이를 달성한다. GroupLoRA는 두 가지 핵심 혁신을 도입한다: (1) 학습 가능한 상호작용 행렬을 통해 그룹 간 정보 교환을 가능하게 하는 Inter-Group Bridge 모듈, 그리고 (2) 최종 출력에서 각 그룹의 기여도를 동적으로 조정하는 Learnable Scaling Factors이다. 이러한 설계는 그룹 특화(group specialization)를 가능하게 하면서도 그룹 간 조율(cross-group coordination)을 유지하여, 제한된 매개변수 예산 내에서 모델의 표현력을 극대화한다. LLM과 VLM에 대한 광범위한 실험 결과, GroupLoRA는 기존 LoRA에 비해 더 적은 매개변수로 일관되게 더 높은 성능을 달성함을 보여준다. 본 접근법은 매개변수 효율적 미세조정에 그룹 단위 처리(group-wise processing) 원리를 성공적으로 적용함으로써, 다양한 과제에 걸친 효율적인 대형 모델 적응을 위한 실용적인 해결책을 제공한다.
https://doi.org/10.1109/access.2026.3671790
Adaptation (eye)
Rank (graph theory)
Key (lock)
Limiting
Software deployment
Decomposition
Bridge (graph theory)
2
Article
|
인용수 5
·
2024Instance-Dependent Multilabel Noise Generation for Multilabel Remote Sensing Image Classification
Youngwook Kim, Sehwan Kim, Youngmin Ro, Jungwoo Lee
IF 5.3 (2024)
IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing
다중표지 원격탐사 이미지 분류는 한 장의 이미지 내에서 여러 객체와 토지 피복을 분류하는 기본 과제이다. 그러나 이러한 과제를 위해 딥러닝 모델을 학습시키는 데에는 라벨링 비용이 상당히 많이 소요된다. 라벨링 비용을 줄이기 위한 여러 노력들이 이루어졌지만, 그 결과 라벨 품질이 저하되고 잘못된(즉, 노이즈가 포함된) 라벨이 포함되는 경우가 흔하다. 이러한 문제를 해결하기 위해, 다중표지 노이즈에 강인하도록 딥러닝 모델을 학습시키는 알고리즘들이 문헌에서 제안되어 왔다. 그럼에도 불구하고, 이러한 알고리즘들의 효능은 각 원격탐사 이미지의 개별 특성과 특징과 무관하게 노이즈가 생성되는 인스턴스 비독립적(instance-independent) 다중표지 노이즈 하에서만 평가되어 왔다. 본 논문에서는 다중표지 원격탐사 이미지 데이터셋에 대해 최초로 인스턴스 의존적(instance-dependent) 다중표지 노이즈를 생성하는 방법을 제안한다. 우리는 제로샷 예측 기능을 갖춘 비전-언어 모델을 활용하여 각 이미지에 대한 범주별 예측 점수를 계산하고, 이를 바탕으로 인스턴스에 의존하는 방식으로 다중표지 노이즈를 생성한다. 제안하는 인스턴스 의존적 다중표지 노이즈는 전통적인 인스턴스 비독립적 다중표지 노이즈에 비해 개별 이미지에 대해 보다 용이하게 생성됨을 보여준다. 또한 더 어려운 노이즈 시나리오가 생성되어, 그에 따라 보다 복잡한 결정 경계와 딥러닝 모델 학습 시 더 강한 과적합이 유발됨을 확인한다. 마지막으로, 생성된 인스턴스 의존적 다중표지 노이즈 하에서 기존의 노이즈 강인 학습 알고리즘들을 재평가한 결과, 여러 알고리즘이 인스턴스 의존적 다중표지 노이즈에 대해 제한적인 강인성만을 보이는 것으로 관찰된다.
https://doi.org/10.1109/jstars.2024.3454157
Computer science
Artificial intelligence
Pattern recognition (psychology)
Noise (video)
Contextual image classification
Image (mathematics)
3
Article
|
·
인용수 4
·
2024Adversarial deep energy method for solving saddle point problems involving dielectric elastomers
Seung-Woo Lee, Chien Truong-Quoc, Youngmin Ro, Do‐Nyun Kim
IF 7.3 (2024)
Computer Methods in Applied Mechanics and Engineering
https://doi.org/10.1016/j.cma.2024.116825
Saddle point
Finite element method
Multiphysics
Computer science
Artificial neural network
Benchmark (surveying)
Mathematical optimization
Free energy principle
Coupling (piping)
Applied mathematics