옥정슬 교수 연구실 | 포항공과대학교 인공지능대학원

옥정슬 연구실

포항공과대학교 인공지능대학원 옥정슬 교수

대형언어모델 효율화

Retrieval-Augmented Generation

출처 신뢰도 추정

옥정슬 교수 연구실

홈

기본 정보

연구 분야

프로젝트

논문

구성원

홈

옥정슬 연구실

포항공과대학교 인공지능대학원 옥정슬 교수

옥정슬 연구실은 인공지능대학원 소속으로, 기계학습과 강화학습 기반의 자연어 생성 및 추론 효율화, 그리고 신뢰성 확보를 핵심 기술로 수행합니다. 문서 검색과 생성이 결합되는 Retrieval-Augmented Generation에서 출처 신뢰도를 추정해 오류를 줄이는 방식을 연구하고, 다차원 품질 기준을 반영하는 강화학습 요약 최적화 프레임을 구축합니다. 또한 적응형 게이팅과 잠재 의미 클러스터링을 통해 다단계 추론의 계산 낭비를 억제하며, test-time adaptation의 악의적 입력 취약성 및 연합 환경에서의 저랭크 적응 안정화까지 함께 다룹니다.

대형언어모델 효율화Retrieval-Augmented Generation출처 신뢰도 추정적응형 게이팅잠재 의미 클러스터링

대표 연구 분야

연구 영역 전체보기

신뢰도 인식 검색 증강 생성과 지식-기반 요약 튜닝

Reliability-Aware Retrieval-Augmented Generation and Knowledge-Grounded Summarization Tuning

연구 분야 상세보기

신뢰도 인식 검색 증강 생성과 지식-기반 요약 튜닝

Reliability-Aware Retrieval-Augmented Generation and Knowledge-Grounded Summarization Tuning

연구 분야 상세보기

강화학습 기반 다차원 요약 품질 최적화와 보상 모델링

Reinforcement Learning for Multi-Dimensional Text Summarization Optimization

연구 분야 상세보기

적응형 게이팅과 잠재 의미 클러스터링을 통한 효율적·강건한 LLM 추론/적응

Efficient and Robust LLM Inference via Adaptive Gating and Latent Semantic Clustering

연구 분야 상세보기

연구 성과 추이

표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

63총합

5개년 연도별 피인용 수

150총합

주요 논문

논문 전체보기

article

인용수 1

2025

Towards Robust and Efficient Federated Low-Rank Adaptation with Heterogeneous Clients

Jabin Koo, Minwoo Jang, Jungseul Ok

대규모 언어 모델(LLMs)에 대한 연합 미세조정(federated fine-tuning)은 큰 모델 업데이트를 전송하는 데 따른 막대한 통신 오버헤드로 인해 중대한 어려움에 직면한다. Low Rank Adaptation(LoRA)이 해결책으로 제안되었음에도 불구하고, 연합 학습에서의 적용은 집계(aggregation) 과정에서의 불일치(discordance)로 인해 복잡해진다. 기존의 불일치 문제를 다루는 방법들은 종종 이질적인 데이터 설정에서 저랭크(low ranks)에 대한 성능 저하를 겪는다. 이에 대응하여 우리는 교대 동결(Alternating freeze)과 적응적 랭크 선택(Adaptive rank selection)을 이용한 저랭크 적응(LoRA)인 LoRA-A 2(교대 동결 및 적응적 랭크 선택을 포함한 저랭크 적응)를 제안하며, 이는 저랭크 및 높은 데이터 이질성이 존재하는 어려운 환경에서 견고함을 보인다. 실험 결과에 따르면, LoRA-A 2는 극단적인 이질성과 저랭크 조건에서도 성능을 유지하여, 성능 저하 없이 완전 미세조정(full fine-tuning)과 비교했을 때 업로드되는 파라미터를 최대 유의미한 수준까지 감소시킨다. 이러한 적응 메커니즘은 연합 미세조정에서의 견고성과 통신 효율을 향상시키며, 자원이 제한된 환경에서 LLM을 실제로 배치할 수 있게 한다.

https://doi.org/10.18653/v1/2025.acl-long.19

Adaptation (eye)

Computer science

Rank (graph theory)

Distributed computing

Data science

Mathematics

Psychology

article

인용수 5

2025

Retrieval-Augmented Generation with Estimation of Source Reliability

Jeongyeon Hwang, Junyoung Park, Hyejin Park, Dong‐Woo Kim, Sangdon Park, Jungseul Ok

검색 증강 생성(Retrieval-Augmented Generation, RAG)은 외부 데이터베이스에서 정보를 검색하여 대규모 언어 모델(LLM)의 제한된 내부 지식을 보완함으로써, 사실적 정확도를 향상하는 데 효과적인 접근법이다. 그러나 표준 RAG은 질의와 문서 간의 관련성에만 의존하여 정보를 검색하는 경우가 많아, 이러한 자료원의 이질적인 신뢰도를 간과함으로써 부정확한 정보를 검색할 위험이 있다. 이 문제를 해결하기 위해 본 연구에서는 자료원 신뢰도 인지 RAG(Reliability-Aware RAG, RA-RAG)라는 새로운 다중 자료원 RAG 프레임워크를 제안한다. RA-RAG는 자료원의 신뢰도를 추정하고 이를 활용하여 높은 신뢰도이면서도 관련성이 높은 문서를 우선적으로 선택함으로써, 보다 견고하고 정확한 응답 생성이 가능하도록 설계되었다. 구체적으로 RA-RAG는 먼저 여러 자료원에 걸쳐 정보를 교차 대조하여 자료원의 신뢰도를 추정한다. 그 다음 신뢰도와 관련성 기준 상위 자료원에서 문서를 검색하고, 가중 다수결(weighted majority voting, WMV)로 이들의 정보를 집계한다. 이때 선택적 검색은 성능을 저하시키지 않으면서도 확장성을 보장한다. 종합적인 실험 결과, RA-RAG는 이질적인 자료원 신뢰도가 존재하는 시나리오에서 기존 기준 방법들을 일관되게 능가하며, 자료원 수가 증가함에 따라 효율적으로 확장됨을 보였다. 또한 RA-RAG가 실제 환경의 자료원에 대해 신뢰도를 추정할 수 있음을 시연함으로써, 실용적 적용 가능성을 강조한다.

https://doi.org/10.18653/v1/2025.emnlp-main.1738

Reliability (semiconductor)

Estimation

Component (thermodynamics)

Measure (data warehouse)

Estimation theory

article

인용수 2

2025

Semantic Exploration with Adaptive Gating for Efficient Problem Solving with Language Models

Sungjae Lee, Hyejin Park, Jae-Chang Kim, Jungseul Ok

대규모 언어 모델(LLM)의 최근 발전은, 트리 탐색(tree search)과 같은 다단계 추론 방법을 통해 다양한 추론 경로를 탐색해야 하는 여러 복잡한 과제에서 주목할 만한 잠재력을 보여주었다. 그러나 기존 방법들은 대개 계산 효율성의 비효율성과 중복 탐색 문제를 겪는다. 첫째, 과제 난이도의 다양성을 간과하여 쉬운 과제에 대해서도 불필요하게 지나치게 광범위한 탐색을 수행하는 경우가 많다. 둘째, 추론 경로의 의미(semantic)를 무시함으로써 의미적으로 동일한 경로에 대한 중복 탐색이 발생한다. 이러한 한계를 해결하기 위해, 우리는 계산적으로 효율적인 방법인 의미 기반 탐색과 적응적 게이팅(Semantic Exploration with Adaptive Gating, SEAG)을 제안한다. SEAG는 선행의 간단한 추론 방법으로부터 얻어진 답변의 신뢰도(confidence level)에 따라 트리 탐색을 수행할지 여부를 동적으로 결정하는 적응적 게이팅 메커니즘을 사용한다. 또한, 트리 기반 탐색은 의미적으로 동일한 추론 단계를 통합하여, 중복 탐색을 줄이면서도 정확도는 유지하거나 오히려 향상시킨다. 광범위한 실험 결과, SEAG는 GSM8K와 ARC를 포함한 복잡한 추론 벤치마크에서, Llama2, Llama3, Mistral과 같은 다양한 언어 모델을 대상으로 기존 트리 탐색 기반 방법과 비교했을 때 평균적으로 정확도를 4.3% 유의하게 개선하면서도 계산 비용은 31%만을 요구함을 보여주었다. 코드는 https://github.com/ml-postech/SEAGsemantic-exploration-with-adaptive-gating 에서 제공된다.

https://doi.org/10.18653/v1/2025.acl-long.29

Computer science

Gating

Artificial intelligence

Natural language processing

Theoretical computer science

Psychology

최신 정부 과제

과제 전체보기

2024년 12월-2026년 12월

|668,004,000원

라스트인치 로봇 서비스를 통한 수수료형 비즈니스 모델 구축 및 이를 실현하기 위한 인간-로봇 상호작용 AI 로봇 플랫폼 개발

라스트인치 로봇의 MAAS 서비스를 위한 Smart Connect 기반 End-to-End 자동화 기술 개발* Smart Connect는 배송 자동화를 위한 통합 솔루션으로, ▶ AI 기반 로봇 플랫폼 ▶ 대화형 기반 인간-로봇 상호작용 인터페이스▶ 인앱 결제 및 주문 시스템 ▶ 이적재 자동화 프로세스 기술 개발을 목표로 함. 이를 활용하여 라스트마일 배송...

수수료형 비즈니스 모델

라스트인치

서비스 로봇

인간-로봇 상호작용

적응형 AI

2024년 7월-2028년 12월

|770,000,000원

AI Guardians: 강건하고 통제가능하며 편향 없는 신뢰 AI 기술 개발

본 과제의 최종 목표는 강건하고 통제 가능하며 편향 없는 신뢰 AI 기술을 개발하는 것이다. 이를 위해 세 가지 주요 연구 방향을 설정하였다: 첫째, 강건하고 통제 가능한 신뢰 AI 개발을 통해 예측 가능하고 안정적인 시스템 구축, 둘째, AI의 편향성을 최소화하여 공정성을 강화하는 신뢰 AI 기술 개발, 셋째, 국제 협의체 구축과 데이터 합성 방법론을 통...

신뢰 AI

설명가능 AI

거대 언어 모델

편향성 안화

AI 법률 정책

2024년 7월-2028년 12월

|1,540,000,000원

AI Guardians: 강건하고 통제가능하며 편향 없는 신뢰 AI 기술 개발

신뢰 AI

설명가능 AI

거대 언어 모델

편향성 안화

AI 법률 정책

최신 특허

특허 전체보기

상태	출원연도	과제명	출원번호
공개	2023	목표 지향 강화학습을 위한 전자 장치	1020230184863
공개	2023	소리 신호 및 제어 신호를 이용한 이상 감지 시스템	1020230080968
등록	2012	데이터 전송 방법	1020120074990

전체 특허

목표 지향 강화학습을 위한 전자 장치

상태

공개

출원연도

2023

출원번호

1020230184863

상세 정보 바로가기

소리 신호 및 제어 신호를 이용한 이상 감지 시스템

상태

공개

출원연도

2023

출원번호

1020230080968

상세 정보 바로가기

데이터 전송 방법

상태

등록

출원연도

2012

출원번호

1020120074990

상세 정보 바로가기

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)