Enhancing Automatic Term Extraction with Large Language Models via Syntactic Retrieval | 임희석 교수 연구실 |

|임희석 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

Article|

인용수 1

·2025

Enhancing Automatic Term Extraction with Large Language Models via Syntactic Retrieval

Yongchan Chun, Minhyuk Kim, D. S. Kim, Chanjun Park, Heuiseok Lim

초록

자동 용어 추출(Automatic Term Extraction, ATE)은 기계 번역 및 정보 검색과 같은 후속 작업에 중요한 도메인 특화 표현을 식별한다. 대규모 언어 모델(LLM)은 다양한 NLP 과제를 크게 발전시켰음에도 불구하고, ATE에 대한 그 잠재력은 거의 연구되지 않았다. 우리는 소수 예시(few-shot) 설정에서 의미적 유사성보다는 구문적 유사성에 따라 시연(demonstrations)을 선택하는 검색 기반 프롬프팅 전략을 제안한다. 이 구문적 검색 방법은 도메인 비특화적이며 용어 경계(term boundaries)를 포착하는 데 더 신뢰할 수 있는 지침을 제공한다. 우리는 접근법을 사내 도메인(in-domain) 및 교차 도메인(cross-domain) 설정 모두에서 평가하고, 질의 문장과 검색된 예시 간의 어휘 중복(lexical overlap)이 성능에 미치는 영향을 분석한다. 세 가지 전문화된 ATE 벤치마크에서 수행한 실험 결과, 구문적 검색이 F1-점수를 향상시킨다는 것을 확인했다. 이러한 결과는 LLM을 용어 추출 과제에 적응시킬 때 구문적 단서의 중요성을 강조한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Computer scienceTerm (time)Natural language processingArtificial intelligenceExtraction (chemistry)Information retrieval

타입

Article

IF / 인용수

- / 1

원문

https://doi.org/10.18653/v1/2025.findings-acl.516

게재 연도

2025