기본 정보
연구 분야
프로젝트
논문
구성원
article|
인용수 1
·2025
Enhancing Automatic Term Extraction with Large Language Models via Syntactic Retrieval
Yongchan Chun, Minhyuk Kim, D. S. Kim, Chanjun Park, Heuiseok Lim
초록

자동 용어 추출(Automatic Term Extraction, ATE)은 기계 번역 및 정보 검색과 같은 후속 작업에 중요한 도메인 특화 표현을 식별한다. 대규모 언어 모델(LLM)은 다양한 NLP 과제를 크게 발전시켰음에도 불구하고, ATE에 대한 그 잠재력은 거의 연구되지 않았다. 우리는 소수 예시(few-shot) 설정에서 의미적 유사성보다는 구문적 유사성에 따라 시연(demonstrations)을 선택하는 검색 기반 프롬프팅 전략을 제안한다. 이 구문적 검색 방법은 도메인 비특화적이며 용어 경계(term boundaries)를 포착하는 데 더 신뢰할 수 있는 지침을 제공한다. 우리는 접근법을 사내 도메인(in-domain) 및 교차 도메인(cross-domain) 설정 모두에서 평가하고, 질의 문장과 검색된 예시 간의 어휘 중복(lexical overlap)이 성능에 미치는 영향을 분석한다. 세 가지 전문화된 ATE 벤치마크에서 수행한 실험 결과, 구문적 검색이 F1-점수를 향상시킨다는 것을 확인했다. 이러한 결과는 LLM을 용어 추출 과제에 적응시킬 때 구문적 단서의 중요성을 강조한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Computer scienceTerm (time)Natural language processingArtificial intelligenceExtraction (chemistry)Information retrieval
타입
article
IF / 인용수
- / 1
게재 연도
2025

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.