자동 용어 추출(Automatic Term Extraction, ATE)은 기계 번역 및 정보 검색과 같은 후속 작업에 중요한 도메인 특화 표현을 식별한다. 대규모 언어 모델(LLM)은 다양한 NLP 과제를 크게 발전시켰음에도 불구하고, ATE에 대한 그 잠재력은 거의 연구되지 않았다. 우리는 소수 예시(few-shot) 설정에서 의미적 유사성보다는 구문적 유사성에 따라 시연(demonstrations)을 선택하는 검색 기반 프롬프팅 전략을 제안한다. 이 구문적 검색 방법은 도메인 비특화적이며 용어 경계(term boundaries)를 포착하는 데 더 신뢰할 수 있는 지침을 제공한다. 우리는 접근법을 사내 도메인(in-domain) 및 교차 도메인(cross-domain) 설정 모두에서 평가하고, 질의 문장과 검색된 예시 간의 어휘 중복(lexical overlap)이 성능에 미치는 영향을 분석한다. 세 가지 전문화된 ATE 벤치마크에서 수행한 실험 결과, 구문적 검색이 F1-점수를 향상시킨다는 것을 확인했다. 이러한 결과는 LLM을 용어 추출 과제에 적응시킬 때 구문적 단서의 중요성을 강조한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.