Locate&Edit: Energy-based Text Editing for Efficient, Flexible, and Faithful Controlled Text Generation | 이재윤 교수 연구실 | 서울대학교 데이터사이언스학과

이재윤 교수 연구실

홈

기본 정보

연구 분야

프로젝트

논문

구성원

preprint|

인용수 0

·2024

Locate&Edit: Energy-based Text Editing for Efficient, Flexible, and Faithful Controlled Text Generation

Hye Ryung Son, Jay-Yoon Lee

arXiv (Cornell University)

초록

최근의 제어된 텍스트 생성(CTG) 접근법은 대개 디코딩 시점에서 기본 언어 모델(LM)의 가중치 또는 로짓(logits)을 조작하는 방법을 포함한다. 그러나 이러한 방법들은 최신의 블랙박스 LMs에는 적용할 수 없으며, 기본 LM이 원래 생성한 결과의 핵심 의미를 보존하는 데에도 비효율적이다. 본 연구에서는 블랙박스가 아닌 텍스트 생성 접근인 CTG를 위한 효율적이고 유연한 에너지 기반 접근법인 Locate&Edit(L&E)를 제안한다. 이는 시판(off-the-shelf) 에너지 모델을 사용하여 기본 LM의 텍스트 출력을 편집한다. 기본 LM으로부터 텍스트 출력이 주어지면, L&E는 먼저 에너지 모델을 활용해 제약(예: 독성)과 가장 관련 있는 구간(span)을 위치(Locate)시키고, 이어서 이러한 구간을 더 적절한 대안으로 대체하여 편집(Edit)한다. 중요하게도, 본 방법은 텍스트 출력만 필요하므로 블랙박스 LMs와 호환 가능하다. 또한 L&E는 구성 요소 모델에 대해 특정 아키텍처를 요구하지 않으므로, 다양한 조합의 이용 가능한 시판 에너지 모델과 함께 동작할 수 있다. 더 나아가 L&E는 제약과 관련된 양상만을 선택적으로 수정하고 나머지는 변경하지 않음으로써, 기본 LM의 원래 생성 결과를 보존한다. 이러한 표적 편집은 또한 L&E가 효율적으로 동작하도록 보장한다. 우리의 실험 결과는 L&E가 기본 LM 생성 결과의 의미 보존과 속도에서 우수함을 달성하는 한편, 제약 충족에서도 경쟁력 있거나 향상된 성능을 동시에 얻음을 확인하였다. 뿐만 아니라, 에너지 분포의 과립성(granularity)이 CTG 성능에 미치는 영향을 분석한 결과, 기존의 이진 분류기 기반 에너지 모델에 비해 미세한(granular) 회귀(regression) 기반 에너지 모델이 제약 충족을 향상시키는 것으로 나타났다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Text generationComputer scienceNatural language processingInformation retrieval

타입

preprint

IF / 인용수

- / 0

원문

http://arxiv.org/abs/2407.00740

게재 연도

2024

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)