Energy-based Constraint Integration and Human Knowledge Injection for Text Generation
연구 내용
에너지 모델을 이용해 제약과 관련된 span을 찾아 블랙박스 언어모델 출력을 충실하게 편집하는 연구
제약조건을 만족하는 controlled text generation에서 디코딩 시점에 로그it 조작을 요구하지 않으면서도, base language model의 의미를 유지하는 편집 방식을 연구합니다. off-the-shelf energy models를 사용해 제약과 가장 관련된 구간을 locate한 뒤, 해당 구간을 대체로 갱신하여 독성 등 목표 조건을 반영합니다. 또한 출력 제약을 포함한 학습 알고리즘을 통일적 관점에서 분류하고, main task 성능과 constraint 위반을 함께 고려하는 지표를 통해 학습 신호 결합 전략을 비교합니다. 이 과정에서 인간의 논리와 지식을 반영하는 에너지 기반 목적함수 설계를 지향합니다.
관련 연구 성과
관련 논문
3편
관련 특허
0건
관련 프로젝트
3건
연구 흐름
초기에는 자연어 처리에서 인간의 논리와 지식을 제약 형태로 주입하기 위한 energy-based 목적함수 및 학습 전략을 정리하고, 제약 위반을 줄이는 학습 구조를 탐색했습니다. 이후 2024년에는 블랙박스 LLM의 텍스트 출력만으로도 span 위치를 energy 분포로 추정한 뒤 선택적 교체를 수행하는 Locate&Edit 계열의 생성 편집 연구를 수행했습니다. 동시에 2024년에는 출력 제약을 포함하는 학습 알고리즘을 통일된 수식 틀로 분석하여, 제약 손실, 탐색, 신호 통합 메커니즘의 차이가 성능과 위반 양상에 미치는 영향을 정리하는 방향으로 확장했습니다.
활용 가능성
활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.
관련 논문
구분
제목
Locate&Edit: Energy-based Text Editing for Efficient, Flexible, and Faithful Controlled Text Generation
An Analysis under a Unified Fomulation of Learning Algorithms with Output Constraints
An Analysis under a Unified Formulation of Learning Algorithms with Output Constraints
관련 프로젝트
구분
제목
자연어 처리에 인간의 논리와 지식을 반영할 수 있는 에너지모델 기술개발 및 학습 가능한 목적함수로써의 활용
자연어 처리에 인간의 논리와 지식을 반영할 수 있는 에너지모델 기술개발 및 학습 가능한 목적함수로써의 활용
자연어 처리에 인간의 논리와 지식을 반영할 수 있는 에너지모델 기술개발 및 학습 가능한 목적함수로써의 활용