에너지 기반 제약 반영 및 인간 지식 주입형 자연어 생성

Energy-based Constraint Integration and Human Knowledge Injection for Text Generation

연구 내용

에너지 모델을 이용해 제약과 관련된 span을 찾아 블랙박스 언어모델 출력을 충실하게 편집하는 연구

제약조건을 만족하는 controlled text generation에서 디코딩 시점에 로그it 조작을 요구하지 않으면서도, base language model의 의미를 유지하는 편집 방식을 연구합니다. off-the-shelf energy models를 사용해 제약과 가장 관련된 구간을 locate한 뒤, 해당 구간을 대체로 갱신하여 독성 등 목표 조건을 반영합니다. 또한 출력 제약을 포함한 학습 알고리즘을 통일적 관점에서 분류하고, main task 성능과 constraint 위반을 함께 고려하는 지표를 통해 학습 신호 결합 전략을 비교합니다. 이 과정에서 인간의 논리와 지식을 반영하는 에너지 기반 목적함수 설계를 지향합니다.

관련 프로젝트

3건

연구 흐름

초기에는 자연어 처리에서 인간의 논리와 지식을 제약 형태로 주입하기 위한 energy-based 목적함수 및 학습 전략을 정리하고, 제약 위반을 줄이는 학습 구조를 탐색했습니다. 이후 2024년에는 블랙박스 LLM의 텍스트 출력만으로도 span 위치를 energy 분포로 추정한 뒤 선택적 교체를 수행하는 Locate&Edit 계열의 생성 편집 연구를 수행했습니다. 동시에 2024년에는 출력 제약을 포함하는 학습 알고리즘을 통일된 수식 틀로 분석하여, 제약 손실, 탐색, 신호 통합 메커니즘의 차이가 성능과 위반 양상에 미치는 영향을 정리하는 방향으로 확장했습니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

안전한 제약 반영 생성
블랙박스 LLM 텍스트 편집 모듈
에너지 기반 span 탐지기술
출력 제약 학습 프레임워크
설명가능한 제약 영향 분석
정책 준수형 생성 파이프라인
학습 가능한 목적함수 설계 도구
문장 단위 편집용 에너지 모델
제약 기반 튜닝 자동화
논리 주입형 자연어 추론 보조