| 번호 | 청구항 |
|---|---|
| 1 | 프로세서(Processor)를 포함하는 컴퓨팅 장치에 의해 수행되는, SuperICL(Super In-Context Learning)을 활용한 자연어 생성 방법에 있어서,문장들과 각각이 상기 문장들 각각에 대응하는 정답문장들을 포함하는 지도학습 데이터셋으로부터 미리 정해진 개수의 샷(shot)을 샘플링하는 단계;샘플링된 샷에 대한 미세조정된 언어 모델의 출력을 이용하여, 거대 언어 모델의 제1 입력을 생성하는 단계;타겟문장에 대한 상기 미세조정된 언어 모델의 출력을 이용하여, 상기 거대 언어 모델의 제2 입력을 생성하는 단계; 및상기 제1 입력과 상기 제2 입력을 상기 거대 언어 모델에 입력하여 상기 타겟문장에 대한 예측문장을 생성하는 단계를 포함하고,상기 제1 입력은 상기 샘플링된 샷에 포함되는 입력문장, 상기 입력문장에 대한 상기 미세조정된 언어 모델의 출력인 제1 생성문장, 상기 제1 생성문장의 생성 확률, 및 상기 샘플링된 샷에 포함되는 정답문장을 포함하는,자연어 생성 방법. |
| 2 | 제1항에 있어서,상기 제2 입력은 상기 타겟문장, 상기 타겟문장에 대한 상기 미세조정된 언어 모델의 출력인 제2 생성문장, 및 상기 제2 생성문장의 생성 확률을 포함하는,자연어 생성 방법. |
| 3 | 제2항에 있어서,상기 미세조정된 언어 모델은, 학습 데이터를 이용하여 상기 미세조정된 언어 모델이 임의의 태스크를 수행하도록 사전학습된 언어 모델을 미세조정하여 생성되고,상기 임의의 태스크는 입력에 대한 요약문을 생성하는 태스크, 입력에 대한 번역문을 생성하는 태스크, 및 대화 이력을 포함하는 입력에 대한 응답을 생성하는 태스크 중 어느 하나인,자연어 생성 방법. |
| 4 | 제3항에 있어서,상기 확률은 상기 제1 생성문장 또는 상기 제2 생성문장에서 각 토큰의 생성 확률이 평균인,자연어 생성 방법. |