행 군집화를 이용한 트랜스포머의 어텐션 값 결정 방법
Method for determining Attention Value of Transformer using row clustering
특허 요약
본 발명은 행 군집화를 통해 트랜스포머의 어텐션 연산 복잡도를 낮추는 방법에 관한 것이다. 본 발명의 일 실시예에 따른 트랜스포머의 어텐션 값 결정 방법은 트랜스포머(Transformer)의 입력에 대한 쿼리(Query) 벡터 또는 키(Key) 벡터에 저계수 근사(low rank approximation)를 적용하는 단계, 상기 쿼리 벡터와 키 벡터를 내적하여 근사 어텐션 스코어(attention score)를 산출하는 단계, 상기 근사 어텐션 스코어를 구성하는 복수 행의 유사도에 기초하여 상기 복수 행을 적어도 한 그룹으로 클러스터링하는 단계, 상기 그룹별 대표 행의 인덱스를 결정하고, 상기 쿼리 벡터에서 상기 인덱스에 대응하는 행을 추출하여 서브 쿼리 벡터를 생성하는 단계, 상기 서브 쿼리 벡터와 상기 키 벡터를 이용하여 서브 어텐션 값을 산출하는 단계 및 상기 서브 어텐션 값을 구성하는 각 행을 상기 그룹별로 복사하여 어텐션 값(attention value)을 결정하는 단계를 포함하는 것을 특징으로 한다.
청구항
번호청구항
1

트랜스포머(Transformer)의 입력에 대한 쿼리(Query) 벡터 또는 키(Key) 벡터에 저계수 근사(low rank approximation)를 적용하는 단계;상기 쿼리 벡터와 키 벡터를 내적하여 근사 어텐션 스코어(attention score)를 산출하는 단계;상기 근사 어텐션 스코어를 구성하는 복수 행의 유사도에 기초하여 상기 복수 행을 적어도 한 그룹으로 클러스터링하는 단계;상기 그룹별 대표 행의 인덱스를 결정하고, 상기 쿼리 벡터에서 상기 인덱스에 대응하는 행을 추출하여 서브 쿼리 벡터를 생성하는 단계;상기 서브 쿼리 벡터와 상기 키 벡터를 이용하여 서브 어텐션 값을 산출하는 단계; 및상기 서브 어텐션 값을 구성하는 각 행을 상기 그룹별로 복사하여 어텐션 값(attention value)을 결정하는 단계를 포함하는트랜스포머의 어텐션 값 결정 방법.

2

제1항에 있어서,상기 저계수 근사를 적용하는 단계는상기 쿼리 벡터 또는 키 벡터에 대한 특이값 분해(Singular Value Decomposition; SVD)를 통해 상기 저계수 근사를 적용하는 단계를 포함하는트랜스포머의 어텐션 값 결정 방법.

3

제1항에 있어서,상기 클러스터링하는 단계는상기 복수 행 각각을 구성하는 요소들(elements) 간 유사도에 기초하여 상기 복수 행을 적어도 한 그룹으로 클러스터링하는 단계를 포함하는트랜스포머의 어텐션 값 결정 방법.

4

제1항에 있어서,상기 클러스터링하는 단계는상기 복수 행 각각과 미리 설정된 기준 행 간의 유사도에 기초하여 상기 복수 행을 상기 기준 행의 개수에 대응하는 그룹으로 클러스터링하는 단계를 포함하는트랜스포머의 어텐션 값 결정 방법.

5

제1항에 있어서,상기 그룹별 대표 행의 인덱스를 결정하는 단계는각 그룹의 중심(centroid)을 결정하는 단계와,상기 각 그룹에 포함된 복수 행 중 상기 중심에 가장 가까운 어느 한 행을 상기 대표 행으로 결정하는 단계를 포함하는트랜스포머의 어텐션 값 결정 방법.

6

제5항에 있어서,상기 각 그룹의 중심을 결정하는 단계는상기 그룹 내 복수의 행을 구성하는 요소들을 열 방향에 따라 평균하여 각 그룹의 중심을 결정하는 단계를 포함하는트랜스포머의 어텐션 값 결정 방법.

7

제1항에 있어서,상기 서브 어텐션 값을 산출하는 단계는상기 서브 쿼리 벡터와 상기 키 벡터를 내적하여 서브 어텐션 스코어를 산출하는 단계와,상기 서브 어텐션 스코어에 상기 트랜스포머의 입력에 대한 값(value) 벡터를 곱하여 상기 서브 어텐션 값을 산출하는 단계를 포함하는트랜스포머의 어텐션 값 결정 방법.

8

제1항에 있어서,상기 어텐션 값을 결정하는 단계는상기 서브 어텐션 값을 구성하는 각 행을 상기 각 행에 대응하는 그룹에 속한 복수 행의 위치에 복사하여 상기 어텐션 값을 결정하는 단계를 포함하는트랜스포머의 어텐션 값 결정 방법.