가짜 동영상 탐지를 수행하는 방법 및 이를 위한 장치
METHOD AND APPARATUS FOR PERFORMING FAKE VIDEO DETECTION
특허 요약
본 명세서는 가짜 동영상 탐지를 수행하는 방법 및 이를 위한 장치를 제안한다. 구체적으로, 동영상의 제목 및 설명, 댓글과 상기 동영상에 기반하여 가짜 동영상 탐지를 수행하는 방법은, 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA)에 기반하여 상기 제목 및 설명의 주제 분포와 상기 댓글의 주제 분포를 결정하는 단계와, 젠슨-샤논 다이버전스(Jensen-Shannon Divergence)에 기반하여 상기 제목 및 설명의 주제 분포와 상기 댓글의 주제 분포 사이의 주제 차이를 결정하는 단계와, 상기 주제 차이에 기반하여 인코딩 비율을 결정하는 단계와, 상기 댓글의 인코딩 벡터와 상기 제목 및 설명의 인코딩 벡터를 상기 인코딩 비율로 결합한 제1 인코딩 벡터를 결정하는 단계와, 상기 제1 인코딩 벡터와 상기 제목 및 설명의 인코딩 벡터와 동영상의 인코딩 벡터를 결합한 제2 인코딩 벡터에 기반하여 동영상의 가짜 여부를 결정하는 단계와, 상기 제목 및 설명의 인코딩 벡터, 상기 댓글의 인코딩 벡터 및 동영상의 인코딩 벡터에 기반하여 상기 동영상의 주제를 결정하는 단계를 포함한다.
청구항
번호청구항
1

적어도 하나의 프로세서; 및상기 적어도 하나의 프로세서와 기능적으로 연결되고, 상기 적어도 하나의 프로세서에 의해 실행되는 것에 기반하여, 동작을 수행하는 명령어들을 저장하는 적어도 하나의 메모리를 포함하는 가짜 동영상 탐지 장치가 동영상의 제목 및 설명, 댓글과 상기 동영상에 기반하여 가짜 동영상 탐지를 수행하는 방법에 있어서, 상기 가짜 동영상 탐지 장치가 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA)에 기반하여 상기 제목 및 설명의 주제 분포와 상기 댓글의 주제 분포를 결정하는 단계;상기 가짜 동영상 탐지 장치가 상기 가짜 동영상 탐지 장치가 젠슨-샤논 다이버전스(Jensen-Shannon Divergence)에 기반하여 상기 제목 및 설명의 주제 분포와 상기 댓글의 주제 분포 사이의 주제 차이를 결정하는 단계;상기 가짜 동영상 탐지 장치가 상기 주제 차이에 기반하여 인코딩 비율을 결정하는 단계;상기 가짜 동영상 탐지 장치가 상기 댓글의 인코딩 벡터(H)와 상기 제목 및 설명의 인코딩 벡터(R)를 상기 인코딩 비율로 결합한 제1 인코딩 벡터를 결정하는 단계;상기 가짜 동영상 탐지 장치가 상기 제1 인코딩 벡터와, 상기 제목 및 설명의 인코딩 벡터(R)와 동영상의 인코딩 벡터(V)를 자세 차이 추정을 이용하여 결합한 제2 인코딩 벡터를 결정하는 단계;상기 가짜 동영상 탐지 장치가 상기 제1 인코딩 벡터와 상기 제2 인코딩 벡터를 입력받아 다층 퍼셉트론(multi-layer perceptron)에 기반하여 동영상의 가짜 여부를 결정하는 단계; 및상기 제목 및 설명의 인코딩 벡터(R), 상기 댓글의 인코딩 벡터(H) 및 동영상의 인코딩 벡터(V)에 기반하여 상기 동영상의 주제를 결정하는 단계를 포함하는 방법.

2

제1항에 있어서, 상기 주제 차이가 클수록 상기 댓글의 인코딩 비율이 증가하고, 상기 주제 차이가 작을수록 상기 댓글의 인코딩 비율이 감소하는 방법.

3

제1항에 있어서, 상기 가짜 동영상 탐지는 적대적 신경망(Adversarial Neural Network)에 기반하여 학습되는 방법.

4

삭제

5

제1항에 있어서, 상기 동영상의 주제 결정은 기울기 반전 층(Gradient Reversal Layer)과 상기 다층 퍼셉트론에 기반하여 수행되는 방법.

6

제5항에 있어서, 상기 가짜 동영상 탐지는 아래 수학식에 기반하여 학습되며,여기서, 는 상기 가짜 동영상 탐지의 전제 손실함수를 나타내고, 는 상기 가짜 여부 결정과 관련된 손실함수를 나타내며, 는 상기 주제 결정과 관련된 손실함수를 나타내고, 는 1로 설정되는 방법.

7

제1항에 있어서, 상기 댓글의 인코딩 벡터는 상기 동영상에 대한 댓글들 각각의 인코딩 벡터를 각 댓글의 '좋아요'수에 의해 가중합하여 생성되는 방법.

8

제1항에 있어서, 주제 분포는 기 정의된 K개의 주제에 대한 확률 분포인 방법.

9

동영상의 제목 및 설명, 댓글과 상기 동영상에 기반하여 가짜 동영상 탐지를 수행하는 장치에 있어서, 적어도 하나의 프로세서; 및상기 적어도 하나의 프로세서와 기능적으로 연결되고, 상기 적어도 하나의 프로세서에 의해 실행되는 것에 기반하여, 동작을 수행하는 명령어들을 저장하는 적어도 하나의 메모리를 포함하고,상기 동작은,잠재 디리클레 할당(Latent Dirichlet Allocation, LDA)에 기반하여 상기 제목 및 설명의 주제 분포와 상기 댓글의 주제 분포를 결정하는 단계;젠슨-샤논 다이버전스(Jensen-Shannon Divergence)에 기반하여 상기 제목 및 설명의 주제 분포와 상기 댓글의 주제 분포 사이의 주제 차이를 결정하는 단계;상기 주제 차이에 기반하여 인코딩 비율을 결정하는 단계;상기 댓글의 인코딩 벡터(H)와 상기 제목 및 설명의 인코딩 벡터(R)를 상기 인코딩 비율로 결합한 제1 인코딩 벡터를 결정하는 단계;상기 제1 인코딩 벡터와, 상기 제목 및 설명의 인코딩 벡터(R)와 동영상의 인코딩 벡터(V)를 자세 차이 추정을 이용하여 결합한 제2 인코딩 벡터를 결정하는 단계;상기 제1 인코딩 벡터와 상기 제2 인코딩 벡터를 입력받아 다층 퍼셉트론(multi-layer perceptron)에 기반하여 동영상의 가짜 여부를 결정하는 단계; 및상기 제목 및 설명의 인코딩 벡터(R), 상기 댓글의 인코딩 벡터(H) 및 동영상의 인코딩 벡터(V)에 기반하여 상기 동영상의 주제를 결정하는 단계를 포함하는 장치.

10

제9항에 있어서, 상기 주제 차이가 클수록 상기 댓글의 인코딩 비율이 증가하고, 상기 주제 차이가 작을수록 상기 댓글의 인코딩 비율이 감소하는 장치.

11

제9항에 있어서, 상기 가짜 동영상 탐지는 적대적 신경망(Adversarial Neural Network)에 기반하여 학습되는 장치.

12

삭제

13

제9항에 있어서, 상기 동영상의 주제 결정은 기울기 반전 층(Gradient Reversal Layer)과 상기 다층 퍼셉트론에 기반하여 수행되는 장치.

14

제13항에 있어서, 상기 가짜 동영상 탐지는 아래 수학식에 기반하여 학습되며,여기서, 는 상기 가짜 동영상 탐지의 전제 손실함수를 나타내고, 는 상기 가짜 여부 결정과 관련된 손실함수를 나타내며, 는 상기 주제 결정과 관련된 손실함수를 나타내고, 는 1로 설정되는 장치.

15

제9항에 있어서, 상기 댓글의 인코딩 벡터는 상기 동영상에 대한 댓글들 각각의 인코딩 벡터를 각 댓글의 '좋아요'수에 의해 가중합하여 생성되는 장치.

16

제9항에 있어서, 주제 분포는 기 정의된 K개의 주제에 대한 확률 분포인 장치.