| 번호 | 청구항 |
|---|---|
| 1 | 적대적 음성 예제 감지 시스템에 의해 수행되는 적대적 음성 예제를 감지하는 방법에 있어서,a) 주파수 기반의 특징 추출 방법을 기초로 입력 받은 오디오 데이터의 제1 특징 데이터를 추출하는 단계;b) 잠재 공간(latent space) 기반의 특징 추출 방법을 기초로 상기 오디오 데이터의 제2 특징 데이터를 추출하는 단계; 및c) 상기 제1 특징 데이터를 상기 적대적 음성 예제 감지 시스템의 제1 분류 함수에 입력하여 제1 확률값을 산출하고, 상기 제2 특징 데이터를 상기 적대적 음성 예제 감지 시스템의 제2 분류 함수에 입력하여 제2 확률값을 산출하며, 상기 제1 및 제2 확률값을 이용하여 상기 오디오 데이터가 원본인지 적대적 음성 예제인지 판단하는 단계를 포함하는, 적대적 음성 예제 감지 방법. |
| 2 | 제1항에 있어서,상기 제1 확률값은, 상기 제1 특징 데이터가 기설정된 카테고리들 중 어느 카테고리에 속하는지를 나타내는 확률값이고,상기 제2 확률값은 상기 제2 특징 데이터가 기설정된 카테고리들 중 어느 카테고리에 속하는지를 나타내는 확률값인, 적대적 음성 예제 감지 방법. |
| 3 | 제1항에 있어서,상기 주파수 기반의 특징 추출 방법은 Mel-spectrogram에 기초한 특징 추출 방법인, 적대적 음성 예제 감지 방법. |
| 4 | 제1항에 있어서,상기 잠재 공간 기반의 특징 추출 방법은 Wav2vec에 기초한 특징 추출 방법인, 적대적 음성 예제 감지 방법. |
| 5 | 제1항에 있어서,상기 c) 단계는, 상기 제1 확률값과 상기 제2 확률값의 차이가 기설정된 임계값 이상인 경우에 상기 입력된 오디오 데이터를 적대적 음성 예제로 판단하고, 상기 제1 확률값과 상기 제2 확률값의 차이가 기설정된 임계값 미만인 경우에 상기 오디오 데이터를 원본으로 판단하는 단계를 포함하는, 적대적 음성 예제 감지 방법. |
| 6 | 통신 모듈;적어도 하나의 프로세서; 및상기 프로세서와 전기적으로 연결되고, 상기 프로세서에서 수행되는 적어도 하나의 코드(code)가 저장되는 메모리를 포함하고,상기 메모리는 상기 프로세서를 통해 실행될 때 상기 프로세서가,주파수 기반의 특징 추출 방법을 기초로 입력 받은 오디오 데이터의 제1 특징 데이터를 추출하고, 잠재 공간 기반의 특징 추출 방법을 기초로 상기 오디오 데이터의 제2 특징 데이터를 추출하며, 상기 제1 특징 데이터를 제1 분류 함수에 입력하여 제1 확률값을 산출하고 상기 제2 특징 데이터를 제2 분류 함수에 입력하여 제2 확률값을 산출하며, 상기 제1 및 제2 확률값을 이용하여 상기 오디오 데이터가 원본인지 적대적 음성 예제인지 판단하도록 야기하는 코드를 저장하는, 적대적 음성 예제 감지 시스템. |
| 7 | 제6항에 있어서,상기 제1 확률값은, 상기 제1 특징 데이터가 기설정된 카테고리들 중 어느 카테고리에 속하는지를 나타내는 확률값이고,상기 제2 확률값은 상기 제2 특징 데이터가 기설정된 카테고리들 중 어느 카테고리에 속하는지를 나타내는 확률값인, 적대적 음성 예제 감지 시스템. |
| 8 | 제6항에 있어서,상기 주파수 기반의 특징 추출 방법은 Mel-spectrogram에 기초한 특징 추출 방법인, 적대적 음성 예제 감지 시스템. |
| 9 | 제6항에 있어서,상기 잠재 공간 기반의 특징 추출 방법은 Wav2vec에 기초한 특징 추출 방법인, 적대적 음성 예제 감지 시스템. |
| 10 | 제6항에 있어서,상기 메모리는 상기 프로세서로 하여금, 상기 제1 확률값과 상기 제2 확률값의 차이가 기설정된 임계값 이상인 경우에 상기 입력된 음성을 적대적 음성 예제로 판단하고, 상기 제1 확률값과 상기 제2 확률값의 차이가 기설정된 임계값 미만인 경우에 상기 오디오 데이터를 원본으로 판단하도록 야기하는 코드가 저장되는, 적대적 음성 예제 감지 시스템. |