음성 데이터 처리 시스템 및 이의 동작 방법
System for voice data processing and method for operation thereof
특허 요약
음성 데이터 처리 시스템으로서, 아날로그의 음성 신호를 입력으로 받아, 디지털 음성 신호로 생성하는 아날로그 음성 처리부와, 디지털 음성 신호가 입력되면 IIR(Infinite Impulse Response) 필터로 동작하여 디지털 음성 신호를 필터링하고, RNN으로 동작하여 필터링 된 디지털 음성 신호로부터 음성 특징을 추출하는 특징 추출부를 포함한다.
청구항
번호청구항
1

음성 데이터 처리 시스템으로서,아날로그의 음성 신호를 입력으로 받아, 디지털 음성 신호로 생성하는 아날로그 음성 처리부, 그리고상기 디지털 음성 신호가 입력되면 IIR(Infinite Impulse Response) 필터로 동작하여 상기 디지털 음성 신호를 필터링하고, RNN으로 동작하여 필터링 된 디지털 음성 신호로부터 음성 특징을 추출하는 특징 추출부를 포함하는, 음성 데이터 처리 시스템.

2

제1항에 있어서,상기 특징 추출부는,상기 디지털 음성 신호를 IIR 필터로 필터링 한 값, 상기 필터링 된 디지털 음성 신호를 RNN 처리하여 추출한 상기 음성 특징을 저장하는 입출력 메모리, 그리고상기 디지털 음성 신호를 처리하기 위한 제1 IIR 계수, 제2 IIR 계수, 제1 RNN 가중치 그리고 제2 RNN 가중치가 저장되어 있는 가중치 및 계수 메모리를 포함하는, 음성 데이터 처리 시스템.

3

제2항에 있어서,상기 입출력 메모리는,상기 디지털 음성 신호와 상기 제1 IIR 계수를 곱셈 연산한 값을 상기 IIR 필터의 차수에 따라 누적한 제1 값으로 저장하는 IIR 입력 메모리,상기 제1 값을 상기 제2 IIR 계수로 곱셈 연산한 값을 상기 IIR 필터의 차수에 따라 누적한 제2 값과, 상기 제2 값을 기초로 획득된 제3 값을 제1 RNN 가중치와 곱셈 연산한 값을 상기 제1 RNN 가중치의 크기에 따라 누적하여 획득한 음성 특징을 저장하는 IIR 출력 메모리,상기 제2 값을 저장하는 RNN 입력 메모리, 그리고상기 제2 값을 상기 제2 RNN 가중치와 곱셈 연산한 값을 상기 제2 RNN 가중치의 크기에 따라 누적한 상기 제3 값을 저장하는 RNN 출력 메모리를 포함하는, 음성 데이터 처리 시스템

4

제3항에 있어서,상기 가중치 및 계수 메모리는,상기 제1 IIR 계수인 피드 포워드 계수가 저장된 제1 IIR 계수 메모리,상기 제2 IIR 계수인 피드백 계수가 저장된 제2 IIR 계수 메모리,상기 제1 RNN 가중치인 RNN h 가중치가 저장된 제1 RNN 가중치 메모리, 그리고상기 제2 RNN 가중치인 RNN x 가중치가 저장된 제2 RNN 가중치 메모리를 포함하는, 음성 데이터 처리 시스템.

5

제4항에 있어서,상기 특징 추출부는,상기 제2 값을 비선형 변환하는 비선형 변환부를 더 포함하고,상기 비선형 변환부는 비선형 함수로 구현되는, 음성 데이터 처리 시스템.

6

제2항에 있어서,상기 특징 추출부는,상기 가중치 및 계수 메모리, 상기 입출력 메모리, 그리고 상기 특징 추출부를 제어하는 제어 신호를 생성하는 컨트롤러를 더 포함하는, 음성 데이터 처리 시스템.

7

적어도 하나의 프로세서에 의해 동작하는 음성 데이터 처리 시스템의 동작 방법으로서,아날로그 음성 신호를 수신하면, 상기 아날로그 음성 신호를 디지털 음성 신호로 생성하는 단계, 그리고상기 디지털 음성 신호를 순환 구조를 가지는 IIR 필터를 통해 필터링하여 상기 디지털 음성 신호로부터 음성 특징을 추출하는 단계를 포함하는, 동작 방법.

8

제7항에 있어서,상기 음성 특징을 추출하는 단계는,상기 디지털 음성 신호와 제1 IIR 계수를 곱셈 연산하는 단계, 그리고상기 곱셈 연산한 결과를 상기 IIR 필터의 차수에 따라 누적하여 제1 값을 구하는 단계를 포함하는, 동작 방법.

9

제8항에 있어서,상기 제1 값을 구하는 단계 이후에,상기 제1 값과 제2 IIR 계수를 곱셈 연산하고, 상기 IIR 필터의 차수에 따라 누적하여 제2 값을 구하는 단계를 포함하는, 동작 방법.

10

제9항에 있어서,상기 제2 값을 구하는 단계 이후에,상기 제2 값을 RNN의 입력으로써 수신하고, 상기 제2 값을 제1 RNN 가중치와 곱셈 연산하고, 제1 RNN 가중치의 크기에 따라 누적하여 제3 값을 구하는 단계를 포함하는, 동작 방법.

11

제10항에 있어서,상기 제3 값을 구하는 단계 이후에,상기 제3 값을 비선형 함수에 적용하여 비선형 변환된 결과를 구하는 단계를 포함하는, 동작 방법.

12

제11항에 있어서,상기 비선형 변환된 결과를 구하는 단계 이후에,상기 비선형 변환된 결과와 제2 RNN 가중치를 곱셈 연산하고, 상기 제2 RNN 가중치의 크기에 따라 누적하여 상기 음성 특징을 출력하는 단계를 포함하는, 동작 방법.

13

제12항에 있어서,상기 제1 IIR 계수는 피드 포워드 계수이고, 상기 제2 IIR 계수는 피드백 계수이고, 상기 제1 RNN 가중치는 RNN x 가중치이며, 상기 제2 RNN 가중치는 RNN h 가중치인, 동작 방법.