실시간 음성 활동 검출 장치 및 검출 방법
APPARATUS AND METHOD FOR DETECTING VOICE ACTIVITY IN REAL-TIME
특허 요약
본 발명의 일실시에 따른 실시간 음성 활동 검출 장치(100)는 음향신호를 입력받는 하나 이상의 마이크로폰 및 마이크로폰으로 입력되는 아날로그 음향신호를 디지털 음향신호로 변환하는 변환기를 포함하는 음향신호 획득부(110), 이중 포트 메모리를 이용하여 음향신호 획득부(110)의 디지털 음향신호를 버퍼링하는 음향신호 버퍼링부(120), 음향신호 버퍼링부(120)에 저장된 음향신호에서 음향 프레임 단위로 주기적 특징이 존재하는지 여부를 연산하는 주기성 연산부(130), 및 주기성 연산부(130)의 연산 결과에 따라 음성 검출 신호를 출력하는 음성 검출 출력부(150)를 포함한다.
청구항
번호청구항
14

제13항에 있어서,상기 S4 단계는상기 S3 단계에서 연산된 값과 상기 S5 단계에서 연산된 값의 곱이 기준값 이상인 경우에 플래그(flag)를 1로 설정하고, 연속하는 10개의 음향 프레임에서 연속으로 플래그가 1로 설정된 경우 음성 검출 신호가 출력되는 것을 특징으로 하는 실시간 음성 활동 검출 방법.

1

음성 활동 검출 장치에 있어서,음향신호를 입력받는 하나 이상의 마이크로폰 및 상기 마이크로폰으로 입력되는 아날로그 음향신호를 디지털 음향신호로 변환하는 변환기를 포함하는 음향신호 획득부;이중 포트 메모리를 이용하여 상기 음향신호 획득부의 디지털 음향신호를 버퍼링하는 음향신호 버퍼링부;상기 음향신호 버퍼링부에 저장된 음향신호에서 음향 프레임 단위로 주기적 특징이 존재하는지 여부를 연산하는 주기성 연산부;상기 주기성 연산부의 연산 결과에 따라 음성 검출 신호를 출력하는 음성 검출 출력부; 및상기 음향신호 버퍼링부에서 저장된 음향신호를 상기 음성 검출 출력부의 출력 신호와 싱크를 맞추어 출력하기 위해 기준시간 지연 저장하는 샘플 지연 저장부를 포함하는 것을 특징으로 하는 실시간 음성 활동 검출 장치.

2

제1항에 있어서,상기 음향신호 버퍼링부는 복수(N) 개의 이중 포트 메모리를 포함하고, 상기 이중 포트 메모리는 원형큐 구조를 갖는 것을 특징으로 하는 실시간 음성 활동 검출 장치.

3

제1항에 있어서,상기 음향신호 버퍼링부는 상기 음향신호의 샘플이 순차적으로 저장되는 N개의 이중 포트 메모리;상기 이중 포트 메모리의 같은 행에 N개의 샘플이 저장되면 전체 N개의 샘플을 더한 후 N으로 나누어 직류 성분 산출하는 직류 성분 산출기; 및상기 이중 포트 메모리에 저장된 음향신호의 샘플에서 상기 직류 성분을 제거하는 직류 성분 제거기를 포함하는 것을 특징으로 하는 실시간 음성 활동 검출 장치.

4

제1항에 있어서,상기 주기성 연산부는상기 음향신호 버퍼링부에 저장된 음향신호에서 고주파 잡음을 제거하기 위한 저주파 필터;상기 저주파 필터에서 고주파 잡음이 제거된 음향 신호를 하나의 음향 프레임 단위로 저장하는 복수 개의 레지스터; 및상기 복수 개의 레지스터에 대해 동시에 주기적 특징이 존재하는지 여부를 확인하기 위한 연산을 수행하는 주기적 특징 확인부를 포함하되,상기 레지스터는 동일한 음향 프레임의 음향신호가 저장되고, 각 레지스터가 복수(k) 개의 쌍을 이루어 상기 주기적 특징 확인부에서 주기적 특징 여부가 확인되는 것을 특징으로 하는 실시간 음성 활동 검출 장치.(여기서 k는 "음향 프레임의 크기 - 1"인 값임)

5

제4항에 있어서,상기 주기적 특징 확인부는상기 레지스터에 저장된 음향신호의 샘플에 대해 아래의 식으로 주기적 특징 여부를 확인하는 것으로, k 개의 레지스터 쌍에서 τ를 각각 1부터 k로 설정하여 동시에 병렬 처리하는 것을 특징으로 하는 것을 특징으로 하는 실시간 음성 활동 검출 장치.(여기서, 이고, dt(τ)는 t 번째 프레임의 difference fucntion, W는 프레임의 크기, xn은 n번째 개별 샘플, τ는 프레임 내 심플 간의 간격임)

6

제1항에 있어서,상기 실시간 음성 활동 검출 장치는상기 음향신호 버퍼링부에 저장된 음향신호의 음향 프레임 단위별로 에너지 평균값을 연산하는 에너지 연산부를 더 포함하는 것을 특징으로 하는 실시간 음성 활동 검출 장치.

7

제6항에 있어서,상기 음성 검출 출력부는상기 주기성 연산부에서 연산된 값과 상기 에너지 연산부에서 연산된 값의 곱이 기준값 이상인 경우에 플래그(flag)를 1로 설정하고, 연속하는 10개의 음향 프레임에서 연속으로 플래그가 1로 설정된 경우 음성 검출 신호를 출력하는 것을 특징으로 하는 실시간 음성 활동 검출 장치.

8

음성 활동 검출 방법에 있어서,외부 음향신호가 디지털 음향신호로 변환되는 S1 단계;상기 S1 단계에서 변환된 디지털 음향신호가 버퍼링을 위한 이중 포트 메모리에 저장되는 S2 단계;상기 S2 단계의 이중 포트 메모리에 저장된 음향신호의 음향 프레임에 주기적 특징이 존재하는지 여부가 연산되는 S3 단계;상기 S3 단계의 연산결과에 따라 음성 검출 신호가 출력되는 S4 단계를 포함하되,상기 S2 단계의 이중 포트 메모리는 복수 개이고, 원형큐 구조를 갖는 것을 특징으로 하는 실시간 음성 활동 검출 방법.

9

삭제

10

제8항에 있어서,상기 S2 단계는상기 음향신호의 샘플이 N개의 이중 포트 메모리에 순차적으로 저장되는 S2-1 단계;상기 이중 포트 메모리의 같은 행에 N개의 샘플이 저장되면 전체 N개의 샘플을 더한 후 N으로 나누어 직류 성분이 산출되는 S2-2 단계; 및상기 이중 포트 메모리에 저장된 음향신호의 샘플에서 상기 직류 성분이 제거되는 S2-3 단계를 포함하는 것을 특징으로 하는 실시간 음성 활동 검출 방법.

11

제8항에 있어서,상기 S3 단계는상기 S2 단계의 이중 포트 메모리에 저장된 음향신호에서 고주파 잡음이 제거되는 S3-1 단계;상기 S3-1 단계에서 고주파 잡음이 제고된 음향신호가 음향 프레임 단위로 복수 개의 레지스터에 저장되는 S3-2 단계; 및상기 S3-2 단계의 복수 개의 레지스터에서 동시에 주기적 특징이 존재하는지 여부를 확인하기 위한 연산이 수행되는 S3-3 단계를 포함하되,상기 상기 레지스터는 동일한 음향 프레임의 음향신호가 저장되고, 각 레지스터가 복수(k) 개의 쌍을 이루어 상기 S3-3 단계에서 주기적 특징 여부가 확인되는 것을 특징으로 하는 실시간 음성 활동 검출 방법.

12

제11항에 있어서,상기 S3-3 단계는상기 레지스터에 저장된 음향신호의 샘플에 대해 아래의 식으로 주기적 특징 여부가 확인되는 것으로, k 개의 레지스터 쌍에서 τ를 각각 1부터 k로 설정하여 동시에 병렬 처리하는 것을 특징으로 하는 실시간 음성 활동 검출 방법.(여기서, 이고, dt(τ)는 t 번째 프레임의 difference fucntion, W는 프레임의 크기, xn은 n번째 개별 샘플, τ는 프레임 내 심플 간의 간격임)

13

제8항에 있어서,상기 실시간 음성 활동 검출 방법은 상기 S2 단계에서 저장된 음향신호의 음향 프레임 단위별로 에너지 평균값이 연산되는 S5 단계를 더 포함하는 것을 특징으로 하는 실시간 음성 활동 검출 방법.