| 번호 | 청구항 |
|---|---|
| 1 | 사전 설정된 복수의 훈련 문장들 각각이 음성으로 발음되었을 때, 상기 복수의 훈련 문장들에 포함된 복수의 음소들 각각이 발음되는데 소요되는 평균 발음 소요 시간에 대한 측정값이 저장되어 있는 발음 소요 시간 정보 저장부;상기 복수의 훈련 문장들 각각이 음성으로 발음되었을 때, 음성이 존재하지 않는 묵음 구간 간의 평균 간격 시간에 대한 측정값이 저장되어 있는 묵음 시간 정보 저장부;상기 복수의 훈련 문장들에 포함된 복수의 어절들과, 상기 복수의 훈련 문장들 각각이 음성으로 발음되었을 때, 상기 복수의 어절들 각각이 발음된 직후에 묵음 구간이 등장한 비율에 대한 측정값이 서로 대응되어 저장되어 있는 비율 저장부;사용자에 의해 제1 문장에 대한 텍스트 음성 변환(Text to Speech: TTS) 명령이 인가되면, 상기 제1 문장으로부터 상기 제1 문장을 구성하는 복수의 제1 음소들과 상기 제1 문장을 구성하는 복수의 제1 어절들을 추출하는 정보 추출부;상기 발음 소요 시간 정보 저장부를 참조하여 상기 복수의 제1 음소들 각각에 대응되는 평균 발음 소요 시간에 대한 측정값을 확인한 후 상기 복수의 제1 어절들 각각에 대해, 각 어절에 포함된 음소들의 평균 발음 소요 시간에 대한 측정값을 합산하여 합산 값을 생성함으로써, 상기 복수의 제1 어절들 각각에 대해서 생성된 합산 값을 상기 복수의 제1 어절들 각각에 대응되는 어절 발음 시간으로 지정하는 지정부;상기 묵음 시간 정보 저장부를 참조하여 상기 평균 간격 시간에 대한 측정값을 확인하고, 상기 비율 저장부를 참조하여 상기 복수의 제1 어절들 각각에 대응되는 비율에 대한 측정값을 확인하며, 상기 복수의 제1 어절들 각각에 대응되는 어절 발음 시간을 기초로 상기 복수의 제1 어절들 간의 발음 지속 시간을 연산한 후 상기 평균 간격 시간과 상기 복수의 제1 어절들 각각에 대응되는 비율 및 상기 복수의 제1 어절들 간의 발음 지속 시간을 기초로 상기 제1 문장에서 묵음 구간을 갖는 것으로 예측되는 적어도 하나의 제2 어절을 선택하는 어절 선택부;상기 적어도 하나의 제2 어절이 선택되면, 상기 제1 문장에서 상기 적어도 하나의 제2 어절이 끝나는 지점에 사전 설정된 묵음 기호를 삽입하는 묵음 기호 삽입부; 및사전 설정된 음성 합성 모델을 기초로 상기 제1 문장에 대한 합성 음성을 생성하되, 상기 제1 문장에서 상기 묵음 기호가 삽입된 지점에 대해 사전 설정된 묵음 시간만큼에 대응되는 묵음 구간이 포함된 상기 합성 음성을 생성하는 음성 합성부를 포함하고,상기 어절 선택부는하기의 (a) 내지 (e) 과정을 반복 수행함으로써, (d) 과정을 통해서 하나씩 선택되는 어절을 상기 제1 문장에서 묵음 구간을 갖는 것으로 예측되는 상기 적어도 하나의 제2 어절로 선택하는 것을 특징으로 하는 문장에 대한 띄어읽기 처리를 수행하는 음성 합성 장치.(a) 상기 복수의 제1 어절들 중 상기 제1 문장에서의 위치가 첫 번째인 어절을 기준 어절로 결정(b) 상기 복수의 제1 어절들 중 상기 제1 문장에서의 위치가 상기 기준 어절 이후인 나머지 어절들을 확인(c) 상기 기준 어절에 대응되는 어절 발음 시간을 상기 기준 어절에 대응되는 발음 지속 시간으로 지정하고, 상기 나머지 어절들 각각에 대해, 상기 제1 문장에서 상기 기준 어절로부터 상기 나머지 어절들 각각까지의 어절 발음 시간의 누적 합계를 연산한 후, 상기 나머지 어절들 각각에 대해서 연산된 누적 합계를 상기 나머지 어절들 각각에 대응되는 발음 지속 시간으로 지정(d) 상기 기준 어절과 상기 나머지 어절들 각각의 발음 지속 시간이 상기 평균 간격 시간에 근접한지 여부 및 상기 기준 어절과 상기 나머지 어절들 각각에 대응되는 비율의 크기에 기초하여, 상기 기준 어절과 상기 나머지 어절들 중 상기 제1 문장에서 묵음 구간을 갖는 것으로 예측되는 어느 하나의 어절을 선택(e) 상기 복수의 제1 어절들 중 상기 제1 문장에서의 위치가 상기 (d) 과정에서 선택된 어절의 바로 다음인 어절이 상기 (a) 과정에서의 상기 기준 어절로 결정되도록 처리 |
| 2 | 삭제 |
| 3 | 제1항에 있어서,상기 어절 선택부는상기 (d) 과정에서 상기 기준 어절과 상기 나머지 어절들 각각에 대해 하기의 수학식 1의 연산에 따른 연산 값을 산출한 후 상기 기준 어절과 상기 나머지 어절들 중 상기 연산 값이 최소인 어절을 상기 제1 문장에서 묵음 구간을 갖는 것으로 예측되는 어느 하나의 어절로 선택하는 것을 특징으로 하는 문장에 대한 띄어읽기 처리를 수행하는 음성 합성 장치.[수학식 1]여기서, Xi는 상기 기준 어절과 상기 나머지 어절들 중 i번째 어절에 대한 상기 연산 값으로, Ii는 상기 기준 어절과 상기 나머지 어절들 중 i번째 어절에 대응되는 발음 지속 시간, T는 상기 평균 간격 시간, Pi는 상기 기준 어절과 상기 나머지 어절들 중 i번째 어절에 대응되는 비율, a는 사전 설정된 비율 조절 상수로서 양의 실수 값임. |
| 4 | 사전 설정된 복수의 훈련 문장들 각각이 음성으로 발음되었을 때, 상기 복수의 훈련 문장들에 포함된 복수의 음소들 각각이 발음되는데 소요되는 평균 발음 소요 시간에 대한 측정값이 저장되어 있는 발음 소요 시간 정보 저장부를 유지하는 단계;상기 복수의 훈련 문장들 각각이 음성으로 발음되었을 때, 음성이 존재하지 않는 묵음 구간 간의 평균 간격 시간에 대한 측정값이 저장되어 있는 묵음 시간 정보 저장부를 유지하는 단계;상기 복수의 훈련 문장들에 포함된 복수의 어절들과, 상기 복수의 훈련 문장들 각각이 음성으로 발음되었을 때, 상기 복수의 어절들 각각이 발음된 직후에 묵음 구간이 등장한 비율에 대한 측정값이 서로 대응되어 저장되어 있는 비율 저장부를 유지하는 단계;사용자에 의해 제1 문장에 대한 텍스트 음성 변환(Text to Speech: TTS) 명령이 인가되면, 상기 제1 문장으로부터 상기 제1 문장을 구성하는 복수의 제1 음소들과 상기 제1 문장을 구성하는 복수의 제1 어절들을 추출하는 단계;상기 발음 소요 시간 정보 저장부를 참조하여 상기 복수의 제1 음소들 각각에 대응되는 평균 발음 소요 시간에 대한 측정값을 확인한 후 상기 복수의 제1 어절들 각각에 대해, 각 어절에 포함된 음소들의 평균 발음 소요 시간에 대한 측정값을 합산하여 합산 값을 생성함으로써, 상기 복수의 제1 어절들 각각에 대해서 생성된 합산 값을 상기 복수의 제1 어절들 각각에 대응되는 어절 발음 시간으로 지정하는 단계;상기 묵음 시간 정보 저장부를 참조하여 상기 평균 간격 시간에 대한 측정값을 확인하고, 상기 비율 저장부를 참조하여 상기 복수의 제1 어절들 각각에 대응되는 비율에 대한 측정값을 확인하며, 상기 복수의 제1 어절들 각각에 대응되는 어절 발음 시간을 기초로 상기 복수의 제1 어절들 간의 발음 지속 시간을 연산한 후 상기 평균 간격 시간과 상기 복수의 제1 어절들 각각에 대응되는 비율 및 상기 복수의 제1 어절들 간의 발음 지속 시간을 기초로 상기 제1 문장에서 묵음 구간을 갖는 것으로 예측되는 적어도 하나의 제2 어절을 선택하는 단계;상기 적어도 하나의 제2 어절이 선택되면, 상기 제1 문장에서 상기 적어도 하나의 제2 어절이 끝나는 지점에 사전 설정된 묵음 기호를 삽입하는 단계; 및사전 설정된 음성 합성 모델을 기초로 상기 제1 문장에 대한 합성 음성을 생성하되, 상기 제1 문장에서 상기 묵음 기호가 삽입된 지점에 대해 사전 설정된 묵음 시간만큼에 대응되는 묵음 구간이 포함된 상기 합성 음성을 생성하는 단계를 포함하고,상기 적어도 하나의 제2 어절을 선택하는 단계는하기의 (a) 내지 (e) 과정을 반복 수행함으로써, (d) 과정을 통해서 하나씩 선택되는 어절을 상기 제1 문장에서 묵음 구간을 갖는 것으로 예측되는 상기 적어도 하나의 제2 어절로 선택하는 것을 특징으로 하는 문장에 대한 띄어읽기 처리를 수행하는 음성 합성 장치의 동작 방법.(a) 상기 복수의 제1 어절들 중 상기 제1 문장에서의 위치가 첫 번째인 어절을 기준 어절로 결정(b) 상기 복수의 제1 어절들 중 상기 제1 문장에서의 위치가 상기 기준 어절 이후인 나머지 어절들을 확인(c) 상기 기준 어절에 대응되는 어절 발음 시간을 상기 기준 어절에 대응되는 발음 지속 시간으로 지정하고, 상기 나머지 어절들 각각에 대해, 상기 제1 문장에서 상기 기준 어절로부터 상기 나머지 어절들 각각까지의 어절 발음 시간의 누적 합계를 연산한 후, 상기 나머지 어절들 각각에 대해서 연산된 누적 합계를 상기 나머지 어절들 각각에 대응되는 발음 지속 시간으로 지정(d) 상기 기준 어절과 상기 나머지 어절들 각각의 발음 지속 시간이 상기 평균 간격 시간에 근접한지 여부 및 상기 기준 어절과 상기 나머지 어절들 각각에 대응되는 비율의 크기에 기초하여, 상기 기준 어절과 상기 나머지 어절들 중 상기 제1 문장에서 묵음 구간을 갖는 것으로 예측되는 어느 하나의 어절을 선택(e) 상기 복수의 제1 어절들 중 상기 제1 문장에서의 위치가 상기 (d) 과정에서 선택된 어절의 바로 다음인 어절이 상기 (a) 과정에서의 상기 기준 어절로 결정되도록 처리 |
| 5 | 삭제 |
| 6 | 제4항에 있어서,상기 적어도 하나의 제2 어절을 선택하는 단계는상기 (d) 과정에서 상기 기준 어절과 상기 나머지 어절들 각각에 대해 하기의 수학식 1의 연산에 따른 연산 값을 산출한 후 상기 기준 어절과 상기 나머지 어절들 중 상기 연산 값이 최소인 어절을 상기 제1 문장에서 묵음 구간을 갖는 것으로 예측되는 어느 하나의 어절로 선택하는 것을 특징으로 하는 문장에 대한 띄어읽기 처리를 수행하는 음성 합성 장치의 동작 방법.[수학식 1]여기서, Xi는 상기 기준 어절과 상기 나머지 어절들 중 i번째 어절에 대한 상기 연산 값으로, Ii는 상기 기준 어절과 상기 나머지 어절들 중 i번째 어절에 대응되는 발음 지속 시간, T는 상기 평균 간격 시간, Pi는 상기 기준 어절과 상기 나머지 어절들 중 i번째 어절에 대응되는 비율, a는 사전 설정된 비율 조절 상수로서 양의 실수 값임. |
| 7 | 제4항 또는 제6항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 컴퓨터 프로그램을 기록한 컴퓨터 판독 가능 기록 매체. |
| 8 | 제4항 또는 제6항 중 어느 한 항의 방법을 컴퓨터와의 결합을 통해 실행시키기 위한 저장매체에 저장된 컴퓨터 프로그램. |