摘要 |
<p>Полезная модель относится к области речевых технологий, модель формирует звуковой поток и может использоваться для анализа, синтеза и распознавания речи, а также оценки качества вокодеров и каналов связи. Задачей, на решение которой направлена полезная модель, является создание статистической модели речи, объединяющей в себе элементы синтезатора речи, статистические данные и корпуса речевых данных большого объема. Технический результат достигается за счет того, что в статическую модель речи, включающую интерфейсный блок, блок выбора диктора, содержащий генератор выбора диктора, блок выбора звуков, формирующего выборки звуков, которые в блоке формирования речевого потока преобразуются в звуковые сигналы с заданными свойствами и базу данных, содержащую описания типовых дикторов и другие необходимые сведения, внесены изменения, а именно:</p>
<p>- в блок выбора диктора дополнительно введен модуль статистики параметров населения различных регионов, выход которого соединен с входом генератора выбора дикторов;</p>
<p>- введены дополнительные блоки: выборки типовых дикторов и хранения просодик выбранных звуков или цепочек звуков;</p>
<p>- в блок выбора звука дополнительно введены два модуля: правила следования звуков и правила наименования аллофонов.</p>
<p>Кроме того, внесены изменения в структуру некоторых блоков. Полезная модель обладает рядом преимуществ, к которым можно отнести следующее:</p>
<p>- больший объем исходного речевого корпуса;</p>
<p>- включение в базу дополнительной статистической информации по каждому ТД;</p>
<p>- наличие описаний интонационных контуров для каждого ТД;</p>
<p>- возможность одновременной работы со структурными элементами разного размера и формата и ряд других.</p>
<p>Кроме того, статистическая модель речи не зависит от языка, т.к. все алгоритмы и интерфейсы ее сохранятся. В настоящее время предлагаемая статистическая модель проходит проверку применением в системе синтеза речи по тексту и в системе объективной оценки качества вокодеров.</p> |