摘要 |
1. Способ распознавания речи, включающий: ! прием кадров, содержащих выборки аудиосигнала; ! формирование вектора признаков, содержащего первое число компонентов вектора, для каждого кадра; ! проецирование вектора признаков по меньшей мере на два подпространства так, что число компонент каждого проецированного вектора признаков меньше, чем первое число, а общее число компонент проецированного вектора признаков равно первому числу; ! установление для каждого проецированного вектора набора моделей смешивания, который обеспечивает наивысшую вероятность наблюдения; ! анализ набора моделей смешивания для определения результата распознавания; ! определение меры достоверности для результата распознавания, когда результат распознавания найден, причем это определение включает: ! определение вероятности того, что результат распознавания корректен; ! определение нормализующего члена путем выбора для каждого состояния среди указанного набора моделей смешивания одной модели смешивания, которая обеспечивает наивысшее правдоподобие; и ! деление этой вероятности на указанный нормализующий член; ! при этом способ также включает сравнение меры достоверности с пороговым значением для определения того, достаточно ли надежен результат распознавания. ! 2. Способ по п.1, в котором меру достоверности вычисляют с помощью следующего уравнения: ! ! где О - вектор признаков указанного акустического сигнала; ! sl - конкретный фрагмент речи из указанного акустического сигнала; ! p(O|s1) - акустическое правдоподобие указанного конкретного фрагмента речи s1; ! p(s1) - априорная вероятность указанного конкретного фрагмента речи; ! Ok - проекция в� |