摘要 |
Un procedimiento para crear plantillas de voz, para su empleo en un sistema de reconocimiento de voz independiente de la persona que habla, comprendiendo el procedimiento: segmentar cada emisión vocal de una primera pluralidad de emisiones vocales, a fin de generar una pluralidad de segmentos agrupados temporalmente para cada emisión vocal, estando cada segmento agrupado temporalmente representado por una media espectral; cuantizar la pluralidad de medias espectrales para todas las emisiones vocales de la primera pluralidad, a fin de generar una pluralidad de vectores de plantilla; comparar cada uno de los vectores de plantilla de la pluralidad con una segunda pluralidad de emisiones vocales, a fin de generar al menos un resultado de comparación; aparear la primera pluralidad de emisiones vocales con la pluralidad de vectores de plantilla si el resultado, o resultados, de comparación supera(n) al menos un valor de umbral predefinido, a fin de generar un resultado de camino óptimo de apareo;repartir la primera pluralidad de emisiones vocales en el tiempo, según el resultado del camino óptimo de apareo; y repetir la cuantización, comparación, apareo y partición hasta que el resultado, o resultados, de la comparación no supere(n) ningún valor, o valores, de umbral predefinido(s). |