发明名称 |
PROCEDIMIENTO DE DETECCION DE SEGMENTOS DE VOZ |
摘要 |
La presente solicitud se refiere a un procedimiento de deteccion de segmentos de voz y de ruido en una senal digital de audio de entrada, estando dividida dicha senal de entrada en una pluralidad de tramas que comprende: una primera etapa (10) en la que se realiza una primera clasificacion de una trama como ruido si el valor medio de la energía para esta trama y las N tramas anteriores no es superior a un primer umbral de energía, N>1; una segunda etapa (20) en la que para cada trama que no ha sido clasificada como ruido en la primera etapa se decide si dicha trama se clasifica como ruido o como voz basándose en combinar al menos un primer criterio de similaridad espectral de la trama con modelos acusticos de ruido y de voz, un segundo criterio de análisis de energía de la trama y un tercer criterio de duracion; y en utilizar una máquina de estados para detectar inicio de un segmento como acumulacion de un numero determinado de tramas consecutivas con parecido acustico superior a un primer umbral y para detectar fin de dicho segmento; una tercera etapa (30) en la que se revisa la clasificacion como voz o como ruido de las tramas de senal llevada a cabo en la segunda etapa utilizando criterios de duracion.
|
申请公布号 |
AR078575(A1) |
申请公布日期 |
2011.11.16 |
申请号 |
AR2010P103681 |
申请日期 |
2010.10.08 |
申请人 |
TELEFONICA S.A. |
发明人 |
CADENAS SANCHEZ, DAVID;GARCIA MARTINEZ, CARLOS;DUXANS BARROBES, HELENCA;SENDRA VICENS, MAURICIO |
分类号 |
G10L25/78;(IPC1-7):G10L11/02;G10L15/20 |
主分类号 |
G10L25/78 |
代理机构 |
|
代理人 |
|
主权项 |
|
地址 |
|