发明名称 PROCEDIMIENTO DE DETECCION DE SEGMENTOS DE VOZ
摘要 La presente solicitud se refiere a un procedimiento de deteccion de segmentos de voz y de ruido en una senal digital de audio de entrada, estando dividida dicha senal de entrada en una pluralidad de tramas que comprende: una primera etapa (10) en la que se realiza una primera clasificacion de una trama como ruido si el valor medio de la energía para esta trama y las N tramas anteriores no es superior a un primer umbral de energía, N>1; una segunda etapa (20) en la que para cada trama que no ha sido clasificada como ruido en la primera etapa se decide si dicha trama se clasifica como ruido o como voz basándose en combinar al menos un primer criterio de similaridad espectral de la trama con modelos acusticos de ruido y de voz, un segundo criterio de análisis de energía de la trama y un tercer criterio de duracion; y en utilizar una máquina de estados para detectar inicio de un segmento como acumulacion de un numero determinado de tramas consecutivas con parecido acustico superior a un primer umbral y para detectar fin de dicho segmento; una tercera etapa (30) en la que se revisa la clasificacion como voz o como ruido de las tramas de senal llevada a cabo en la segunda etapa utilizando criterios de duracion.
申请公布号 AR078575(A1) 申请公布日期 2011.11.16
申请号 AR2010P103681 申请日期 2010.10.08
申请人 TELEFONICA S.A. 发明人 CADENAS SANCHEZ, DAVID;GARCIA MARTINEZ, CARLOS;DUXANS BARROBES, HELENCA;SENDRA VICENS, MAURICIO
分类号 G10L25/78;(IPC1-7):G10L11/02;G10L15/20 主分类号 G10L25/78
代理机构 代理人
主权项
地址