发明名称 语音端点检测中的短时能频值波形斜率门限的确定方法
摘要 本发明涉及自动字幕生成系统中的语音检测技术,具体涉及一种语音端点检测中的短时能频值波形斜率门限的确定方法。该方法通过分析当前的短时能频值序列,找出其最小值EZE-feature<sub>min</sub>和最大值EZE-feature<sub>max</sub>,然后计算EZE-feature<sub>max</sub>/100;比较EZE-feature<sub>min</sub>和EZE-feature<sub>max</sub>/100,取其中较大者,记为EZE-feature<sub>slope</sub>;确定短时能频值波形斜率门限值为R<sub>m</sub>=EZE-feature<sub>slope</sub>×2。通过本发明所述方法找到的短时能频值斜率门限对于整个短时能频值序列都有效,因此在语音端点检测过程中不需要再次进行修改,而且在绝大部分情况下基本可以满足寻找语句端点的需要,因此,可以提高语音端点的检测效率。
申请公布号 CN101625859A 申请公布日期 2010.01.13
申请号 CN200810116462.4 申请日期 2008.07.10
申请人 新奥特(北京)视频技术有限公司 发明人 李祺;马华东;郑侃彦;韩忠涛;张婷
分类号 G10L11/00(2006.01)I;G10L11/02(2006.01)I;G10L15/04(2006.01)I 主分类号 G10L11/00(2006.01)I
代理机构 北京天悦专利代理事务所 代理人 田 明;任晓航
主权项 1.一种语音端点检测中的短时能频值波形斜率门限的确定方法,包括如下步骤:(1)分析当前的短时能频值序列,找出其最小值,记为EZE-featuremin;找出其最大值,记为EZE-featuremax,然后计算EZE-featuremax/100;(2)比较EZE-featuremin和EZE-featuremax/100,取其中较大者,记为EZE-featureslope;(3)确定短时能频值波形斜率门限值Rm=EZE-featureslope×2。
地址 100080北京市海淀区西草场1号北京硅谷电脑城15层1501-1506室