发明名称 利用话音识别器反馈来进行语音活动检测
摘要 本文描述了利用话音识别器反馈来进行语音活动检测。语音活动检测(VAD)模块分析诸如音频文件或视频文件之类的媒体文件,以确定该媒体文件的一个或多个帧是否包括话音。话音识别器生成与VAD确定的准确度有关的反馈。VAD模块利用该反馈来改进后继VAD确定。VAD模块还利用与媒体文件相关联的超前窗口来调节先前处理的帧的估计概率或VAD判定。
申请公布号 CN102708855A 申请公布日期 2012.10.03
申请号 CN201210044558.0 申请日期 2012.02.24
申请人 微软公司 发明人 A·J·K·泰姆白瑞德南;朱卫武;F·T·B·西德
分类号 G10L11/00(2006.01)I;G10L15/00(2006.01)I 主分类号 G10L11/00(2006.01)I
代理机构 上海专利商标事务所有限公司 31100 代理人 高见
主权项 一种方法,包括:将媒体文件的多个帧分类为一个或多个话音帧和一个或多个非话音帧(402);接收与所述一个或多个话音帧和所述一个或多个非话音帧相关联的反馈(406);以及将所述反馈用于更新将被用于所述媒体文件中尚待处理的多个帧的语音活动检测的模型(408)。
地址 美国华盛顿州