发明名称 使用切换状态空间模型的多模变分推导的语音识别方法
摘要 一种有效设置切换状态空间模型的后验概率参数的方法通过定义包含至少两个但少于全部帧的窗开始。为窗中的每个帧确定个别后验概率参数。然后所述窗在时间上从左到右顺序移位,使得它包括帧序列中一个或多个后续帧。然后为移位后的窗中的每个帧确定个别后验概率参数。该方法精密地逼近更严格的解,但将计算成本节省了两到三个数量级。另外,发明了一种确定切换状态空间模型中的最佳离散状态序列的方法,该方法在逐帧基础上直接利用观测矢量,并在时间上从左到右操作。
申请公布号 CN100589180C 申请公布日期 2010.02.10
申请号 CN200510005936.4 申请日期 2005.01.20
申请人 微软公司 发明人 H·阿蒂亚斯;L·李;邓立
分类号 G10L15/06(2006.01)I;G10L15/08(2006.01)I;G10L15/14(2006.01)I 主分类号 G10L15/06(2006.01)I
代理机构 上海专利商标事务所有限公司 代理人 谢喜堂
主权项 1.一种设置一切换状态空间模型的后验概率参数的方法,所述后验概率基于与帧序列相关联的输入值为所述帧序列提供一组隐含状态的似然性,其特征在于,所述方法包括:定义一包含至少两个但少于所述帧序列中全部帧的窗;为所述窗中的每个帧确定一单独后验概率参数,其中为每个帧确定单独后验概率参数还包括为一组不同于连续隐含状态的离散隐含状态的每一个确定单独后验概率参数;移位所述窗,从而使它包括所述帧序列中至少一个后续帧,以形成一移位后的窗;以及为所述移位后的窗中的每个帧确定一单独后验概率参数。
地址 美国华盛顿州