发明名称 头部安装的多-感觉音频输入系统
摘要 本发明将常规的音频话筒与附加的语音传感器组合起来,语音传感器基于输入提供语音传感器信号。语音传感器信号是基于由说话者在讲话期间采取的动作诸如面部运动、骨振动、喉部阻抗变化等而产生的。语音检测器组件从语音传感器接收输入并输出语音检测信号,表示用户是否正在说话。语音检测器基于话筒信号和语音传感器信号产生语音检测信号。
申请公布号 CN100573664C 申请公布日期 2009.12.23
申请号 CN200410055738.4 申请日期 2004.07.29
申请人 微软公司 发明人 黄学东;刘自成;张正友;M·J·辛克莱尔;A·阿塞罗
分类号 G10L15/00(2006.01)I;G10L11/00(2006.01)I;G06F3/16(2006.01)I;G06F17/20(2006.01)I 主分类号 G10L15/00(2006.01)I
代理机构 上海专利商标事务所有限公司 代理人 张 欣
主权项 1.一种语音识别系统,其特征在于,包括:音频话筒,基于检测到音频输入输出话筒信号;语音传感器,基于由语音动作产生的非音频输入输出传感器信号;语音检测器组件,基于传感器信号的第一特性且基于话筒信号输出语音检测信号,该语音检测信号表示用户正在说话的概率,其中所述传感器信号的第一特性具有用户正在说话时的第一电平和用户不在说话时的第二电平,并且所述语音检测器组件基于传感器信号的第一特性的电平相对于第一特性的基线电平输出语音检测信号,其中所述基线电平包括所述第一特性的第一和第二电平中的预定的一个,所述基线电平是基于经过一段时间的第一特性的电平来计算的,所述语音检测器组件还将语音检测量乘以话筒信号以产生组合信号;以及语音识别引擎,基于话筒信号和语音检测信号,提供识别输出,表示在检测到的音频输入中的语音,其中该语音识别引擎:如果语音检测信号表示用户正在说话,增加识别语音的可能性;以及如果语音检测信号表示说话者不在说话,减少识别语音的可能性。
地址 美国华盛顿州