发明名称 集成的本地和基于云的语音识别
摘要 本发明描述了集成的本地和基于云的语音识别。描述了一种用于将本地语音识别与基于云的语音识别集成以提供高效的自然用户界面的系统。在一些实施例中,计算设备确定与环境中的特定人相关联的方向,并生成与该方向相关联的音频记录。该计算设备然后对该音频记录执行本地语音识别以检测该特定人说出的第一话语并检测该第一话语中的一个或多个关键字。该第一话语可通过对音频记录应用话音活动检测技术来检测。该第一话语以及一个或多个关键字随后被传送至服务器,该服务器可标识第一话语中与该一个或多个关键字相关联的语音,并基于所标识的语音来使一种或多种语音识别技术进行适应。
申请公布号 CN102903362A 申请公布日期 2013.01.30
申请号 CN201210320230.7 申请日期 2012.08.31
申请人 微软公司 发明人 T·M·苏摩;L·宋;M·H·金;C·R·海涅曼;D·H·霍金斯
分类号 G10L15/34(2013.01)I;H04L29/08(2006.01)I 主分类号 G10L15/34(2013.01)I
代理机构 上海专利商标事务所有限公司 31100 代理人 顾嘉运
主权项 一种用于执行语音识别的方法,包括:从多个话筒获取(502)多个音频信号,所述多个音频信号中的每一个都与所述多个话筒中的不同话筒相关联,所述多个音频信号与第一环境相关联;确定(507)所述第一环境中的一个或多个方向,所述第一环境包括一个或多个人,所述一个或多个方向中的每一个都与所述一个或多个人中的不同人相关联;基于所述多个音频信号来生成(508)一个或多个音频记录,所述一个或多个音频记录中的第一音频记录通过以下操作生成:对所述多个音频信号应用音频信号处理技术以使得源自所述一个或多个方向中的第一方向的声音被放大,同时源自一个或多个其他方向的其他声音被削弱;对所述多个音频记录中的每一个执行(512)本地语音识别,所述执行本地语音识别包括检测第一话语以及检测所述第一话语中的一个或多个关键字,所述第一话语通过对所述一个或多个音频记录中的第一音频记录应用一种或多种语音检测技术来检测;将所述第一话语以及所述一个或多个关键字传送(516)到第二计算设备,所述第二计算设备对所述第一话语执行语音识别技术,所述语音识别技术检测所述第一话语中的一个或多个单词;以及从所述第二计算设备接收(518)基于所述第一话语的第一响应。
地址 美国华盛顿州