发明名称 声学处理单元接口
摘要 本发明的实施例包括一种装置,方法以及系统,用于声学建模。在一实施例中,提供一种语音识别系统。该系统包括一处理单元用以将一接收到的音频信号分割成具有个别帧向量的连续帧、一声学处理单元(APU)、一数据总线用以耦合该处理单元以及该声学处理单元。该APU包括一局部非易失性存储器用以储存多个聚类状态、一记忆缓冲器用以耦合到该存储器、以及一计分单元,该声学处理单元用以将至少一储存于该存储器中的高斯机率分布向量加载至该记忆缓冲器,该计分单元用以同时比较一加载至该记忆缓冲器的高斯机率分布向量的多个维度和一从该处理单元接收的帧向量的各别维度,并输出一对应分数至该处理单元。该APU使用一第一帧来执行一比较而该处理单元使用一对应一第二帧的分数来执行一搜寻操作,且该第二帧紧接着先前的第一帧。
申请公布号 CN104137178A 申请公布日期 2014.11.05
申请号 CN201280070114.2 申请日期 2012.12.18
申请人 斯班逊有限公司 发明人 V·纳塔拉詹;S·罗斯内
分类号 G10L15/02(2006.01)I;G10L15/01(2006.01)I 主分类号 G10L15/02(2006.01)I
代理机构 北京戈程知识产权代理有限公司 11314 代理人 程伟;王锦阳
主权项 一种语音辨识系统,包括:处理单元,用以将一接收到的音频信号分割成具有各自的帧向量的连续帧;声学处理单元(APU),包含:局部非易失性存储器,用以储存多个聚类状态;记忆缓冲器,耦合到该存储器,其中,该声学处理单元用以将至少一储存于该存储器中的高斯机率分布向量加载至该记忆缓冲器;以及计分单元,用以同时比较一加载至该记忆缓冲器的高斯机率分布向量的多个维度和一从该处理单元接收的帧向量的各别维度,并输出一对应分数至该处理单元;其中,该声学处理单元使用一第一帧来执行一比较而该处理单元使用一对应一第二帧的分数来执行一搜寻操作,该第二帧紧接着先前的该第一帧;以及数据总线,用以耦合该处理单元和该声学处理单元。
地址 美国加利福尼亚州