发明名称 在声音频道上进行语音辨认之方法及装置
摘要 本发明揭示一种在声音频道上进行语音辨认之方法及装置。
申请公布号 TWI282547 申请公布日期 2007.06.11
申请号 TW091132906 申请日期 2002.11.08
申请人 英特尔公司 发明人 大卫L. 葛朗曼
分类号 G10L15/02(2006.01);H03M7/00(2006.01) 主分类号 G10L15/02(2006.01)
代理机构 代理人 陈长文 台北市松山区敦化北路201号7楼
主权项 1.一种实施语音辨认之方法,包含: 接收表示语音之一组信号; 在一声音频道上接收语音辨认资讯之申请; 从该等信号产生一组语音特征;及 在该声音频道上传达该语音特征。 2.如申请专利范围第1项之方法,其中接收该申请包 含: 接收对一声音命令之提示;及 接收一代位指标(Subrogation indicator)。 3.如申请专利范围第2项之方法,其中该代位指标系 一预先定义位元模式。 4.如申请专利范围第1项之方法,其中该产生过程包 含: 从该等信号撷取该等语音特征;及 压缩该等语音特征。 5.如申请专利范围第4项之方法,另包含执行该等已 压缩语音特征之错误校正。 6.如申请专利范围第4项之方法,另包含确定在该等 信号中之静音期间。 7.如申请专利范围第1项之方法,其中该传达过程包 含: 产生表示该语音之第一位元流; 接收表示该语音特征之第二位元流; 以该第二位元流取代该第一位元流;及 在该声音频道上发送该第二位元流。 8.如申请专利范围第7项之方法,其中该产生过程包 含: 接收一表示该语音之类比音频波形; 将该类比音频波形转换成一数位音频信号;及 使用声音编码算法压缩该数位音频信号。 9.如申请专利范围第7项之方法,其中该取代过程包 含: 确定该第一位元流之一起始点与一终止点; 确定该第二位元流之一起始点与一终止点;及 使用该等起始点与终止点以该第二位元流取代该 第一位元流。 10.如申请专利范围第9项之方法,其中使用该等起 始点与终止点以该第二位元流取代该第一位元流 之过程包含: (a)从该第一位元流之起始点产生一位元讯框; (b)以该第二位元流之起始点叠置该位元讯框; (c)在该声音频道上发送该位元讯框;及 (d)继续进行(a)-(c)直至到达该第二位元流之终止点 为止。 11.如申请专利范围第9项之方法,其中该发送过程 包含: 在该第二位元流之起始点前插入一开始指标及在 该第二位元流之终止点之后插入一终结指标;以及 发送具有该开始指标与该终结指标之第二位元流 。 12.一种实施语音辨认之方法,包含: 在一声音频道上发送对语音辨认资讯之申请; 在该声音频道上接收语音特征;及 使用该语音特征辨认语音。 13.如申请专利范围第12项之方法,其中该发送过程 包含: 发送一声音命令之提示;及 发送一代位指标。 14.如申请专利范围第13项之方法,其中该代位指标 系一预先定义位元模式。 15.如申请专利范围第12项之方法,其中该接收过程 包含: (a)确定一位元流之起始点与终止点; (b)从该起始点开始重建语音特征; (c)将该语音特征解压缩; (d)发送该等已解压缩语音特征至一语音辨认装置; 以及 (e)进行(a)-(d)处理,直至到达该终止点为止。 16.如申请专利范围第15项之方法,另包含: 从该位元流撷取错误校正资讯;及 使用该错误校正资讯确定该等语音特征是否包含 错误。 17.一种实施语音辨认之系统,包含: 一讯源节点,用以发送语音特征; 一目的地节点,用以接收语音特征及实施语音辨认 ;及 一网路,藉由将语音特征叠置于一声音频道上以在 该讯源节点与目的地节点间传达该等语音特征。 18.如申请专利范围第17项之系统,其中该讯源节点 包含: 一收发机,用以与该目的地节点之间传达资讯; 一能力监控器,监控来自该收发机之语音辨认资讯 申请; 一声码器,用以产生一表示语音之第一位元流; 一特征编码器,用以产生一表示该语音的语音特征 之第二位元流;及 一特征叠置器,用以将该第二位元流覆盖于该第一 位元流及发送该第二位元流至该收发机,以与该目 的地节点通信。 19.如申请专利范围第17项之系统,其中该特征编码 器包含: 一特征撷取器,用以从该语音撷取语音特征;及 一特征压缩器,用以将该语音特征压缩成该第二位 元流。 20.如申请专利范围第17项之系统,其中该目的地节 点包含: 一收发机,用以对该讯源节点传达资讯; 一能力广播器,用以传达语音辨认申请至该讯源节 点; 一起始监控器,用以监控来自该收发机之一具有语 音特征之位元流; 一特征解码器,用以将来自该位元流之语音特征解 码;及 一语音辨认模组,用以将该语音特征译成本文。 21.如申请专利范围第20项之语音辨认解码器,其中 该特征解码器包含: 一特征重建器,用以从该位元流重建语音特征;及 一特征解压缩器,用以将重建之语音特征解压缩。 22.如申请专利范围第17项之系统,其中该网路系一 无线网路。 23.一种语音辨认编码器,包含: 一能力监控器,用以监控对语音辨认资讯之申请; 一声码器,用以产生一表示语音之第一位元流; 一特征编码器,用以产生一表示该语音之语音特征 之第二位元流;及 一特征叠置器,用以将该第二位元流覆盖于该第一 位元流。 24.如申请专利范围第23项之语音辨认编码器,其中 该特征编码器包含: 一特征撷取器,用以从该语音撷取语音特征;及 一特征压缩器,用以将该语音特征压缩成该第二位 元流。 25.一种语音辨认解码器,包含: 一能力广播器,用以传达一语音辨认申请; 一起始监控器,用以监控一具有语音特征之位元流 ; 一特征解码器,用以将来自该位元流之语音特征解 码;及 一语音辨认模组,用以将该语音特征译成本文。 26.如申请专利范围第25项之语音辨认解码器,其中 该特征解码器包含: 一特征重建器,用以从该位元流重建语音之特征; 及 一特征解压缩器,用以解除所重建语音特征之压缩 。 27.一种电脑可读取媒体,其包含储存之指令,由一 处理器执行该等指令以完成语音辨认,所用之方法 为接收表示语音之一组信号,在一声音频道上接收 对语音辨认资讯之申请,从该信号产生一组语音特 征,及在该声音频道上传达语音特征。 28.如申请专利范围第27项之电脑可读取媒体,其中 所储存之指令由一处理器予以执行时,进一步藉接 收对一声音命令之提示及接收一代位指标达成该 申请之接收。 29.如申请专利范围第27项之电脑可读取媒体,其中 所储存之指令由一处理器予以执行时,进一步藉从 该等信号撷取语音特征及压缩该等语音特征而导 致该产生一组语音特征之过程。 30.如申请专利范围第27项之电脑可读取媒体,其中 所储存之指令由一处理器予以执行时,进一步藉产 生一表示该语音之第一位元流,接收一表示语音特 征之第二位元流,用该第二位元流取代该第一位元 流及在该声音频道上发送该第二位元流而达成该 传达语音特征之过程。 31.如申请专利范围第30项之电脑可读取媒体,其中 所储存之指令由一处理器予以执行时,进一步藉接 收表示该语音之类比音频波形,将该类比音频波形 转换成数位音频信号,及使用声音编码算法压缩该 数位音频信号而达成该产生过程。 32.如申请专利范围第30项之电脑可读取媒体,其中 所储存之指令由一处理器予以执行时,进一步藉确 定该第一位元流之起始点与终止点,确定该第二位 元流之起始点与终止点,及使用该等起始点与终止 点,以第二位元流替代该第一位元流而达成该取代 过程。 33.如申请专利范围第32项之电脑可读取媒体,其中 所储存之指令由一处理器予以执行时,进一步完成 使用该等起始点及终止点以第二位元流取代第一 位元流,其方法为(a)从该第一位元流之起始点产生 一位元讯框,(b)以第二位元流之起始点覆盖该位元 讯框,(c)在声音频道上发送该位元讯框及(d)继续进 行(a)-(c)直至到达该第二位元流之终止点为止。 34.如申请专利范围第32项之电脑可读取媒体,其中 所储存之指令由一处理器予以执行时,进一步藉在 该第二位元流起始点之前插入一起始指标,及在第 二位元流终止点之后插入一终止指标,以及发送具 有该起始与终止指标之第二位元流而达成该发送 过程。 35.一种电脑可读取媒体,其包含储存之指令,由一 处理器执行该等指令,藉在一声音频道上发送对语 音辨认之申请,接收在该声音频道上之语音特征及 使用该语音特征辨认语音而导致语音辨认之完成 。 36.如申请专利范围第35项之电脑可读取媒体,其中 所储存之指令由一处理器予以处理时,进一步藉发 送一声音命令之提示及发送一代位指标而达成该 发送过程。 37.如申请专利范围第35项之电脑可读取媒体,其中 所储存之指令由一处理器予以执行时,进一步以(a) 确定一位元流之起始点与终止点,(b)从该起始点重 建语音特征,(c)将该语音特征解压缩,(d)发送已解 压缩之语音特征至一语音辨认装置及(e)进行(a)-(d) 直至到达该终止点而达成该接收过程。 38.如申请专利范围第37项之电脑可读取媒体,其中 所储存之指令由一处理器予以执行时,进一步从该 位元流撷取错误校正资讯,及使用该错误校正资讯 确定语音特征是否包括错误。 图式简单说明: 图1为适于实行本发明之一具体实例之一系统。 图2为根据本发明具体实例之一讯源节点之方块图 。 图3为根据本发明之一语音辨认编码器之方块图。 图4为根据本发明具体实例之一目的地节点之方块 图。 图5为根据本发明具体实例之一语音辨认解码器之 方块图。 图6为根据本发明实例之语音辨认系统所完成程式 规划逻辑之第一方块流程图。 图7为根据本发明实例之语音辨认系统所完成程式 规划逻辑之第二方块流程图。 图8为根据本发明实例之一代位透明图之范例。
地址 美国