在声音频道上进行语音辨认之方法及装置,申请号TW091132906-传众专利搜索

发明名称	在声音频道上进行语音辨认之方法及装置
摘要	本发明揭示一种在声音频道上进行语音辨认之方法及装置。
申请公布号	TWI282547	申请公布日期	2007.06.11
申请号	TW091132906	申请日期	2002.11.08
申请人	英特尔公司	发明人	大卫L. 葛朗曼
分类号	G10L15/02(2006.01);H03M7/00(2006.01)	主分类号	G10L15/02(2006.01)
代理机构		代理人	陈长文台北市松山区敦化北路201号7楼
主权项	1.一种实施语音辨认之方法,包含: 接收表示语音之一组信号; 在一声音频道上接收语音辨认资讯之申请; 从该等信号产生一组语音特征;及在该声音频道上传达该语音特征。 2.如申请专利范围第1项之方法,其中接收该申请包含: 接收对一声音命令之提示;及接收一代位指标(Subrogation indicator)。 3.如申请专利范围第2项之方法,其中该代位指标系一预先定义位元模式。 4.如申请专利范围第1项之方法,其中该产生过程包含: 从该等信号撷取该等语音特征;及压缩该等语音特征。 5.如申请专利范围第4项之方法,另包含执行该等已压缩语音特征之错误校正。 6.如申请专利范围第4项之方法,另包含确定在该等信号中之静音期间。 7.如申请专利范围第1项之方法,其中该传达过程包含: 产生表示该语音之第一位元流; 接收表示该语音特征之第二位元流; 以该第二位元流取代该第一位元流;及在该声音频道上发送该第二位元流。 8.如申请专利范围第7项之方法,其中该产生过程包含: 接收一表示该语音之类比音频波形; 将该类比音频波形转换成一数位音频信号;及使用声音编码算法压缩该数位音频信号。 9.如申请专利范围第7项之方法,其中该取代过程包含: 确定该第一位元流之一起始点与一终止点; 确定该第二位元流之一起始点与一终止点;及使用该等起始点与终止点以该第二位元流取代该第一位元流。 10.如申请专利范围第9项之方法,其中使用该等起始点与终止点以该第二位元流取代该第一位元流之过程包含: (a)从该第一位元流之起始点产生一位元讯框; (b)以该第二位元流之起始点叠置该位元讯框; (c)在该声音频道上发送该位元讯框;及 (d)继续进行(a)-(c)直至到达该第二位元流之终止点为止。 11.如申请专利范围第9项之方法,其中该发送过程包含: 在该第二位元流之起始点前插入一开始指标及在该第二位元流之终止点之后插入一终结指标;以及发送具有该开始指标与该终结指标之第二位元流。 12.一种实施语音辨认之方法,包含: 在一声音频道上发送对语音辨认资讯之申请; 在该声音频道上接收语音特征;及使用该语音特征辨认语音。 13.如申请专利范围第12项之方法,其中该发送过程包含: 发送一声音命令之提示;及发送一代位指标。 14.如申请专利范围第13项之方法,其中该代位指标系一预先定义位元模式。 15.如申请专利范围第12项之方法,其中该接收过程包含: (a)确定一位元流之起始点与终止点; (b)从该起始点开始重建语音特征; (c)将该语音特征解压缩; (d)发送该等已解压缩语音特征至一语音辨认装置; 以及 (e)进行(a)-(d)处理,直至到达该终止点为止。 16.如申请专利范围第15项之方法,另包含: 从该位元流撷取错误校正资讯;及使用该错误校正资讯确定该等语音特征是否包含错误。 17.一种实施语音辨认之系统,包含: 一讯源节点,用以发送语音特征; 一目的地节点,用以接收语音特征及实施语音辨认 ;及一网路,藉由将语音特征叠置于一声音频道上以在该讯源节点与目的地节点间传达该等语音特征。 18.如申请专利范围第17项之系统,其中该讯源节点包含: 一收发机,用以与该目的地节点之间传达资讯; 一能力监控器,监控来自该收发机之语音辨认资讯申请; 一声码器,用以产生一表示语音之第一位元流; 一特征编码器,用以产生一表示该语音的语音特征之第二位元流;及一特征叠置器,用以将该第二位元流覆盖于该第一位元流及发送该第二位元流至该收发机,以与该目的地节点通信。 19.如申请专利范围第17项之系统,其中该特征编码器包含: 一特征撷取器,用以从该语音撷取语音特征;及一特征压缩器,用以将该语音特征压缩成该第二位元流。 20.如申请专利范围第17项之系统,其中该目的地节点包含: 一收发机,用以对该讯源节点传达资讯; 一能力广播器,用以传达语音辨认申请至该讯源节点; 一起始监控器,用以监控来自该收发机之一具有语音特征之位元流; 一特征解码器,用以将来自该位元流之语音特征解码;及一语音辨认模组,用以将该语音特征译成本文。 21.如申请专利范围第20项之语音辨认解码器,其中该特征解码器包含: 一特征重建器,用以从该位元流重建语音特征;及一特征解压缩器,用以将重建之语音特征解压缩。 22.如申请专利范围第17项之系统,其中该网路系一无线网路。 23.一种语音辨认编码器,包含: 一能力监控器,用以监控对语音辨认资讯之申请; 一声码器,用以产生一表示语音之第一位元流; 一特征编码器,用以产生一表示该语音之语音特征之第二位元流;及一特征叠置器,用以将该第二位元流覆盖于该第一位元流。 24.如申请专利范围第23项之语音辨认编码器,其中该特征编码器包含: 一特征撷取器,用以从该语音撷取语音特征;及一特征压缩器,用以将该语音特征压缩成该第二位元流。 25.一种语音辨认解码器,包含: 一能力广播器,用以传达一语音辨认申请; 一起始监控器,用以监控一具有语音特征之位元流 ; 一特征解码器,用以将来自该位元流之语音特征解码;及一语音辨认模组,用以将该语音特征译成本文。 26.如申请专利范围第25项之语音辨认解码器,其中该特征解码器包含: 一特征重建器,用以从该位元流重建语音之特征; 及一特征解压缩器,用以解除所重建语音特征之压缩。 27.一种电脑可读取媒体,其包含储存之指令,由一处理器执行该等指令以完成语音辨认,所用之方法为接收表示语音之一组信号,在一声音频道上接收对语音辨认资讯之申请,从该信号产生一组语音特征,及在该声音频道上传达语音特征。 28.如申请专利范围第27项之电脑可读取媒体,其中所储存之指令由一处理器予以执行时,进一步藉接收对一声音命令之提示及接收一代位指标达成该申请之接收。 29.如申请专利范围第27项之电脑可读取媒体,其中所储存之指令由一处理器予以执行时,进一步藉从该等信号撷取语音特征及压缩该等语音特征而导致该产生一组语音特征之过程。 30.如申请专利范围第27项之电脑可读取媒体,其中所储存之指令由一处理器予以执行时,进一步藉产生一表示该语音之第一位元流,接收一表示语音特征之第二位元流,用该第二位元流取代该第一位元流及在该声音频道上发送该第二位元流而达成该传达语音特征之过程。 31.如申请专利范围第30项之电脑可读取媒体,其中所储存之指令由一处理器予以执行时,进一步藉接收表示该语音之类比音频波形,将该类比音频波形转换成数位音频信号,及使用声音编码算法压缩该数位音频信号而达成该产生过程。 32.如申请专利范围第30项之电脑可读取媒体,其中所储存之指令由一处理器予以执行时,进一步藉确定该第一位元流之起始点与终止点,确定该第二位元流之起始点与终止点,及使用该等起始点与终止点,以第二位元流替代该第一位元流而达成该取代过程。 33.如申请专利范围第32项之电脑可读取媒体,其中所储存之指令由一处理器予以执行时,进一步完成使用该等起始点及终止点以第二位元流取代第一位元流,其方法为(a)从该第一位元流之起始点产生一位元讯框,(b)以第二位元流之起始点覆盖该位元讯框,(c)在声音频道上发送该位元讯框及(d)继续进行(a)-(c)直至到达该第二位元流之终止点为止。 34.如申请专利范围第32项之电脑可读取媒体,其中所储存之指令由一处理器予以执行时,进一步藉在该第二位元流起始点之前插入一起始指标,及在第二位元流终止点之后插入一终止指标,以及发送具有该起始与终止指标之第二位元流而达成该发送过程。 35.一种电脑可读取媒体,其包含储存之指令,由一处理器执行该等指令,藉在一声音频道上发送对语音辨认之申请,接收在该声音频道上之语音特征及使用该语音特征辨认语音而导致语音辨认之完成。 36.如申请专利范围第35项之电脑可读取媒体,其中所储存之指令由一处理器予以处理时,进一步藉发送一声音命令之提示及发送一代位指标而达成该发送过程。 37.如申请专利范围第35项之电脑可读取媒体,其中所储存之指令由一处理器予以执行时,进一步以(a) 确定一位元流之起始点与终止点,(b)从该起始点重建语音特征,(c)将该语音特征解压缩,(d)发送已解压缩之语音特征至一语音辨认装置及(e)进行(a)-(d) 直至到达该终止点而达成该接收过程。 38.如申请专利范围第37项之电脑可读取媒体,其中所储存之指令由一处理器予以执行时,进一步从该位元流撷取错误校正资讯,及使用该错误校正资讯确定语音特征是否包括错误。图式简单说明: 图1为适于实行本发明之一具体实例之一系统。图2为根据本发明具体实例之一讯源节点之方块图。图3为根据本发明之一语音辨认编码器之方块图。图4为根据本发明具体实例之一目的地节点之方块图。图5为根据本发明具体实例之一语音辨认解码器之方块图。图6为根据本发明实例之语音辨认系统所完成程式规划逻辑之第一方块流程图。图7为根据本发明实例之语音辨认系统所完成程式规划逻辑之第二方块流程图。图8为根据本发明实例之一代位透明图之范例。
地址	美国