发明名称 用以于分布式语音辨识系统中语音辨识之系统及方法
摘要 一种用于分布式语音辨识系统中改善语音辨识之方法及系统。分布式语音辨识系统50包括用户单元54中的区域VR引擎及伺服器58上的伺服器VR引擎56。当区域VR引擎52无法辨识一语音段时,区域VR引擎52便会发送该语音般的资讯给伺服器VR引擎56。如果该语音段被伺服器VR引擎56辨识的话,该伺服器VR引擎56便会下载对应该语音段的资讯到区域VR引擎52。区域VR引擎52会其结合语音段资讯及下载的资讯以产生语音段的结果资讯。区域VR引擎52也可在所下载的资讯尚加诸一项功能以产生结果资讯。然后结果资讯便可以从区域VR引擎52上传到伺服器VR引擎56。
申请公布号 TW580690 申请公布日期 2004.03.21
申请号 TW090133212 申请日期 2001.12.31
申请人 奎康公司 发明人 哈里纳斯 高鲁达卓
分类号 G10L15/00 主分类号 G10L15/00
代理机构 代理人 陈长文 台北市松山区敦化北路二○一号七楼
主权项 1.一种用于通信系统中的用户单元,包括:一储存装置,透过一网路从一伺服器接收特征化一语音段的资讯;及一处理装置,将该所接收到的资讯与一区域语音辨识系统中的语音段资讯相组合以产生组合后的语音段资讯。2.如申请专利范围第1项之用户单元,其中该所接收到的资讯系高斯混合信号。3.一种用于通信系统的用户单元,包括:接收特征化一语音段的资讯的储存装置;及将一预定功能应用在该所接收到的资讯上以产生结果语音资讯的装置。4.如申请专利范围第3项之用户单元,其中该所接收到的资讯及结果语音资讯系高斯混合信号。5.一种语音辨识的方法,包括:透过一网路从一伺服器接收特征化一语音段的资讯;将该所接收到的资讯与区域语音段资讯结合以产生结合后的语音段资讯;及利用该结合后的语音段资讯来辨识一语音段。6.一种语音辨识的方法,包括:接收特征化一语音段的资讯;将一预定功能应用在该所接收到的资讯上以产生结果语音段资讯;及利用该结果语音段资讯来辨识一语音段。7.一种语音辨识的方法,包括:透过一网路从一伺服器接收特征化一语音段的资讯;结合该所接收到的资讯与区域特征;将一预定功能应用在该所结合的资讯上以产生结果语音资讯;及利用该结果语音资讯来辨识一语音段。8.一种用于通信系统中的语音辨识方法,包括:从一区域用户单元接收一语音段的前端特征;及比较该等前端特性与来自一网路伺服器的语音段资讯。9.如申请专利范围第8项之方法,尚包括基于该比较的结果选择匹配的语音段资讯。10.一种语音辨识方法,包括:透过一网路从一区域用户单元发送一语音段的特征到一伺服器;在该区域用户单元处接收来自该伺服器特征化该语音段并对应于该等发送的特征的语音段资讯;将一预定功能应用在该所接收到的资讯上以产生结果语音资讯;结合该结果语音资讯与该区域用户单元的区域语音段资讯;及利用该结合资讯来辨识该语音段。11.一种语音辨识的方法,包括:在一区域语音辨识引擎处接收一语音段;处理该语音段以产生该语音段的参数;发送该等参数到一网路语音辨识引擎;将该参数与隐藏的马尔克夫模型(HMM)做比较;及发送对应该等参数的HMM模型的混合信号给该区域语音辨识引擎。12.如申请专利范围第11项之方法,尚包括接收该等混合信号。13.如申请专利范围第12项之方法,尚包括将该等混合信号储存到该区域语音辨识引擎的记忆体。14.一种分布式语音辨识系统,包括:在一用户单元的一区域语音辨识引擎,其从一网路语音辨识引擎接收用以辨识一语音段的混合信号;及在一伺服器上的该网路语音辨识引擎,其发送该等混合信号到该区域语音辨识引擎。15.如申请专利范围第14项之分布式语音辨识系统,其中该区域语音辨识引擎系一种型态的语音辨识引擎。16.如申请专利范围第15项之分布式语音辨识系统,其中该网路语音辨识引擎系另外一种型态的语音辨识引擎。17.如申请专利范围第16项之分布式语音辨识系统,其中该等所接收到的混合信号与该区域语音辨识引擎的混合信号结合。18.一种分布式语音辨识系统,包括:在一用户单元上的一区域语音辨识引擎,其发送训练结果的混合信号到一网路语音辨识引擎;及在一伺服器上的该网路语音辨识引擎,其接收用来辨识一语音段的混合信号。图式简单说明:图1所示的系语音辨识系统;图2所示的系VR系统中的VR前端;图3所示的系三音(triphone)的HMM模型范例;图4所示的系根据一具体实例之在用户单元中具有区域VR引擎的DVR系统及伺服器中的伺服器VR引擎;及图5所示的系根据一具体实例之VR辨识方法的流程图。
地址 美国