发明名称 用以有效率储存语音辨识模型之系统及方法
摘要 一种藉由改良语音辨识(VR)样板的储存、以改良语音辨识之方法及系统。该改良之储存意指可将更多的VR模型储存在记忆体中。当记忆体中储存的VR模型越多时,则该VR系统就越坚轫,且该VR系统就因而越准确。利用Lossy压缩技艺压缩VR模型。于一个具体实施例中,利用A-定律压缩和A-定律扩充压缩和扩充VR模型。于另一个具体实施例中,利用Mu-定律压缩和Mu-定律扩充压缩和扩充 VR模型。于一个训练处理期间压缩VR模型,及于语音辨识期间扩充该等VR模型。
申请公布号 TW546632 申请公布日期 2003.08.11
申请号 TW091100301 申请日期 2002.01.11
申请人 奎康公司 发明人 哈里纳斯 葛拉达卓
分类号 G10L15/00 主分类号 G10L15/00
代理机构 代理人 陈长文 台北市松山区敦化北路二○一号七楼
主权项 1.一种语音辨识(VR)之方法,包括:记录多个语调;撷取该等多个语调的特性,以产生该等多个语调其撷取之特性;依照该等多个语调其撷取之特性产生多个VR模型;及lossy压缩该等多个VR模型,以产生多个lossy压缩之VR模型。2.如申请专利范围第1项之方法,尚包括扩充该等多个lossy压缩之VR模型,以产生多个扩充之VR模型。3.如申请专利范围第2项之方法,尚包括比较该等多个扩充之VR模型之其中一个扩充之VR模型与一个测试语调的特性。4.如申请专利范围第2项之方法,尚包括撷取一个测试语调的特性。5.如申请专利范围第4项之方法,尚包括使该测试语调其撷取之特性与该等多个扩充之VR模型之其中一个扩充之VR模型相匹配,以产生一个匹配。6.如申请专利范围第5项之方法,尚包括产生一个假设给该匹配。7.如申请专利范围第1项之方法,其中该lossy压缩为A-定律压缩该等多个VR模型,以产生多个A-定律压缩之VR模型。8.如申请专利范围第1项之方法,其中该lossy压缩为mu-定律压缩该等多个VR模型,以产生多个mu-定律压缩之VR模型。9.如申请专利范围第1项之方法,其中该等多个产生之VR模型为隐藏马可夫模型(HMM)。10.如申请专利范围第1项之方法,其中该等多个产生之VR模型为动态时间扭曲(DTW)模型。11.如申请专利范围第7项之方法,尚包括扩充该等多个A-定律压缩之VR模型之其中一个A-定律压缩之VR模型,以产生一个扩充之VR模型。12.如申请专利范围第8项之方法,尚包括扩充该等多个mu-定律压缩之VR模型之其中一个mu-定律压缩之VR模型,以产生一个扩充之VR模型。13.如申请专利范围第11项之方法,尚包括撷取一个测试语调的特性。14.如申请专利范围第12项之方法,尚包括撷取一个测试语调的特性。15.如申请专利范围第13项之方法,尚包括使该测试语调其撷取之特性与该等多个扩充之VR模型之其中一个扩充之VR模型相匹配,以产生一个匹配。16.如申请专利范围第14项之方法,尚包括使该测试语调其撷取之特性与该等多个扩充之VR模型之其中一个扩充之VR模型相匹配,以产生一个匹配。17.如申请专利范围第15项之方法,尚包括产生一个假设给该匹配。18.如申请专利范围第16项之方法,尚包括产生一个假设给该匹配。19.一种包括一个训练模组之语音辨识(VR)系统,其中将该训练模组架构成:撷取多个语调的特性,以产生该等语调其撷取之特性;依照该等语调其撷取之特性产生多个VR模型;及lossy压缩该等多个VR模型,以产生多个lossy压缩之VR模型。20.如申请专利范围第19项之VR系统,尚包括:一特性撷取模组,架构成撷取一测试语调的特性,以产生一测试语调其撷取之特性;一扩充模组,架构成扩充该等多个lossy压缩之VR模型之其中一个lossy压缩之VR模型,以产生一扩充之VR模型;及一形态匹配模组,其中使该测试语调其撷取之特性与该扩充之VR模型相匹配,以产生一辨识假设。21.一种语音辨识(VR)系统,包括:多个lossy压缩之VR模型;一特性撷取模组,架构成撷取一测试语调的特性,以产生一测试语调其撷取之特性;一扩充模组,架构成扩充该等多个lossy压缩之VR模型之其中一个lossy压缩之VR模型,以产生一扩充之VR模型;及一形态匹配模组,其中使该测试语调其撷取之特性与该扩充之VR模型相匹配,以产生一辨识假设。22.一种语音辨识(VR)训练系统,包括:一特性撷取模组,架构成撷取多个语调的特性,及产生多个VR模型给该等多个语调其撷取之特性;及一压缩模组,架构成lossy压缩该等多个VR模型。图式简单说明:图1说明一个VR系统中的一个VR前端;图2说明一个语音片段其一个范例性之隐藏马可夫模型(HMM);图3说明一个根据一具体实施例之VR系统其一个HMM模组的一个前端;图4说明一个具有一mu-定律压缩扩张设计、而非对数压缩的前端;图5说明一个具有一A-定律压缩扩张设计、而非对数压缩的前端;图6说明C=50之一个Log10()函数和该mu-对数函数之一个定点执行之标绘图;图7说明一个根据一具体实施例之利用mu-定律压缩和mu-定律扩充之前端;图8说明一个根据一具体实施例之利用A-定律压缩和A-定律扩充之前端;图9说明一个根据一具体实施例、用以产生模型之训练处理其输入、处理及输出的方块图;图10说明一个根据一具体实施例的VR系统;及图11说明一个根据一具体实施例、于语音辨识期间利用扩充压缩训练之模型的VR系统。
地址 美国
您可能感兴趣的专利