发明名称 使用声音资料之用于字素至音素转换的方法、电脑系统,及与其相关的电脑可读取媒体
摘要 本发明描述使用声音资料以增进语音辨识之字素至音素转换,例如在一语音拨号系统中更正确地辨识说出之名称。本发明描述声音及字音素之一结合模型(声音资料、音素序列、字素序列以及音素序列与字素序列之间的一排列),其于使用声音资料来适应字音素模型参数中系由最大可能性训练及辨别训练加以再训练。本发明亦描述接收之声音资料之字素标记的未监督集合,藉以自动取得可被用于再训练之一实质数量的实际取样。不符合一确信临界值的语音输入可被过滤掉而不会被该再训练模型使用。
申请公布号 TWI455111 申请公布日期 2014.10.01
申请号 TW097139410 申请日期 2008.10.14
申请人 微软公司 美国 发明人 李笑;古那沃达那亚希拉JR;亚塞罗亚力詹德
分类号 G10L13/02;G10L15/26 主分类号 G10L13/02
代理机构 代理人 蔡坤财 台北市中山区松江路148号11楼;李世章 台北市中山区松江路148号11楼
主权项 一种由一电脑所执行之用于字素至音素转换的方法,该电脑包含一储存及一处理器,该方法包含以下步骤:建构一声音资料、一音素序列、一字素序列、以及该音素序列及字素序列之间的一排列,以提供一字音素模型;及藉由使用该声音资料来最佳化该字音素模型而再训练语音辨识中可使用之一字素至音素模型。
地址 美国