发明名称 |
用于文本和语音分类的区别性语言模型训练 |
摘要 |
本发明公开了一种估计语言模型的方法,使得给定字串的类的条件似然最大化,其中该字串与分类精度非常相关。该方法包括对所有类联合的调节统计语言模型参数,使得对于给定的训练句子或发声,分类器区分出正确的类和不正确的类。本发明的特定实施例用于实现用于n-字符列分类器的区别性训练方法的上下文中的有理函数增长变换。 |
申请公布号 |
CN1573926B |
申请公布日期 |
2010.05.26 |
申请号 |
CN200410059511.7 |
申请日期 |
2004.06.03 |
申请人 |
微软公司 |
发明人 |
C·切尔巴;A·阿塞罗;M·马哈间 |
分类号 |
G10L15/14(2006.01)I;G10L15/06(2006.01)I |
主分类号 |
G10L15/14(2006.01)I |
代理机构 |
上海专利商标事务所有限公司 31100 |
代理人 |
张政权 |
主权项 |
一种计算机实现的方法,包括:为多个语言模型估计一组参数,所述多个语言模型的每一个对应于不同的类,其中每一个类对应于不同种类主题,所述估计包括:为参数组设定初始值;联合地相对于另一个参数组调节参数组,以提高给定字串的类的条件似然;通过基于平滑调节所述参数组,训练所述参数组以适应未见过的数据;其中调节包括利用主数据和提供的数据进行调节;利用计算机处理器来应用所述一组参数,以作出关于所述多个类中的哪一个表示与给出的自然语言输入最为相关的主题的种类的决定。 |
地址 |
美国华盛顿州 |