发明名称 基于话音特征自动标识电话呼叫者
摘要 本发明提供对呼叫者进行标识的一种方法和装置。从所述呼叫者接收话音输入,并将所述话音输入的特征应用到多个声学模型,以得到多个对应的声学得分,其中,所述多个声学模型包括一通用声学模型和任何先前被标识的呼叫者的声学模型。基于所述多个声学得分,所述呼叫者被标识为先前被标识的呼叫者之一或新的呼叫者。如果呼叫者被标识为新的呼叫者,就为所述新的呼叫者生成一新的声学模型,它对所述新的呼叫者是专用的。
申请公布号 CN1655235B 申请公布日期 2012.01.25
申请号 CN200410081877.4 申请日期 2004.12.31
申请人 微软公司 发明人 A·帕斯科维西
分类号 G10L15/08(2006.01)I;G10L15/00(2006.01)I;H04M3/436(2006.01)I;H04M1/253(2006.01)I 主分类号 G10L15/08(2006.01)I
代理机构 上海专利商标事务所有限公司 31100 代理人 谢喜堂
主权项 一种标识呼叫者的方法,其特征在于,所述方法包括:(a)从所述呼叫者接收话音输入;(b)把所述话音输入的特征应用到多个声学模型以获得多个对应的声学分数,所述多个声学模型包括一通用声学模型和任何先前标识的呼叫者的声学模型,其中所述通用声学模型包括多个语音单元的呼叫者不相关模型;(c)基于所述多个声学分数,把所述呼叫者标识为所述先前标识的呼叫者之一或新的呼叫者;以及(d)如果在步骤(c)中所述呼叫者被标识为新的呼叫者,则从所述通用声学模型的呼叫者不相关模型中为所述新的呼叫者生成一新的声学模型,并修改被包括在所述语音输入中的语音单元的呼叫者不相关模型,以表示接收自所述新的呼叫者的话音输入的特征;以及(e)使用所述先前标识的呼叫者的多个声学模型之间的一距离量度,以标记某些声学模型用于将所标记的声学模型合并在一起。
地址 美国华盛顿州