发明名称 |
语音检索的方法和系统 |
摘要 |
本发明提供了一种语音检索的方法和系统。该语音检索的方法包括:接收来自用户的检索输入;利用多组声学模型和语言模型从检索输入中提取多个检索输入语音特征并获得每个检索输入语音特征的第一置信度;分别对多个检索输入语音特征进行检索,以得到对应于每个检索输入语音特征的检索结果列表以及检索结果列表中每条结果记录的第二置信度和搜索引擎得分;根据每个语音特征的第一置信度、第二置信度和搜索引擎得分计算该语音特征的每条结果记录的检索得分并进行归一化;根据归一化的检索得分,对每个检索结果列表进行重新排序;以及把各个特征的重新排序后的检索结果列表进行合并以得到最终的检索列表。 |
申请公布号 |
CN102314876B |
申请公布日期 |
2013.04.10 |
申请号 |
CN201010212269.8 |
申请日期 |
2010.06.29 |
申请人 |
株式会社理光 |
发明人 |
史达飞;鲁耀杰;王磊;尹悦燕;郑继川 |
分类号 |
G06F17/30(2006.01)I;G10L15/26(2006.01)I;G10L15/02(2006.01)I;G10L15/08(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京市柳沈律师事务所 11105 |
代理人 |
郭定辉 |
主权项 |
一种语音检索的方法,包括以下步骤:接收来自用户的检索输入;利用多组声学模型和语言模型从所述检索输入中提取多个检索输入语音特征并获得每个检索输入语音特征的第一置信度;分别对所述多个检索输入语音特征进行检索,以得到对应于每个检索输入语音特征的检索结果列表以及所述检索结果列表中每条结果记录的第二置信度和搜索引擎得分;根据每个语音特征的第一置信度、第二置信度和搜索引擎得分计算该语音特征的每条结果记录的检索得分并进行归一化;根据归一化的检索得分,对每个检索结果列表进行重新排序;以及把各个特征的重新排序后的检索结果列表进行合并以得到最终的检索列表,其中所述分别对所述多个检索输入语音特征进行检索,以得到对应于每个检索输入语音特征的检索结果列表以及所述检索结果列表中每条结果记录的第二置信度和搜索引擎得分包括:利用索引在语音记录集合中检索所述多个检索输入语音特征,其中获得所述索引包括:从所述语音记录集合读取语音文件;利用所述多组声学模型和语言模型从所述语音文件中提取多个文件语音特征并计算每个文件语音特征的置信度作为所述第二置信度;将每个文件语音特征与其所在的语音文件、在所述语音文件中的位置以及所述第二置信度相关联;以及存储关联信息作为索引。 |
地址 |
日本东京都 |