发明名称 一种多层索引语音文档检索方法及其系统
摘要 本发明公开了一种多层索引语音文档检索方法及其系统,属于信息检索技术领域。本发明的方法为:1)对多媒体流进行特征提取,得到语音特征序列;2)利用语音识别解码器对语音特征序列进行搜索,得到词网格以及最优识别结果;3)根据词网格和最优识别结果,构建词和音子双层索引库;4)对给定的检索词在索引库中查找相关的文档并将其返回给用户。本发明的系统包括自动语音识别模块,用于完成自动识别音频文件中文字的任务;自动语音文档索引构建模块,用于完成对语音识别结果构建双重索引的任务;语音文档检索模块,用于对给定的检索词在索引库中查找相关的文档并将其返回给用户。与现有技术相比,本发明可实现对多媒体资料的快速准确的查找。
申请公布号 CN101510222A 申请公布日期 2009.08.19
申请号 CN200910131828.X 申请日期 2009.04.08
申请人 北京大学 发明人 吴玺宏;迟惠生;曲天书;万广鲁
分类号 G06F17/30(2006.01)I;G10L15/08(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京君尚知识产权代理事务所(普通合伙) 代理人 邵可声
主权项 1、一种多层索引语音文档检索方法,其步骤为:1)对多媒体流进行特征提取,得到语音特征序列;2)利用基于加权有限状态转换器的语音识别解码器对语音特征序列进行搜索,得到词网格以及最优识别结果;3)根据词网格和最优识别结果,构建词和音子双层索引库;4)对给定的检索词在索引库中查找相关的文档并将其返回给用户。
地址 100871北京市海淀区颐和园路5号北京大学