发明名称 |
音频文件中语音信息的搜索方法、装置及设备 |
摘要 |
本发明公开了一种音频文件中语音信息的搜索方法、装置及设备,用以实现对音频文件的内容进行全文搜索,提高音频搜索的准确度和效率,提升音频搜索的易用性。所述搜索方法,包括:对音频资源库中每一个包括语音信息的音频文件进行语音识别,转化为包括文字信息的文本文件,并对各文本文件的文字信息进行分词处理;根据每一个文本文件所包括的词提取对应的音频文件所包括的关键字,确定每一个音频文件与所包括的关键字的相关度,并结合每一个音频文件的相关信息建立关键字的索引数据库;当接收到携带特定关键字的语音信息搜索请求时,在索引数据库中进行特定关键字的匹配,并根据与特定关键字具有相关度的音频文件的相关信息提供相应的音频文件。 |
申请公布号 |
CN101996195B |
申请公布日期 |
2012.07.11 |
申请号 |
CN200910091661.9 |
申请日期 |
2009.08.28 |
申请人 |
中国移动通信集团公司 |
发明人 |
薛頔;樊科;刘威 |
分类号 |
G06F17/30(2006.01)I;G10L15/26(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京同达信恒知识产权代理有限公司 11291 |
代理人 |
郭润湘 |
主权项 |
一种音频文件中语音信息的搜索方法,其特征在于,包括:对音频资源库中每一个包括语音信息的音频文件进行语音识别,转化为包括文字信息的文本文件,并对各文本文件的文字信息进行分词处理;根据每一个文本文件所包括的词提取对应的音频文件所包括的关键字,确定每一个音频文件与所包括的关键字的相关度,并结合每一个音频文件的相关信息建立关键字的索引数据库,所述索引数据库中存储每一个关键字与每一个音频文件的相关度、以及每一个音频文件的相关信息;当接收到携带特定关键字的语音信息搜索请求时,在所述索引数据库中进行所述特定关键字的匹配,并根据与所述特定关键字具有相关度的音频文件的相关信息提供相应的音频文件。 |
地址 |
100032 北京市西城区金融大街29号 |