发明名称 关键词检索方法和设备
摘要 本发明公开了一种关键词检索方法和设备。该方法包括如下步骤:接收检索关键词集合;接收音频数据及其对应的文本描述信息;将音频数据分割为多个音频段,并提取多个音频段的声学特征;在文本描述信息中搜索检索关键词集合中包括的关键词,以得到由搜索到的关键词构成的匹配关键词集合;查找检索关键词集合中的关键词在多个音频段中出现的概率,作为语言模型得分;利用声学模型根据多个音频段的声学特征计算声学模型得分;根据语言模型得分和声学模型得分计算检索关键词集合中的关键词对于多个音频段的总得分;以及根据总得分判断检索关键词集合中的关键词所在的音频段;其中,提高匹配关键词集合中的关键词对应的总得分。
申请公布号 CN103365849B 申请公布日期 2016.06.15
申请号 CN201210084525.9 申请日期 2012.03.27
申请人 富士通株式会社 发明人 赵培;刘汝杰;岩见田均
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 康建峰;李春晖
主权项 一种针对音频的关键词检索方法,其特征在于,该关键词检索方法包括如下步骤:接收检索关键词集合;接收音频数据及其对应的文本描述信息;将所述音频数据分割为多个音频段,并提取所述多个音频段的声学特征;在所述文本描述信息中搜索所述检索关键词集合中包括的关键词,以得到由搜索到的关键词构成的匹配关键词集合;查找所述检索关键词集合中的关键词在所述多个音频段中出现的概率,作为语言模型得分;提高所述匹配关键词集合中的关键词对应的语言模型得分;利用声学模型根据所述多个音频段的声学特征计算声学模型得分;根据所述语言模型得分和所述声学模型得分计算所述检索关键词集合中的关键词对于所述多个音频段的总得分;以及根据所述总得分判断所述检索关键词集合中的关键词所在的音频段。
地址 日本神奈川县