发明名称 一种语音中检测关键词的方法和装置
摘要 本发明实施例公开了一种语音中检测关键词的方法和装置,属于音频处理领域。方法包括:将字网格中的弧进行优化,并聚类为混淆网络,并建立索引定位所述待检索关键词中的每个目标拼音在混淆网络中的位置,通过将字网格转成混淆网络,使强迫竞争词在同一个组里,使网格中在同一时间间隔出现的词按时间自然排序,直接利用混淆网络中词的后验概率作为置信度得分,由于混淆网络比网格占用空间小,结构简单且易于索引,并混淆网络中将不同调的拼音看作相同拼音进行查找,从而有效降低了漏检率,提高了查找效率。
申请公布号 CN103730115A 申请公布日期 2014.04.16
申请号 CN201310740533.9 申请日期 2013.12.27
申请人 北京捷成世纪科技股份有限公司 发明人 李伟浩;苏鹏宇
分类号 G10L15/08(2006.01)I;G10L15/183(2013.01)I 主分类号 G10L15/08(2006.01)I
代理机构 北京庆峰财智知识产权代理事务所(普通合伙) 11417 代理人 刘元霞
主权项 一种语音中检测关键词的方法,其特征在于,包括如下步骤:对输入语音进行声学解码,根据声学编码对应的声学特征确定输入语音对应的候选词序列,并根据候选词序列和对应的回溯路径、匹配得分生成词候选网格;将所述词候选网格进行拆分,形成以拼音为单位的候选字网格;将所述候选字网格中的弧进行优化,并聚类为混淆网络;根据混淆网络的格式,对每个拼音建立逆向索引;将待检索关键词转换成目标拼音,并通过所述逆向索引定位所述待检索关键词中的每个目标拼音在混淆网络中的位置,根据混淆网络中各目标拼音的时序关系及对应的置信度判断所述待检索关键词是否出现在语音中。
地址 100191 北京市海淀区知春路1号学院国际大厦7层