发明名称 一种基于参数融合优化决策的音频索引方法
摘要 本发明为一种针对真实场景下的语音数据进行音频索引的方法,将输入的语音信号进行预处理和初始化后进行声学特征提取,然后分别进行基于高斯混合模型的优化学及量子学,将高斯混合模型参数与量子学参数进行融合,最后基于分类决策给出分类结果,本发明中的量子学方法是将常规类别进行线性叠加来构建量子态,并将量子态作为计算模型的状态。将这种方法扩展为通用分类学方法,可有效地解决会议场景下多个说话人混合的通用说话人分类问题。
申请公布号 CN103985381A 申请公布日期 2014.08.13
申请号 CN201410209057.2 申请日期 2014.05.16
申请人 清华大学 发明人 杨毅;刘加;孙甲松
分类号 G10L15/08(2006.01)I 主分类号 G10L15/08(2006.01)I
代理机构 西安智大知识产权代理事务所 61215 代理人 贾玉健
主权项 一种基于参数融合优化决策的音频索引方法,其特征在于:包括以下步骤:第一步,采用声传感器进行系统输入信号采集;第二步,对所采集信号进行预处理;第三步,提取声学特征;第四步,采用高斯混合模型对声学特征建立分类模型;第五步,采用量子学习模型对声学特征建立分类模型;第六步,对上述传统优化学习和量子学习获得的模型的参数进行参数融合,得到融合模型分类器;第七步,分类决策给出分类结果;第八步,系统输出分类结果,包括全部的语音频段及其相应的分类信息。
地址 100084 北京市海淀区100084信箱82分箱清华大学专利办公室