发明名称 基于支持向量机的不良语音识别方法
摘要 本发明涉及一种基于支持向量机的不良语音识别方法。本发明首先获取输入语音流,解码为原始语音信号,并进行预处理操作;其次对预处理后的语音数据进行加窗分帧处理;再对每帧语音提取移位差分倒谱参数特征;并对移位差分倒谱参数特征采用高斯混合模型进行分类;然后对分类为不良语音的候选帧采用SVM分类器进行分类,确认最终的不良语音帧;最后根据一定时间内不良语音帧的数量来提取不良语音片段并进行存储。本发明中的多高斯混合模型可以实现快速的分类,提取出候选不良语音帧,而支持向量机分类器可以提高分类的准确性。
申请公布号 CN102708861A 申请公布日期 2012.10.03
申请号 CN201210197377.1 申请日期 2012.06.15
申请人 天格科技(杭州)有限公司;杭州电子科技大学;金华就约我吧网络科技有限公司 发明人 傅政军;姚金良;王小华;黄金海;周建政;周渝清;严俊杰
分类号 G10L15/14(2006.01)I;G10L15/02(2006.01)I;G10L19/02(2006.01)I 主分类号 G10L15/14(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 杜军
主权项 基于支持向量机的不良语音识别方法,其特征在于该方法包括以下步骤:步骤1:获取输入语音流,将语音流解码为原始语音信号,并进行预处理操作;步骤2:对预处理后的语音数据进行加窗分帧处理;步骤3:对每帧语音提取移位差分倒谱参数特征;  步骤4:对移位差分倒谱参数特征采用高斯混合模型进行分类;步骤5:对分类为不良语音的候选帧采用SVM分类器进行分类,确认最终的不良语音帧;步骤6:根据一定时间内不良语音帧的数量来提取不良语音片段并进行存储。
地址 310005 浙江省杭州市湖墅南路186号3A08