发明名称 用于音频内容识别的分类系统
摘要 一种音频内容分类系统,包括训练端与测试端,训练端通过音频特征提取模块提取音频测试样本的特征,并通过分类器训练模块训练出分类器的参数;而测试端包括与训练端共用的音频特征提取模块用以提取输入信号的音频特征,而分类器决策模块是根据音频特征提取模块的输出音频特征为输入,对第一帧运用训练部分训练得到的分类器参数进行分类,同时瞬态特征提取模块对该输入信号的瞬态特征进行提取并输出至瞬态特征平滑模块,该瞬态特征平滑模块来对分类器决策模块的输出结果进行修正并输出,同时增量学模块利用已分类的音频帧的类别信息和特征信息来当作一组增量学样本更新分类器的参数。
申请公布号 CN101546556A 申请公布日期 2009.09.30
申请号 CN200810035351.0 申请日期 2008.03.28
申请人 展讯通信(上海)有限公司 发明人 黄鹤云;林福辉
分类号 G10L15/08(2006.01)I;G10L15/02(2006.01)I;G10L15/06(2006.01)I;G10L15/16(2006.01)I 主分类号 G10L15/08(2006.01)I
代理机构 上海和跃知识产权代理事务所 代理人 董烨飞
主权项 1. 一种音频内容分类系统,包括训练端与测试端,其特征在于训练端包括:音频特征提取模块,用以提取音频测试样本的特征;分类器训练模块,其根据音频特征提取模块采集的音频特征以及该音频信号的类别信息,训练出分类器的参数;而测试端包括:和训练端共用的音频特征提取模块;分类器决策模块,根据音频特征提取模块的输出音频特征为输入,对第一帧运用训练部分训练得到的分类器参数进行分类;瞬态特征提取模块,对该输入信号的瞬态特征进行提取并输出至瞬态特征平滑模块;该瞬态特征平滑模块来对分类器决策模块的输出结果进行修正并输出;增量学习模块利用已分类的音频帧的类别信息和特征信息来当作一组增量学习样本更新分类器的参数。
地址 201203上海市浦东张江祖冲之路2288弄展讯中心1号楼