发明名称 音频数据分析装置和方法
摘要 本发明提供了一种用SVM方法对音频数据进行分析的分析装置,其特征在于,包括:输入单元,用于输入音频流;预处理单元,用于对所述音频流进行预处理,得到所述音频流的每一帧的特征参数;分类单元,按照所述特征参数分析所述每一帧所属的类别;以及后处理单元,对所述分类单元的分类结果进行后处理,得到最终的分段结果,其中,所述特征参数包括:短时平均能量、子带能量、过零率、Mel频域倒谱系数、ΔMel频域倒谱系数、谱通量和基音频率。根据本发明,实现了精彩内容的快速检索,能够节省观众的时间,满足观众的观看需求。
申请公布号 CN101685446A 申请公布日期 2010.03.31
申请号 CN200810161401.X 申请日期 2008.09.25
申请人 索尼(中国)有限公司 发明人 刘昆;吴伟国
分类号 G06F17/30(2006.01)I;G10L11/00(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京康信知识产权代理有限责任公司 代理人 余 刚;吴孟秋
主权项 1.一种用SVM方法对音频数据进行分析的分析装置,其特征在于,包括:输入单元,用于输入音频流;预处理单元,用于对所述音频流进行预处理,得到所述音频流的每一帧的特征参数;分类单元,按照所述特征参数分析所述每一帧所属的类别;以及后处理单元,对所述分类单元的分类结果进行后处理,得到最终的分段结果,其中,所述特征参数包括:短时平均能量;子带能量;过零率;Mel频域倒谱系数;ΔMel频域倒谱系数;谱通量;和基音频率。
地址 100027北京市朝阳区东三环北路霞光里18号佳程大厦A座25层
您可能感兴趣的专利