发明名称 |
音频数据分析装置和方法 |
摘要 |
本发明提供了一种用SVM方法对音频数据进行分析的分析装置,其特征在于,包括:输入单元,用于输入音频流;预处理单元,用于对所述音频流进行预处理,得到所述音频流的每一帧的特征参数;分类单元,按照所述特征参数分析所述每一帧所属的类别;以及后处理单元,对所述分类单元的分类结果进行后处理,得到最终的分段结果,其中,所述特征参数包括:短时平均能量、子带能量、过零率、Mel频域倒谱系数、ΔMel频域倒谱系数、谱通量和基音频率。根据本发明,实现了精彩内容的快速检索,能够节省观众的时间,满足观众的观看需求。 |
申请公布号 |
CN101685446A |
申请公布日期 |
2010.03.31 |
申请号 |
CN200810161401.X |
申请日期 |
2008.09.25 |
申请人 |
索尼(中国)有限公司 |
发明人 |
刘昆;吴伟国 |
分类号 |
G06F17/30(2006.01)I;G10L11/00(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京康信知识产权代理有限责任公司 |
代理人 |
余 刚;吴孟秋 |
主权项 |
1.一种用SVM方法对音频数据进行分析的分析装置,其特征在于,包括:输入单元,用于输入音频流;预处理单元,用于对所述音频流进行预处理,得到所述音频流的每一帧的特征参数;分类单元,按照所述特征参数分析所述每一帧所属的类别;以及后处理单元,对所述分类单元的分类结果进行后处理,得到最终的分段结果,其中,所述特征参数包括:短时平均能量;子带能量;过零率;Mel频域倒谱系数;ΔMel频域倒谱系数;谱通量;和基音频率。 |
地址 |
100027北京市朝阳区东三环北路霞光里18号佳程大厦A座25层 |