发明名称 |
一种音频数据分类方法及装置 |
摘要 |
本发明公开了一种音频数据分类方法,用以解决现有技术中存在的处理快慢不同的音频数据序列时,分类处理效果不好的问题。通过本发明实施例提供的技术方案,由于对同一段未知类别的音频数据序列进行了至少两次划分,得到了长短不一的多个音频数据子序列,从而相当于提高了该未知类别的音频数据序列的适应性,使之能够适用于分类器的训练样本中较快音频数据占比比较高,以及分类器的训练样本中较慢音频数据占比比较高的等不同情况。从而这样的方法适用性更广,对于快慢节奏不同的音频数据有较好的鲁棒性。 |
申请公布号 |
CN104239372A |
申请公布日期 |
2014.12.24 |
申请号 |
CN201310254043.8 |
申请日期 |
2013.06.24 |
申请人 |
浙江大华技术股份有限公司 |
发明人 |
谢志明;潘晖;潘石柱;张兴明;傅利泉;朱江明;吴军;吴坚 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京同达信恒知识产权代理有限公司 11291 |
代理人 |
黄志华 |
主权项 |
一种音频数据分类方法,其特征在于,包括:对未知类别的音频数据序列进行至少两次划分;其中,每次对所述未知类别的音频数据序列进行划分,均得到对所述未知类别的音频数据序列进行本次划分而获得的多个音频数据子序列构成的集合;且得到的各个集合中的任一集合包含的音频数据子序列的长度不同于其他集合包含的音频数据子序列的长度;针对所述各个集合中的每个音频数据子序列分别执行:按照对音频数据样本进行分类训练时采用的特征提取方法,提取该音频数据子序列的特征;通过比较该音频数据子序列的特征和对所述音频数据样本进行所述分类训练而得到的各个音频数据类别里的音频数据样本子序列的特征,得到分类结果;根据针对所述每个音频数据子序列分别得到的所述分类结果,确定未知类别的音频数据序列的类别。 |
地址 |
310053 浙江省杭州市滨江区滨安路1187号 |