发明名称 |
音频的特征提取方法、音频的分类方法和相关装置 |
摘要 |
本发明公开了一种音频的特征提取方法、音频的分类方法和相关装置,用以解决现有技术中无法对不同时长的音频提取出相同长度的特征的问题。该方法包括:获得音频,并针对获得的每个音频执行下述操作:按照预先设置的分帧规则,对该音频进行划分,得到多个音频帧;按照预先设置的特征提取规则,分别对所述多个音频帧进行特征提取,得到各音频帧的特征;根据得到的各音频帧的特征,以及用于区别音频帧类别的各聚类中心,分别确定每个音频帧对应的聚类中心;分别确定各聚类中心所对应的音频帧的个数,并根据确定出的所述个数确定所述音频的特征。 |
申请公布号 |
CN104240719A |
申请公布日期 |
2014.12.24 |
申请号 |
CN201310255746.2 |
申请日期 |
2013.06.24 |
申请人 |
浙江大华技术股份有限公司 |
发明人 |
谢志明;潘晖;潘石柱;张兴明;傅利泉;朱江明;吴军;吴坚 |
分类号 |
G10L25/54(2013.01)I;G06F17/30(2006.01)I |
主分类号 |
G10L25/54(2013.01)I |
代理机构 |
北京同达信恒知识产权代理有限公司 11291 |
代理人 |
黄志华 |
主权项 |
一种音频的特征提取方法,其特征在于,包括:获得音频,并针对获得的每个音频执行下述操作:按照预先设置的分帧规则,对该音频进行划分,得到多个音频帧;按照预先设置的特征提取规则,分别对所述多个音频帧进行特征提取,得到各音频帧的特征;根据得到的各音频帧的特征,以及用于区别音频帧类别的各聚类中心,分别确定每个音频帧对应的聚类中心;其中,每个音频帧与其对应的聚类中心满足:在该音频帧的特征和每个聚类中心的特征的相似度中,该音频帧的特征和其对应的聚类中心的特征的相似度最大;所述各聚类中心是根据所述分帧规则分别将各个音频样本划分为多个音频样本帧,并按照所述特征提取规则提取各音频样本帧的特征后,对提取出的各音频样本帧的特征进行聚类得到的;分别确定各聚类中心所对应的音频帧的个数,并根据确定出的所述个数确定所述音频的特征。 |
地址 |
310053 浙江省杭州市滨江区滨安路1187号 |