发明名称 |
一种基于伪说话人聚类的语音情感特征规整化方法 |
摘要 |
本发明公开了一种基于伪说话人聚类的语音情感特征规整化方法,适合应用于非特定说话人情感识别。本发明首先提取出能够反映说话人信息的特征空间;接着在此特征空间内进行模糊聚类,自动获得情感语料中的说话人的身份信息,据此信息进行“伪说话人”分组,每一条样本按照其相似程度划分到不同的伪说话人分组中;而后根据每条样本的伪说话人组别信息,进行情感特征的规整化;最终在规整化后的数据中加入相应组别的模糊隶属度信息。通过上述处理过程,使得情感特征空间中的样本分布更加清晰有效,降低了大量说话人带来的特征差异,增强了说话人鲁棒性。 |
申请公布号 |
CN103531198B |
申请公布日期 |
2016.03.23 |
申请号 |
CN201310534319.8 |
申请日期 |
2013.11.01 |
申请人 |
东南大学 |
发明人 |
黄程韦;赵力;魏昕;王浩;查诚;余华 |
分类号 |
G10L15/02(2006.01)I;G10L25/63(2013.01)I |
主分类号 |
G10L15/02(2006.01)I |
代理机构 |
江苏永衡昭辉律师事务所 32250 |
代理人 |
王斌 |
主权项 |
一种基于伪说话人聚类的语音情感特征规整化方法,其特征在于包括以下步骤:步骤1,语音情感特征参数空间的提取;步骤2,说话人模糊聚类;步骤3,伪说话人情感特征规整化。 |
地址 |
210096 江苏省南京市四牌楼2号 |