发明名称 一种基于伪说话人聚类的语音情感特征规整化方法
摘要 本发明公开了一种基于伪说话人聚类的语音情感特征规整化方法,适合应用于非特定说话人情感识别。本发明首先提取出能够反映说话人信息的特征空间;接着在此特征空间内进行模糊聚类,自动获得情感语料中的说话人的身份信息,据此信息进行“伪说话人”分组,每一条样本按照其相似程度划分到不同的伪说话人分组中;而后根据每条样本的伪说话人组别信息,进行情感特征的规整化;最终在规整化后的数据中加入相应组别的模糊隶属度信息。通过上述处理过程,使得情感特征空间中的样本分布更加清晰有效,降低了大量说话人带来的特征差异,增强了说话人鲁棒性。
申请公布号 CN103531198B 申请公布日期 2016.03.23
申请号 CN201310534319.8 申请日期 2013.11.01
申请人 东南大学 发明人 黄程韦;赵力;魏昕;王浩;查诚;余华
分类号 G10L15/02(2006.01)I;G10L25/63(2013.01)I 主分类号 G10L15/02(2006.01)I
代理机构 江苏永衡昭辉律师事务所 32250 代理人 王斌
主权项 一种基于伪说话人聚类的语音情感特征规整化方法,其特征在于包括以下步骤:步骤1,语音情感特征参数空间的提取;步骤2,说话人模糊聚类;步骤3,伪说话人情感特征规整化。
地址 210096 江苏省南京市四牌楼2号