发明名称 一种融合长跨度情感历史的语音情感识别方法
摘要 本发明公开了一种融合长跨度情感历史的语音情感识别方法。该方法包括以下步骤:利用时域和变换域上的不同参数进行端点检测,剔除原始语音序列中的非语音数据,获得待识别语音段数据;将待识别语音段数据切分为独立的语音段数据单元;利用第一支持向量机对语音段数据单元分别进行情感状态初步分类;对情感状态初步分类结果进行加窗,并利用第二支持向量机进行融合,得到融合长跨度情感历史的情感识别结果。本发明在保证对语音信号的局部单元进行高精度分类的同时,又充分利用信号序列的长跨度内的上下文信息,以达到对序列中的每一单元达到最优的分类结果。本发明能够用于语音信号的情感识别,具有实时性好、并能够大幅度提高识别精度等优点。
申请公布号 CN103531207A 申请公布日期 2014.01.22
申请号 CN201310481318.1 申请日期 2013.10.15
申请人 中国科学院自动化研究所 发明人 陶建华;杨明浩;巢林林
分类号 G10L25/63(2013.01)I;G10L15/08(2006.01)I;G10L15/06(2013.01)I 主分类号 G10L25/63(2013.01)I
代理机构 中科专利商标代理有限责任公司 11021 代理人 宋焰琴
主权项 一种融合长跨度情感历史的语音情感识别方法,其特征在于,该方法包括以下步骤:步骤S1,输入待识别的语音序列,并利用时域和变换域上的不同参数进行端点检测,剔除原始语音序列中的非语音数据,获得待识别的语音段数据;步骤S2,将所述待识别的语音段数据切分为独立的语音段数据单元;步骤S3,利用第一支持向量机对所述语音段数据单元分别进行情感状态初步分类,并将分类结果使用相应后验概率的形式来表示;步骤S4,对所述步骤S3得到的情感状态初步分类结果进行加窗,并利用第二支持向量机对所述初步分类结果进行融合,得到融合长跨度情感历史的情感识别结果。
地址 100190 北京市海淀区中关村东路95号