发明名称 一种语音数据处理方法及系统
摘要 本发明实施例公开了一种语音数据处理方法及系统,其中,所述方法包括:将待处理语音数据划分为语音片段;提取各个语音片段中的声学特征,并获取各个语音片段在所述语音数据中的上下文信息;针对各个语音片段,根据所述上下文信息以及分别在各种情感状态下建立的基于上下文信息的语音片段分类模型,确定语音片段在各种情感状态下分别所属的语音片段类别;根据语音片段中的声学特征以及预先针对所述所属的语音片段类别建立的情感模型,确定语音片段属于各种情感状态的概率,并根据所述概率,确定语音片段所属的情感状态以便根据所述语音片段所属的情感状态,对所述待处理语音数据进行情感识别。通过本发明,能够提高语音情感识别的有效性及准确度。
申请公布号 CN102831891B 申请公布日期 2014.11.05
申请号 CN201110166864.7 申请日期 2011.06.13
申请人 富士通株式会社 发明人 王彬;刘汝杰
分类号 G10L15/02(2006.01)I;G10L15/183(2013.01)I;G10L17/26(2013.01)I;G10L25/63(2013.01)I 主分类号 G10L15/02(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 王萍;陈炜
主权项 一种语音数据处理方法,所述方法包括:将待处理语音数据划分为语音片段;提取各个所述语音片段中的声学特征,并获取各个所述语音片段在所述语音数据中的上下文信息;针对各个所述语音片段,根据所述上下文信息以及分别在各种情感状态下建立的基于上下文信息的语音片段分类模型,确定所述语音片段在各种情感状态下分别所属的语音片段类别;根据所述语音片段中的声学特征以及预先针对所述所属的语音片段类别建立的情感模型,确定所述语音片段属于各种情感状态的概率,并根据所述概率,确定所述语音片段所属的情感状态以便根据所述语音片段所属的情感状态,对所述待处理语音数据进行情感识别。
地址 日本神奈川县