发明名称 基于多任务学的中文交互文本情感与话题识别方法
摘要 本发明公开了一种基于多任务学的中文交互文本情感与话题识别方法:在中文交互文本的特征提取阶段,本发明结合中文交互文本的交互特性提取交互文本的倾向性特征;在情感与话题识别阶段,本发明采用基于上下文的多任务分类模型构建方法对交互文本的训练样本进行多任务分类模型构建;针对e-Learning系统中新用户或不活跃用户的倾向性特征数据缺失导致分类效果差的问题,本发明采用随机游走与多任务学相结合的方法来识别新用户或不活跃用户情感与话题的类别。
申请公布号 CN105260356A 申请公布日期 2016.01.20
申请号 CN201510654583.4 申请日期 2015.10.10
申请人 西安交通大学 发明人 刘均;包洪英;张玲玲
分类号 G06F17/27(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 西安通大专利代理有限责任公司 61200 代理人 徐文权
主权项 基于多任务学习的中文交互文本情感与话题识别方法,其特征在于,包括以下步骤:1)中文交互文本的特征提取将中文交互文本的每条话轮表示为特征项集合,根据人与人之间的交互历史数据提取交互文本的倾向性特征;2)中文交互文本情感与话题识别采用多任务学习方法识别中文交互文本的情感与话题,利用基于上下文的多任务分类模型构建方法识别中文交互文本的情感与话题;3)对新用户和不活跃用户的情感和话题识别效果进行改进采用随机游走与多任务学习相结合的方法,利用历史数据丰富并且分类精度高的老用户或活跃用户的数据来协助预测新用户或不活跃用户情感与话题的类别。
地址 710049 陕西省西安市咸宁西路28号