发明名称 领域自适应的观点数据分类方法及装置
摘要 本发明公开一种领域自适应的观点数据分类方法,属于互联网技术领域。包括:确定源领域检索词矩阵及目标领域检索词矩阵;确定源领域目标函数及目标领域目标函数;根据源领域目标函数及目标领域目标函数确定总目标函数;分别确定总目标函数中各个参数的目标值;根据各个参数的目标值及源领域中的已标注观点数据,训练指定分类模型,通过训练得到的指定分类模型对目标领域的观点数据进行分类。由于总目标函数与源领域特定话题矩阵、目标领域特定话题矩阵及表示源领域与目标领域间的共享话题的枢纽矩阵有关,从而提供一种借助共享话题实现领域自适应的观点数据分类方法。由于共享话题能够减小源领域与目标领域间的差异,从而可确保分类结果的准确性。
申请公布号 CN106294506A 申请公布日期 2017.01.04
申请号 CN201510316353.7 申请日期 2015.06.10
申请人 华中师范大学;腾讯科技(深圳)有限公司 发明人 周光有;张小鹏;肖磊;刘婷婷;王巨宏
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京三高永信知识产权代理有限责任公司 11138 代理人 刘映东
主权项 一种领域自适应的观点数据分类方法,其特征在于,所述方法包括:根据源领域的文档与检索词之间的关系,确定源领域检索词矩阵;根据目标领域的文档与检索词之间的关系,确定目标领域检索词矩阵;根据所述源领域检索词矩阵、源领域特定话题矩阵、所述源领域特定话题矩阵的系数矩阵及所述源领域与所述目标领域之间的枢纽矩阵,确定源领域目标函数;根据所述目标领域检索词矩阵、目标领域特定话题矩阵、所述目标领域特定话题矩阵的系数矩阵及所述枢纽矩阵,确定目标领域目标函数;根据所述源领域目标函数及所述目标领域目标函数,确定总目标函数;分别确定所述总目标函数中各个参数的目标值;根据所述各个参数的目标值及所述源领域中的已标注观点数据,训练指定分类模型,通过训练得到的指定分类模型对所述目标领域的观点数据进行分类。
地址 430070 湖北省武汉市洪山区珞瑜路152号