发明名称 一种基于三元组的用户评论摘要的生成方法与系统
摘要 本发明公开了一种基于三元组的用户评论摘要的生成方法与系统,该方法包括如下步骤:建立对象的特征词库、映射词表与情感词库,并根据特征词库构建特征树;抓取用户评论网页;接收用户评论;对每一个用户评论逐一进行处理,生成各自基于评论三元组的评论摘要;归纳整合所有用户评论的评论三元组,生成决策三元组;计算特征和情感词极性相同的决策三元组的数量;抽取所有的决策三元组生成决策摘要。利用本方法或系统,为每个用户评论生成评论摘要,以便于用户查看参考,并且将所有的评论三元组归纳整合,生成具有指导意义的决策三元组,并抽取全部决策三元组生成能反映总体评价结果、具有决策辅助作用的决策摘要,从而辅助用户快速地做出正确决策。
申请公布号 CN102236722A 申请公布日期 2011.11.09
申请号 CN201110236683.7 申请日期 2011.08.17
申请人 广州索答信息科技有限公司 发明人 石忠民;徐亚波;杜伟夫
分类号 G06F17/30(2006.01)I;G06Q30/00(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州市越秀区哲力专利商标事务所(普通合伙) 44288 代理人 汤喜友
主权项 一种基于三元组的用户评论摘要的生成方法,其特征在于,包括:步骤1.建立对象的特征词库、映射词表与情感词库,并根据特征词库中的特征构建对象的特征树,其中,映射词表中的映射词与特征词库中的特征映射对应,情感词库包括正面情感词库和负面情感词库,特征树顶端的根节点是对象,根节点下的各层叶子节点是对象的特征,并且下一层叶子节点是对应的上一层叶子节点的子特征,上一层叶子节点是对应的下一层叶子节点的父特征;步骤2.从互联网定向抓取对象的用户评论网页;步骤3.接收用户评论网页中对象所有的用户评论;步骤4.对每一个用户评论逐一进行如下处理,生成各自的评论摘要:步骤41.根据特征词库和映射词表抽取对象的特征;步骤42.根据情感词库识别情感词;步骤43.搭配特征和情感词,生成基于对象、特征、情感词的评论三元组;步骤44.抽取评论三元组生成该用户评论的评论摘要;以及,该方法还包括:步骤5.归纳整合所有用户评论的评论三元组,将以特征树第一层叶子节点以下的叶子节点为特征的评论三元组的特征归结到其对应的第一层叶子节点上,生成全部以特征树第一层叶子节点为特征的决策三元组;步骤6.计算特征和情感词极性相同的决策三元组的数量,如果数量等于1,用这个决策三元组和数量组合来表示这个决策三元组,如果数量大于1,用其中任意一个决策三元组和数量组合来表示这些具有相同特征和情感词极性的决策三元组;步骤7.以决策三元组和数量组合的表示形式抽取所有的决策三元组生成所有用户评论的决策摘要。
地址 510663 广东省广州市萝岗区科学城科学大道182号创新大厦C1-1101