发明名称 一种网络评论精华文章的获取方法、装置和系统
摘要 一种网络评论精华文章的获取方法、装置和系统,所述方法包括步骤:S1、提取评论中的关键字;S2、获取所提取的关键字在评论库中价值;S3、根据关键字在某一主题下出现的次数以及步骤S2中获取的关键字在评论库中的价值计算关键字在该主题下的价值;S4、计算评论的标点符号价值;S5、计算评论相似度的价值;S6、将步骤S3中计算得到的关键字价值与步骤S4中得到的符号价值以及步骤S5中计算得到的相似度价值相乘来计算每一条评论的得分;S7、在获取多条评论的得分之后,取得分超过一定阈值的评论作为精华评论。本发明通过使用计算机程序和算法自动获取精华文章,降低网络管理成本、提高文章获取精度。
申请公布号 CN102682120A 申请公布日期 2012.09.19
申请号 CN201210151075.0 申请日期 2012.05.15
申请人 合一网络技术(北京)有限公司 发明人 陈学文;张宇峰;姚健;潘柏宇;卢述奇
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种网络评论精华文章的获取方法,其特征在于包括如下步骤:S1、提取评论中的关键字;S2、获取所提取的关键字在评论库中价值;S3、根据关键字在某一主题下出现的次数以及步骤S2中获取的关键字在评论库中的价值计算关键字在该主题下的价值;S4、计算评论的标点符号价值;S5、计算评论相似度的价值;S6、将步骤S3中计算得到的关键字价值与步骤S4中得到的符号价值以及步骤S5中计算得到的相似度价值相乘来计算每一条评论的得分;S7、在获取多条评论的得分之后,取得分超过一定阈值的评论作为精华评论。
地址 100080 北京市海淀区海淀大街8号中钢国际广场A座5层A、C区