发明名称 |
一种网络评论精华文章的获取方法、装置和系统 |
摘要 |
一种网络评论精华文章的获取方法、装置和系统,所述方法包括步骤:S1、提取评论中的关键字;S2、获取所提取的关键字在评论库中价值;S3、根据关键字在某一主题下出现的次数以及步骤S2中获取的关键字在评论库中的价值计算关键字在该主题下的价值;S4、计算评论的标点符号价值;S5、计算评论相似度的价值;S6、将步骤S3中计算得到的关键字价值与步骤S4中得到的符号价值以及步骤S5中计算得到的相似度价值相乘来计算每一条评论的得分;S7、在获取多条评论的得分之后,取得分超过一定阈值的评论作为精华评论。本发明通过使用计算机程序和算法自动获取精华文章,降低网络管理成本、提高文章获取精度。 |
申请公布号 |
CN102682120A |
申请公布日期 |
2012.09.19 |
申请号 |
CN201210151075.0 |
申请日期 |
2012.05.15 |
申请人 |
合一网络技术(北京)有限公司 |
发明人 |
陈学文;张宇峰;姚健;潘柏宇;卢述奇 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种网络评论精华文章的获取方法,其特征在于包括如下步骤:S1、提取评论中的关键字;S2、获取所提取的关键字在评论库中价值;S3、根据关键字在某一主题下出现的次数以及步骤S2中获取的关键字在评论库中的价值计算关键字在该主题下的价值;S4、计算评论的标点符号价值;S5、计算评论相似度的价值;S6、将步骤S3中计算得到的关键字价值与步骤S4中得到的符号价值以及步骤S5中计算得到的相似度价值相乘来计算每一条评论的得分;S7、在获取多条评论的得分之后,取得分超过一定阈值的评论作为精华评论。 |
地址 |
100080 北京市海淀区海淀大街8号中钢国际广场A座5层A、C区 |