发明名称 互联网资讯信息热点预测方法
摘要 本发明涉及网络信息采集和分析方法,具体涉及互联网资讯信息热点预测方法,本发明提供的互联网资讯信息热点预测方法,是基于目前资讯信息热点预测的广泛需求及遇到的瓶颈,针对Web2.0下互联网信息活动中用户高度参与的特点,建立了热点资讯信息评价模型,并给出了互联网热度评价算法。实验结果表明算法能够综合利用用户反馈和网页等信息来准确的评价信息热度。
申请公布号 CN104035960A 申请公布日期 2014.09.10
申请号 CN201410192780.4 申请日期 2014.05.08
申请人 东莞市巨细信息科技有限公司 发明人 郗旻;张金领
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京信慧永光知识产权代理有限责任公司 11290 代理人 周详
主权项 互联网资讯信息热点预测方法,其特征在于:包括以下步骤, (1)通过网络爬虫定期采集互联网上的资讯信息及该资讯信息相关的网民的参与情况,所述资讯信息包括标题、关键字、摘要、正文内容,所述的资讯信息相关的网民参与情况包括参与数和点击时间,所述的参与数包括点击数、评论数; (2)对上述采集到的资讯信息进行预处理,所述的预处理包括过滤垃圾信息和数据排重,最后将预处理后的资讯信息保存到数据库中; (3)对预处理后的资讯信息进行聚类分析,把内容有关联的信息运用聚类算法聚合到一起形成一个事件,最终输出为一系列事件集合; (4)循环第(3)步骤输出的结果事件集合,汇总每一个事件中资讯信息的点击数和评论数,把汇总后的点击数和评论数作为该事件的点击数和评论数,保存到数据库; (5)循环第(3)步骤输出的结果事件集合,计算每一个事件的得分,然后保存到数据库; (6)循环第(5)步骤输出的结果事件集合,按照事件得分的高低进行倒序排序,其中得分最高的为最热事件; (7)选择第(6)步骤计算的结果中排序靠前的n条事件,然后根据预测模型预测事件未来的发展趋势和热度,如果事件的热度处于上升趋势则作为重点事件进行分析和监控。 
地址 523808 广东省东莞市松山湖高新技术产业开发区松科苑12号楼103室