发明名称 一种网络新闻概要提取方法
摘要 本发明提供了一种网络新闻概要提取方法,首先获取网络新闻,对网络新闻中的文字基于中文词汇链提取关键词,基于深度学算法进行图片分类;建立新闻ID,新闻入库;新闻对比。本发明根据网络新闻中的文字信息提取关键摘要并对新闻图片进行分类,形成新闻ID,实现了一篇新闻对应一项新闻ID,极大降低了系统的存储要求,提高了存储效率。通过所提及的新闻库的不断实时更新以及提供的快速查询与添加等功能,提高了检索新闻的效率,极大降低了工作人员查看、评价新闻的工作量,起到了有效的新闻甄别辅助工作。
申请公布号 CN106021442A 申请公布日期 2016.10.12
申请号 CN201610323611.9 申请日期 2016.05.16
申请人 江苏大学 发明人 梁军;张飞云;陈龙;马世典;蔡英凤;刘擎超;陈小波;周卫琪;袁朝春;景鹏
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I;G06N3/02(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种网络新闻概要提取方法,其特征在于,包括以下步骤:(1)获取网络新闻;(2)对网络新闻中的文字基于中文词汇链提取关键词;(3)基于深度学习算法进行图片分类;首先,采集图像,对获取的图像进行标注,构建卷积神经网络结构,将标注好的图像送至构建的卷积神经网络中,进行训练;输出新闻分类结果;(4)建立新闻ID,新闻入库;(5)新闻对比;(5.1)用户输入需要搜索的相似新闻个数K以及输入待对比且未录入新闻库的一则新闻;(5.2)经过步骤(2)、(3)、(4),建立待对比且未录入新闻库的一则新闻的新闻ID,并入库;根据该新闻的图片,利用基于深度学习的图片分类中的soft‑max函数输出K个由高到低的函数值,对应与该新闻相似程度由高到低的K个新闻,输出K个新闻的新闻ID;(5.3)对输出K个新闻的新闻ID进行判断,若为同一类则输出所述的K个新闻作为相似新闻,若不是同一类,则重复步骤(5.2)。
地址 212013 江苏省镇江市京口区学府路301号