发明名称 基于信息检索的互联网新闻影响力定量分析工具及方法
摘要 基于信息检索的互联网新闻影响力定量分析工具及方法,工具包括:网页内容判重模块判断网页是否为近似网页;相关信息提取模块提取网页中相关信息;新闻转载率计算模块计算转载网站权威度值;找出新闻源网站和新闻转载率;新闻信源网站影响力确定模块判断新闻源网站的人气指数,获取新闻信源网站影响力因子;新闻回复率计算模块确定网络新闻回复率;新闻影响力计算模块计算新闻影响力值。方法是判断网页是否为近似网页,提取新闻网页转载信息和回复信息,计算新闻转载率,计算新闻的回复率,计算新闻源网站的权威度,计算新闻源网站的影响力因子,计算新闻影响力。本发明定量计算结果与用户的定性分析结合,帮助用户对新闻影响力大小进行判断。
申请公布号 CN101409634A 申请公布日期 2009.04.15
申请号 CN200710175668.X 申请日期 2007.10.10
申请人 中国科学院自动化研究所 发明人 杨伟杰;戴汝为;崔霞;王春恒
分类号 H04L12/24(2006.01)I;G06F17/30(2006.01)I 主分类号 H04L12/24(2006.01)I
代理机构 中科专利商标代理有限责任公司 代理人 梁爱荣
主权项 1、一种基于信息检索的互联网新闻影响力定量分析工具,其特征在于,包括:网页内容判重模块,接收网页内容用于判断网页是否为近似网页;信息提取模块,接收近似网页信息,从近似网页中抽取后续计算需要的相关信息;新闻转载率计算模块:接收信息提取模块中提取到的相关信息,计算转载网站的权威度值,之后把权威度最高的那个网站作为新闻的源网站,并把此网站的权威度值作为新闻转载率;新闻信源网站影响力确定模块:用于判断新闻源网站的人气指数CIIS值,并把此指数归一化之后作为新闻信源网站影响力因子;新闻回复率计算模块:用于确定网络新闻的回复率;新闻影响力计算模块:用于通过以上模块得到的网络新闻转载率值、新闻信源网站的影响力因子值和新闻回复率值计算新闻影响力值。
地址 100080北京市海淀区中关村东路95号