发明名称 一种网络特定内容挖掘方法和装置、及一种电子设备
摘要 本发明公开了一种网络特定内容挖掘方法和装置、及一种电子设备,其中,网络特定内容挖掘方法包括:从多条浏览器日志中分别提取第一URL和跳转自第一URL的第二URL;确定与指定网站的标识信息相匹配的第一URL;从跳转自与指定网站的标识信息相匹配的第一URL的第二URL中筛选来源于指定网站的URL;从来源于所述指定网站的URL中查找网络热点URL,将网络热点URL对应的网页内容作为网络特定内容。本发明能够更快速、更准确地挖掘出网络特定内容,并且获得的内容也更加全面。
申请公布号 CN104376066A 申请公布日期 2015.02.25
申请号 CN201410637595.1 申请日期 2014.11.05
申请人 北京奇虎科技有限公司;奇智软件(北京)有限公司 发明人 罗维
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京润泽恒知识产权代理有限公司 11319 代理人 苏培华
主权项 一种网络特定内容挖掘方法,其特征在于,包括:从多条浏览器日志中分别提取第一URL和跳转自所述第一URL的第二URL;确定与指定网站的标识信息相匹配的第一URL;从跳转自所述与指定网站的标识信息相匹配的第一URL的第二URL中筛选来源于所述指定网站的URL;从所述来源于所述指定网站的URL中查找网络热点URL,将所述网络热点URL对应的网页内容作为网络特定内容。
地址 100088 北京市西城区新街口外大街28号D座112室(德胜园区)