发明名称 |
一种网络特定内容挖掘方法和装置、及一种电子设备 |
摘要 |
本发明公开了一种网络特定内容挖掘方法和装置、及一种电子设备,其中,网络特定内容挖掘方法包括:从多条浏览器日志中分别提取第一URL和跳转自第一URL的第二URL;确定与指定网站的标识信息相匹配的第一URL;从跳转自与指定网站的标识信息相匹配的第一URL的第二URL中筛选来源于指定网站的URL;从来源于所述指定网站的URL中查找网络热点URL,将网络热点URL对应的网页内容作为网络特定内容。本发明能够更快速、更准确地挖掘出网络特定内容,并且获得的内容也更加全面。 |
申请公布号 |
CN104376066A |
申请公布日期 |
2015.02.25 |
申请号 |
CN201410637595.1 |
申请日期 |
2014.11.05 |
申请人 |
北京奇虎科技有限公司;奇智软件(北京)有限公司 |
发明人 |
罗维 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京润泽恒知识产权代理有限公司 11319 |
代理人 |
苏培华 |
主权项 |
一种网络特定内容挖掘方法,其特征在于,包括:从多条浏览器日志中分别提取第一URL和跳转自所述第一URL的第二URL;确定与指定网站的标识信息相匹配的第一URL;从跳转自所述与指定网站的标识信息相匹配的第一URL的第二URL中筛选来源于所述指定网站的URL;从所述来源于所述指定网站的URL中查找网络热点URL,将所述网络热点URL对应的网页内容作为网络特定内容。 |
地址 |
100088 北京市西城区新街口外大街28号D座112室(德胜园区) |