发明名称 智能搜索网站内容分类数据系统
摘要 一种基于搜索引擎和智能数据挖掘技术的,用于收集网络地址和分类网站内容的网站分类数据库系统。本发明属于信息技术领域,的目的在于通过搜索引擎和数据挖掘技术的结合,提供100%准确度的网站内容分类数据库,从而为互联网内容管理提供有效数据和服务。具体流程如下:1.通过网络爬虫技术,自研开发前端搜索引擎进行全球网站搜索,下载网站内容。2.通过上下文关联智能分析和关键字组合,自动对网站进行分类。3.通过人工检索的方式对分类数据进行核实。4.通过后台搜索引擎进行数据库地址维护和更新。
申请公布号 CN101311929A 申请公布日期 2008.11.26
申请号 CN200810094594.1 申请日期 2008.05.15
申请人 吕晓东 发明人 吕晓东
分类号 G06F17/30(2006.01) 主分类号 G06F17/30(2006.01)
代理机构 代理人
主权项 1.一种基于搜索引擎和智能数据挖掘技术的,用于收集网络地址和分类网站内容的网站分类数据库系统。它的特征是通过一款自研开发的搜索引擎,对互联网网址进行搜索和收集,并附以智能分类和人工核实等方法,形成互连网网站域名和IP地址分类数据库。具体内容如下:(1)对互联网进行无条件大规模搜索,网站地址和域名收入数据库(2)通过关键字识别、上下文匹配以及人工核实,按照网站内容形成网站地址和域名分类数据库。(3)通过IP地址核查机制对数据库进行更新维护。
地址 100085北京市海淀区上地六街17号康得大厦5层6518室