发明名称 一种互联网搜索引擎的搜索方法
摘要 一种互联网搜索引擎的搜索方法,该方法通过含由下载器,产品知识库服务器,产品网页数据服务器,分词器和索引器,索引数据库,查询器组成的搜索系统,执行产品数据的搜索,该方法的步骤包括通过下载器获取产品网页数据,依据产品知识库服务器中的数据通过分词器和索引器进行产品短语处理处理,得到含有相关性数据的产品网页并创建数据索引通过查询器输入用户查询并依据产品知识库服务器中的数据进行产品短语处理并获得相关性数据后生成查询结果,该搜索方法主要用于B2B垂直搜索的产搜索引擎系统内。
申请公布号 CN100557610C 申请公布日期 2009.11.04
申请号 CN200710178075.9 申请日期 2007.11.26
申请人 北京九城网络软件有限公司 发明人 王双;吴爱华;苗宇枫;谌谦;李建锋;徐光美;吴柏林
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京双收知识产权代理有限公司 代理人 解政文
主权项 1.一种互联网搜索引擎的搜索方法,该方法通过由下载器,产品知识库服务器,产品网页数据服务器,分词器和索引器,索引数据库,查询器组成的搜索系统,执行产品数据的搜索,其特征在于:该方法的步骤包括对于互联网上的产品原始网页信息,通过下载器获取产品网页数据,依据产品知识库服务器中的数据通过分词器和索引器处理产品网页数据并创建数据索引写入索引数据库,对应产品数据网页写入产品网页数据服务器,通过查询器输入用户查询并依据产品知识库服务器中的数据处理后生成查询结果,所述依据产品知识库服务器中的数据通过分词器和索引器处理产品网页数据包括如下步骤:a.获取原始网页文本,b.根据产品知识库服务器中的产品数据对网页文本进行正向最大匹配,c.判断步骤b中匹配是否成功,d.如果匹配成功,则将匹配项进行产品短语处理得到子串并进行排序,e.对步骤d中的每个子串计算相关性,并建立索引写入索引数据库,所述通过查询器输入用户查询并依据产品知识库服务器中的数据处理后生成查询结果包括如下步骤:f.读入用户输入的查询串,g.对查询串进行正向最大匹配,生成匹配项集合,h.对匹配项集合进行产品短语处理,生成子串集合并排序,按照每个子串相关性生成有效子串序列,i.对有效子串序列中的每个子串依次获取与之匹配的网页数据集合,并根据相关性大小排序输出。
地址 100070北京市丰台区南四环西路188号7区14楼