发明名称 |
一种互联网信息垂直搜索方法 |
摘要 |
本发明公开了一种互联网信息垂直搜索方法,包括步骤:A.建立搜索配置文件,搜索配置文件中存储生成不同URL地址的正则表达式组和产生搜索结果信息对的正则表达式组;B.建立包括不同层次结点的动态搜索树的根结点和相应的数据结构,同时根据URL地址获取网页源代码,将网页源代码存储到所述数据结构中,对所述网页源代码和生成不同URL地址的正则表达式组进行匹配操作,根据匹配结果生成所述动态搜索树的子结点;C.对所述网页源代码和产生搜索结果信息对的正则表达式组进行匹配操作,根据匹配结果提取最终搜索结果信息对,存储最终搜索结果信息对。 |
申请公布号 |
CN101604328A |
申请公布日期 |
2009.12.16 |
申请号 |
CN200910108514.8 |
申请日期 |
2009.07.06 |
申请人 |
深圳市汇海科技开发有限公司 |
发明人 |
陈晓文;张代军 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
1、一种互联网信息垂直搜索方法,其特征在于,包括步骤:A、建立搜索配置文件,搜索配置文件中存储生成不同URL地址的正则表达式组和产生搜索结果信息对的正则表达式组;B、建立包括不同层次结点的动态搜索树的根结点和相应的数据结构,同时根据URL地址获取网页源代码,将网页源代码存储到所述数据结构中,对所述网页源代码和生成不同URL地址的正则表达式组进行匹配操作,根据匹配结果生成所述动态搜索树的子结点;C、对所述网页源代码和产生搜索结果信息对的正则表达式组进行匹配操作,根据匹配结果提取最终搜索结果信息对,存储最终搜索结果信息对。 |
地址 |
518048广东省深圳市福田区民田路171号新华保险大厦26楼2605室 |