发明名称 一种网页信息提取方法及其设备
摘要 本发明实施例公开一种网页信息提取方法及其设备,其中方法包括如下步骤:获取所输入的网页地址对应的网页源文件,并在所述网页源文件中获取待提取的网页信息对应的特征描述信息;根据所述特征描述信息生成与所述网页信息相关联的信息提取表达式,所述信息提取表达式为JQuery表达式;采用嵌入式浏览器加载所述网页地址对应的网页源文件,并调用所述信息提取表达式在所述网页源文件加载完成后提取所述网页信息。采用本发明,可以降低定义网页信息提取的规则的复杂度,降低开发成本。
申请公布号 CN105468730A 申请公布日期 2016.04.06
申请号 CN201510815150.2 申请日期 2015.11.20
申请人 广州华多网络科技有限公司 发明人 陈仕明
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 广州三环专利代理有限公司 44202 代理人 郝传鑫;熊永强
主权项 一种网页信息提取方法,其特征在于,包括:获取所输入的网页地址对应的网页源文件,并在所述网页源文件中获取待提取的网页信息对应的特征描述信息;根据所述特征描述信息生成与所述网页信息相关联的信息提取表达式,所述信息提取表达式为JQuery表达式;采用嵌入式浏览器加载所述网页地址对应的网页源文件,并调用所述信息提取表达式在所述网页源文件加载完成后提取所述网页信息。
地址 511442 广东省广州市番禺区南村镇万博二路79号万博商务区万达商业广场北区B-1栋24层