发明名称 |
基于人工智能的信息挖掘方法和装置 |
摘要 |
本申请公开了基于人工智能的信息挖掘方法和装置。所述方法的一具体实施方式包括:获取目标网页的源代码;根据源代码的代码块是否包括预定标签和/或代码块包括的元素的相似度,从源代码的代码块中确定出所包括的元素之间为并列关系的代码块;将所确定出的代码块包括的元素的内容确定为候选信息;基于预先设置的筛选条件组,从候选信息中筛选出结果信息。该实施方式提高了信息挖掘的效率与准确性。 |
申请公布号 |
CN106372232A |
申请公布日期 |
2017.02.01 |
申请号 |
CN201610815019.0 |
申请日期 |
2016.09.09 |
申请人 |
北京百度网讯科技有限公司 |
发明人 |
洪婉玲;孙珂;郭伟东;张希娟 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京英赛嘉华知识产权代理有限责任公司 11204 |
代理人 |
王达佐;马晓亚 |
主权项 |
一种基于人工智能的信息挖掘方法,其特征在于,所述方法包括:获取目标网页的源代码;根据所述源代码的代码块是否包括预定标签和/或所述代码块包括的元素的相似度,从所述源代码的代码块中确定出所包括的元素之间为并列关系的代码块;将所确定出的代码块包括的元素的内容确定为候选信息;基于预先设置的筛选条件组,从所述候选信息中筛选出结果信息。 |
地址 |
100085 北京市海淀区上地十街10号百度大厦2层 |