发明名称 一种知识库构建方法、控制器
摘要 本发明提供了一种知识库构建方法、控制器,涉及互联网技术领域。解决了现有受限于WEB详情页面信息的丰富程度,导致构建的领域知识不够完整的问题。本发明提供的方法包括:接收知识库构建任务;所述知识库构建任务包含标识待构建知识库的任务名称;查询与所述任务名称相对应的任务配置;所述任务配置包含:至少两个子任务;将所述至少两个子任务发送给所述抓取器,触发所述抓取器执行所述至少两个子任务,得到至少两个结构化数据;接收所述抓取器返回的所述至少两个结构化数据;合并所述至少两个结构化数据,将合并后的结构化数据存入与所述任务名称对应的知识库。
申请公布号 CN105589945A 申请公布日期 2016.05.18
申请号 CN201510953365.0 申请日期 2015.12.17
申请人 华为技术有限公司 发明人 卢剑锋
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京中博世达专利商标代理有限公司 11274 代理人 申健
主权项 一种知识库构建方法,应用于控制器,其特征在于,包括:接收知识库构建任务;所述知识库构建任务包含标识待构建知识库的任务名称;查询与所述任务名称相对应的任务配置;所述任务配置包含:至少两个子任务,每个子任务对应设置有:目标网站、抽取模板以及网页类型;每个子任务用于:指示抓取器根据所述抽取模板,在所述目标网站中与所述网页类型对应的页面上进行结构化数据抽取;将所述至少两个子任务发送给所述抓取器,触发所述抓取器执行所述至少两个子任务,得到至少两个结构化数据;接收所述抓取器返回的所述至少两个结构化数据;合并所述至少两个结构化数据,将合并后的结构化数据存入与所述任务名称对应的知识库。
地址 518129 广东省深圳市龙岗区坂田华为总部办公楼