发明名称 网络资源内容洞察系统及方法
摘要 本发明提供一种网络资源内容洞察系统及方法。本发明提供的系统,包括:开放接口模块、URL预处理模块、URL洞察库模块以及结果输出模块;开放接口模块接收目标URL;URL预处理模块判断目标URL的协议类型是否为目标协议类型;URL洞察库模块对目标协议类型的目标URL进行查询匹配,URL洞察库模块中被匹配中的参考URL对应的参考标引信息即为目标标引信息;结果输出模块输出目标标引信息。本发明通过URL洞察库模块存储参考URL和参考标引信息的对应关系,参考标引信息对应的标引范围为URL和目标文本本身,扩充了标引范围,实现了全面地对网络资源信息进行标引,从而提高了网络资源标引的准确率。
申请公布号 CN106250394A 申请公布日期 2016.12.21
申请号 CN201610563027.0 申请日期 2016.07.15
申请人 北京邮电大学 发明人 鄂海红;宋美娜;凌豪然;胡莺夕
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京同立钧成知识产权代理有限公司 11205 代理人 张洋;黄健
主权项 一种网络资源内容洞察系统,其特征在于,包括:开放接口模块、URL预处理模块、URL洞察库模块以及结果输出模块;所述开放接口模块,用于接收目标URL,并将所述目标URL发送给所述URL预处理模块;所述URL预处理模块,用于判断所述目标URL的协议类型是否为目标协议类型,若是,则将所述目标URL发送给所述URL洞察库模块;所述URL洞察库模块,用于对所述目标URL进行查询匹配,所述URL洞察库模块包括参考URL和参考标引信息的对应关系,若所述目标URL与所述URL洞察库模块中的一个参考URL匹配成功,则将所述参考URL对应的参考标引信息作为目标标引信息发送给所述结果输出模块;所述结果输出模块,用于输出所述目标标引信息。
地址 100876 北京市海淀区西土城路10号