发明名称 一种基于知识库的URL分类识别方法及系统
摘要 本发明公开了一种基于知识库的URL分类识别方法,通过向知识库中导入分类信息;根据知识库中的分类信息对互联网信息的URL进行初步分类;基于URL结构对初步分类后的互联网信息进行进一步分层识别及分类;输出识别和分类的结果,实现了对互联网内容进行分类识别,因为不需要针对海量的文本内容进行文本分析或者图像识别,只是网址的分层识别,服务响应能力可以无限提高,还把所有的知识库加载到内存中,并不需要进行硬盘IO,完全是网络IO和内存访问,减少了对系统资源的消耗,基于分层的概念,可以做到同一个站点,既有相同内容,又有不同内容的分类,因为键值的简单,因此在分类查询的时候,就可以做到对系统资源的最小消耗。
申请公布号 CN106294443A 申请公布日期 2017.01.04
申请号 CN201510280344.7 申请日期 2015.05.28
申请人 上海池乐信息科技有限公司 发明人 王栋
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种基于知识库的URL分类识别方法,其特征在于,所述基于知识库的URL分类识别方法包括以下步骤:向知识库中导入分类信息;根据知识库中的分类信息对互联网信息的URL进行初步分类;基于URL结构对初步分类后的互联网信息进行进一步分层识别及分类;输出识别和分类的结果。
地址 201206 上海市浦东新区宁桥路600号第五幢202室