发明名称 |
一种基于知识库的URL分类识别方法及系统 |
摘要 |
本发明公开了一种基于知识库的URL分类识别方法,通过向知识库中导入分类信息;根据知识库中的分类信息对互联网信息的URL进行初步分类;基于URL结构对初步分类后的互联网信息进行进一步分层识别及分类;输出识别和分类的结果,实现了对互联网内容进行分类识别,因为不需要针对海量的文本内容进行文本分析或者图像识别,只是网址的分层识别,服务响应能力可以无限提高,还把所有的知识库加载到内存中,并不需要进行硬盘IO,完全是网络IO和内存访问,减少了对系统资源的消耗,基于分层的概念,可以做到同一个站点,既有相同内容,又有不同内容的分类,因为键值的简单,因此在分类查询的时候,就可以做到对系统资源的最小消耗。 |
申请公布号 |
CN106294443A |
申请公布日期 |
2017.01.04 |
申请号 |
CN201510280344.7 |
申请日期 |
2015.05.28 |
申请人 |
上海池乐信息科技有限公司 |
发明人 |
王栋 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种基于知识库的URL分类识别方法,其特征在于,所述基于知识库的URL分类识别方法包括以下步骤:向知识库中导入分类信息;根据知识库中的分类信息对互联网信息的URL进行初步分类;基于URL结构对初步分类后的互联网信息进行进一步分层识别及分类;输出识别和分类的结果。 |
地址 |
201206 上海市浦东新区宁桥路600号第五幢202室 |