发明名称 |
一种基于对数归并的DNS索引创建方法及查询方法 |
摘要 |
本发明公开了一种基于对数归并的DNS索引创建方法及查询方法。本方法为:1)将每一DNS日志生成一文档对象,然后将各文档对象放入DNS的文档缓存中;当DNS的文档缓存耗尽时,对文档缓存中的每一文档对象进行词语切分,得到一解释文档对象;每一解释文档对象对应一索引表,该索引表包括多个索引字段,其中至少有一个索引字段作为文档ID唯一标识对应文档对象;2)在索引缓存中对索引表建立倒排索引,当索引缓存耗尽时将索引缓存中的倒排索引写入磁盘倒排索引数据库;3)对倒排索引数据库中的倒排索引进行对数归并。本发明大大提高了从海量信息中查找特定信息的效率,满足信息检索的快速响应请求。 |
申请公布号 |
CN105912696A |
申请公布日期 |
2016.08.31 |
申请号 |
CN201610262289.3 |
申请日期 |
2016.04.25 |
申请人 |
中国互联网络信息中心 |
发明人 |
李晓东;李洪涛;刘继勇;李建明;王利军;杨学 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京君尚知识产权代理事务所(普通合伙) 11200 |
代理人 |
司立彬 |
主权项 |
一种基于对数归并的DNS索引创建方法,其步骤为:1)将每一DNS日志生成一文档对象,然后将各文档对象放入DNS的文档缓存中;当DNS的文档缓存耗尽时,对文档缓存中的每一文档对象进行词语切分,得到一解释文档对象;每一解释文档对象对应一索引表,该索引表包括多个索引字段,其中至少有一个索引字段作为文档ID唯一标识对应文档对象;2)在索引缓存中对索引表建立倒排索引,当索引缓存耗尽时将索引缓存中的倒排索引写入磁盘倒排索引数据库;3)对倒排索引数据库中的倒排索引进行对数归并。 |
地址 |
100190 北京市海淀区中关村南四街四号1号楼 |