发明名称 | 一种电子词典数据存储格式及其检索方法 | ||
摘要 | 本发明公开了一种电子词典数据存储格式及其检索方法,它涉及一种词库的设计和数据的检索技术。首先它将单词分为固定词头部分和变长词头部分,再根据词头把单词索引层分为固定索引层和变长索引层,将每个单词视为一个节点,而单词索引层里单词以Hash值的形式按大小顺序存储;检索方法为:首先求出想要查找单次的Hash值Search Value;再利用二分查找的排序方法在固定索引层进行查找,如果找到等于该Search Value的节点,则返回该节点,否则记录下固定索引节点中的变长索引层偏移位移;然后根据变长索引层偏移位移进入到对应的变长索引层进行匹配。利用本发明可以极大的减少存储空间,采用了2级检索的方式,有效的减少了查找的时间,保证了数据的准确性。 | ||
申请公布号 | CN101145155A | 申请公布日期 | 2008.03.19 |
申请号 | CN200710031026.2 | 申请日期 | 2007.10.24 |
申请人 | 中山大学 | 发明人 | 王建民;庄敬晖;麦章灿;罗笑南 |
分类号 | G06F17/30(2006.01) | 主分类号 | G06F17/30(2006.01) |
代理机构 | 广州市深研专利事务所 | 代理人 | 陈雅平 |
主权项 | 1.一种电子词典数据存储格式,它包括单词索引层和显示数据层,其特征在于,它将词库单词分为固定词头部分和变长词头部分,再根据词库单词的词头把单词索引层分为固定索引层和变长索引层。 | ||
地址 | 510275广东省广州市新港西路135号 |