发明名称 一种适用于移动搜索的个性化词典构造方法
摘要 本发明提供了一种适用于移动搜索的个性化词典构造方法,词典结构中所引入的次字区位码分段哈希机制,将首字相同的词条根据次字区位码划分至多个子区间内,可实现在小范围内利用二分法快速查找次字,有效地提高了词典查询效率。同时,由于本发明提出的个性化词典在每个词条结构中引入了分类及使用频率等相关信息,在分词后即可直接获取用户查询内容所属的分类信息,满足了移动搜索个性化需求,便于系统进行查询扩展和查询推荐等相关处理。
申请公布号 CN103678385A 申请公布日期 2014.03.26
申请号 CN201210346775.5 申请日期 2012.09.18
申请人 西安邮电大学 发明人 王忠民;齐静娜;贺炎;邓万宇;梁琛;王文浪
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种适用于移动搜索的个性化词典构造方法,其特征在于由首字哈希索引表、次字区位码分段哈希索引表、次字索引表和词典正文4个部分组成;所述的首字哈希表由词的首字和属性信息及指向次字区位码分段哈希索引表的指针组成;所述的次字区位码分段哈希索引表由次字区位码所属的区间范围编号及指向次字索引表的指针组成;所述的次字索引表由词的次字和属性信息及指向词典正文的指针组成;所述的词典正文由除去前两个字的剩余字串构成的剩余字串表及词的属性信息组成。
地址 710121 陕西省西安市长安区韦郭路