发明名称 邮件索引建立方法及系统、邮件搜索方法及系统
摘要 本申请实施例公开了邮件索引建立方法及系统、邮件搜索方法及系统,该邮件索引建立方法包括:对待建立索引的当前邮件进行分词得到当前邮件的关键词;依据当前邮件的关键词更新一级缓存中保存的一级倒排索引记录;判断一级缓存中的一级倒排索引记录的大小是否到达第一预设阈值,如果是,则将所述一级缓存中的所有一级倒排索引记录读取至二级缓存文件中;判断当前二级缓存文件的大小是否到达第二预设阈值,如果是,则依据路径文件将二级缓存文件中的二级倒排索引记录读取至三级倒排索引文件。采用本申请实施例的方法或系统,可以有效地提高建立索引的效率,提升硬盘IO性能。进一步的,基于上述建立索引的方法建立的索引进行邮件查询时,也能够提高搜索结果的效率。
申请公布号 CN103678405A 申请公布日期 2014.03.26
申请号 CN201210357269.6 申请日期 2012.09.21
申请人 阿里巴巴集团控股有限公司 发明人 佘智勇
分类号 G06F17/30(2006.01)I;G06F12/08(2006.01)I;H04L12/58(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京集佳知识产权代理有限公司 11227 代理人 王宝筠
主权项 一种邮件索引建立方法,其特征在于,包括:对待建立索引的当前邮件进行分词得到所述当前邮件的关键词;依据所述当前邮件的关键词更新一级缓存中保存的一级倒排索引记录;判断所述一级缓存中的一级倒排索引记录的大小是否到达第一预设阈值,如果是,则将所述一级缓存中的所有一级倒排索引记录读取至二级缓存文件中;判断当前二级缓存文件的大小是否到达第二预设阈值,如果是,则依据路径文件将所述二级缓存文件中的所有二级倒排索引记录读取至三级倒排索引文件,所述路径文件保存关键词与三级倒排索引文件对应的映射关系。
地址 英属开曼群岛大开曼岛资本大厦一座四层847号邮箱