发明名称 一种结果缓存替换的优化方法
摘要 本发明公开了一种结果缓存替换的优化方法,属于计算机网络技术领域。本方法为:1)以系统搜索日志中的用户ID为键、用户发起的请求为键值建立一哈希表h2;2)将同一用户ID发起的所有请求进行拼接,得到一字符串,对所有用户的拼接字符串构成的文档集进行话题模型分析,获得话题集合M及关联度;3)计算与某话题相关的搜索请求出现次数与同一时间段内所有请求出现次数的比值,计算该请求的权重贡献值;4)当收到一请求q时,查找匹配的结果缓存并返回和更新h2;如果没有,则在h2中查找对应的键值并与q拼接,计算q的权重贡献值;5)将结果缓存中权重较低的结果项替换出去,并加入新的缓存项。本发明可大大提高缓存命中率的效果。
申请公布号 CN103488638B 申请公布日期 2016.12.07
申请号 CN201210191976.2 申请日期 2012.06.11
申请人 北京大学 发明人 宗朗;陈薇;王腾蛟;杨冬青
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京君尚知识产权代理事务所(普通合伙) 11200 代理人 俞达成
主权项 一种结果缓存替换的优化方法,其步骤为:1)初始化一结果缓存空间;2)读取系统搜索日志,以系统搜索日志中的用户ID为键、用户发起的请求为键值建立一哈希表h2;以及提取系统日志中页面的URL,以URL为键、页面点击次数和页面在结果中出现的次数为键值建立一哈希表h1;3)将同一用户ID发起的所有请求进行拼接,得到一字符串;将每条字符串作为一个文档,对所有用户的拼接字符串构成的文档集进行话题模型分析,获得话题集合M及文档与每个话题mi之间的关联度pi;4)计算一段时间内,与话题mi相关的搜索请求出现次数与这一时间段内所有请求出现次数的比值hi,根据比值hi和关联度pi计算该请求的权重贡献值,并将结果缓存存入结果缓存空间中,直到结果缓存空间存满;5)当收到一用户请求q时,在结果缓存空间中查找匹配的结果缓存并返回和更新哈希表h2,以及利用该结果缓存及用户反馈更新哈希表h1,然后将哈希表h1中的用户点击归一化后,计算搜索结果质量重要度F1的值;如果没有匹配结果缓存,则根据当前用户请求q的用户ID,在哈希表h2中查找对应的键值并与q拼接,计算q的权重贡献值;如果哈希表h2中没有对应的用户ID,则将其作为新的项添加到h2,并计算q的权重贡献值;6)如果请求q对应结果缓存的权重小于缓存空间中当前权重最小的结果缓存的权重,则不缓存请求q的结果缓存;否则将请求q的结果缓存替换当前权重最小的结果缓存;其中,每一请求的结果缓存权重W为该请求缓存项权重、该请求搜索结果质量重要度F1值、请求的权重贡献值F2值三者之和。
地址 100871 北京市海淀区颐和园路5号