主权项 |
一种基于Agent的元搜索引擎个性化方法,包括以下步骤:(1)判断用户是否首次使用元搜索引擎,若是,转至步骤(2),否则转至步骤(6);(2)挖掘用户浏览记录:2a)将移动Agent通过路由策略移动至用户客户端;2b)利用移动Agent过滤用户浏览记录得到有效浏览记录,并将该记录发送回服务器端;(3)初始化用户兴趣模型:3a)服务器端的个性化Agent接收移动Agent发送的用户浏览记录;3b)个性化Agent对有效浏览记录进行挖掘,利用分词工具对用户浏览的文本分词,得到文本中出现的词条及频度,将文本中出现频度大于等于5次的词条作为用户兴趣词,利用朴素贝叶斯公式计算得到文本类别;3c)将步骤3b)中得到的兴趣词对应频度的归一化值作为兴趣词的权重,将兴趣词所属文本的类别作为兴趣词的类别,按条依次得到多个由兴趣词、权重、类别组成的三元组,将每个三元组作为一条用户兴趣向量添加到用户兴趣模型中;3d)判断用户兴趣模型所包含的用户兴趣向量数目是否超过阈值,若是,比较用户兴趣模型中全部用户兴趣向量的权重,将最低权重对应的用户兴趣向量删除,转至步骤(4),否则转至步骤3c);(4)划分用户群组:4a)个性化Agent将用户兴趣模型中现存用户兴趣向量发布至公共兴趣黑板;4b)公共兴趣黑板按照用户兴趣向量中兴趣词的类别,将具有同类兴趣词的用户划分为同一分组;(5)获取群组兴趣:5a)提取公共兴趣黑板中每个分组内用户发布的用户兴趣向量中的兴趣词;5b)统计每组中发布同一兴趣词的用户人数,将兴趣词按照发布用户人数的多少按照从多到少排序,提取其中前五个兴趣词作为对应分组的推荐兴趣词;5c)统计公共兴趣黑板中每个分组内除当前第一次使用元搜索引擎的用户外,其他用户检索后对检索结果链接的点击次数,将对同一检索词的检索结果中被点击次数最高的三个链接作为相应分组中对应该检索词的推荐链接;转至步骤(10);(6)对非首次使用元搜索引擎的用户,判断其是否需要检索信息,若是,转至步骤(7),否则转至步骤(10);(7)推荐相关信息:公共兴趣黑板按照进行检索用户的用户兴趣向量中兴趣词的类别,将具有同类兴趣词的用户划分到同一分组,个性化Agent将对应分组的推荐兴趣词和对应用户检索词的推荐链接在检索结果中展示给用户;(8)记录用户点击链接:元搜索引擎在检索结果中为用户推荐特定信息后,个性化Agent记录被用户点击的检索结果链接;(9)更新用户兴趣:9a)个性化Agent对记录的用户点击的检索结果链接进行挖掘,获取检索结果链接页面中的文本内容,利用分词工具对文本进行分词,得到文本中出现的词条及频度,将文本中出现频度大于等于5次的词条作为用户兴趣词,利用朴素贝叶斯公式计算得到文本类别;9b)将步骤9a)中得到兴趣词对应频度的归一化值作为兴趣词的权重,将兴趣词所属文本的类别作为兴趣词的类别,按条依次得到多个由兴趣词、权重、类别组成的三元组,将获得的三元组作为用户新兴趣向量;9c)判断每条用户新兴趣向量中兴趣词及其类别是否与用户兴趣模型中已有的用户旧兴趣向量中兴趣词及其类别一致,若是,将用户旧兴趣向量中的兴趣词权重更新为新兴趣向量和旧兴趣向量中两个兴趣词权重的相加值;否则,将对应用户兴趣模型中最低权重的旧兴趣向量删除,将新兴趣向量添加到用户兴趣模型中;9d)个性化Agent将更新后的用户兴趣向量发布至公共兴趣黑板中,公共兴趣黑板根据用户兴趣向量中兴趣词的类别,将具有同类兴趣词的用户划分为同一分组;(10)结束。 |