发明名称 一种获取用户和文档个性化特征的方法和系统
摘要 本发明提出了一种获取用户和文档个性化特征的方法和系统。所述方法通过用户访问文档的信号,来自动地更新用户和文档的个性化特征。用户的个性化特征依据所述用户访问过的文档的个性化特征进行更新;文档的个性化特征依据访问过该文档的用户的个性化特征进行更新。根据获取的用户和文档的个性化特征,可在搜索引擎中实现个性化的文档排序以及在社交网络中实现个性化的信息过滤和筛选。本发明还提出了一种获取用户和文档个性化特征的系统。本发明方法能够提高搜索引擎的查准率和社交网络的信息检索效率。另外,本发明方法还能够提高网页排名算法的反作弊能力。
申请公布号 CN103544190A 申请公布日期 2014.01.29
申请号 CN201210253997.2 申请日期 2012.07.17
申请人 祁勇 发明人 祁勇
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 一种获取用户和文档个性化特征的方法,其特征在于,在接入互联网的服务器中,存储由多个用户标识组成的用户集U和由多个文档标识组成的文档集D;存储由多个特征标识组成的特征集K;在所述服务器中,为所述用户集U中的至少一个用户或者所述文档集D中的至少一个文档设置参数向量初始值;在所述服务器中,多次执行如下步骤:接收任意一个用户m(m∈U)访问任意一个文档n(n∈D)的信号;根据所述信号,读取所述用户m的参数向量U(m)=(uwm1,uwm2,...,uwmk,...,uwmL),其中所述uwmk表示所述用户m与特征k(k∈K)的相关度;根据所述信号,读取所述文档n的参数向量D(n)=(dwn1,dwn2,...,dwnk,...,dwnL),其中所述dwnk表示所述文档n与特征k(k∈K)的相关度;应用参数向量更新算法,更新所述用户m和所述文档n的参数向量;设更新后所述用户m的参数向量为U*(m)=(uwm1*,uwm2*...,uwmk*...,uwmL*),更新后所述文档n的参数向量为D*(n)=(dwn1*,dwn2*,...,dwnk*,...,dwnL*),则所述参数向量更新算法包括:U*(m)=F1[U(m),D(n)];D*(n)=F2[U(m),D(n)];其中所述F1(·)和所述F2(·)分别是以所述U(m)和所述D(n)为自变量的函数。
地址 518053 广东省深圳市南山区华侨城锦绣花园观海阁20E