发明名称 一种确定文档特征和用户特征的方法和系统
摘要 本发明提出了一种确定文档特征和用户特征的方法和系统。具体方法包括:如果用户访问了文档,则根据所述用户的特征更新所述文档的特征,以及根据所述文档的特征更新所述用户的特征。多次使用上述方法获得多个文档的文档特征和多个用户的用户特征。当一搜索查询用户提交了搜索查询请求后,在所述多个文档中识别与所述搜索查询匹配的一组文档,并根据所述一组文档中每个文档的特征与所述搜索查询用户的特征之间的数学距离,对所述一组文档进行排序。
申请公布号 CN102651011B 申请公布日期 2014.04.23
申请号 CN201110054810.1 申请日期 2011.02.27
申请人 祁勇 发明人 祁勇
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 代理人
主权项 1.一种确定文档特征和用户特征的方法,其特征在于,在服务器中存储文档集I={1,2,...,N},用户集J={1,2,...,M}和特征集K={1,2,...,L},其中N为文档个数,M为用户个数,L为特征个数;并实现如下步骤:S10.为所述用户集J中的至少一个用户设置用户特征向量初始值,以及为所述文档集I中的至少一个文档设置文档特征向量初始值;S11.接收任一用户j(j∈J)对任一文档i(i∈I)的访问请求,获取所述用户j的用户标识以及所述文档i的文档标识;S12.根据所述用户标识,获取所述用户j的用户特征向量(uw<sub>j1</sub>,uw<sub>j2</sub>,...,uw<sub>jk</sub>,...,uw<sub>jL</sub>),其中uw<sub>jk</sub>表示所述用户j与特征k(k∈K)的相关度;S13.根据所述文档标识,获取所述文档i的文档特征向量(dw<sub>i1</sub>,dw<sub>i2</sub>,...,dw<sub>ik</sub>,...,dw<sub>iL</sub>),其中dw<sub>ik</sub>表示所述文档i与特征k(k∈K)的相关度;S14.更新所述用户j的用户特征向量和所述文档i的文档特征向量,具体更新方法如下:dw<sub>ik</sub>=dw<sub>ik</sub>+f<sub>1</sub>(uw<sub>jk</sub>);其中k∈UK<sub>j</sub>,<img file="FSB0000120459250000011.GIF" wi="226" he="71" />f<sub>1</sub>(x)为增函数;uw<sub>jk</sub>=uw<sub>jk</sub>+f<sub>2</sub>(dw<sub>ik</sub>);其中k∈DK<sub>i</sub>,<img file="FSB0000120459250000012.GIF" wi="230" he="67" />f<sub>2</sub>(x)为增函数;返回所述步骤S11。
地址 518053 广东省深圳市南山区华侨城锦绣花园观海阁20E