发明名称 基于邻近项目Slope One算法的用户改进推荐方法
摘要 本发明涉及用户—项目数据的分析领域,设计了一种近邻聚类算法和slopeone算法相结合的改进推荐方法。本方法结合k-means聚类和slopeone算法,首先使用k-means聚类方法为用户找到相似的个项目组成邻近项目集合,然后采用slopeone算法计算用户—项目调查数据表,最后预测数据并推荐给用户。本方法着重解决的问题是在预测用户受到项目调查可能性的过程中,考虑了数据项目之间的相似性,从而使算法预测的结果更加准确。将预测调查可能性的问题转换成一个项目推荐问题来解决,采用基于邻近项目的slopeone算法预测用户被调查的可能性,帮助用户提前做好相关的防范工作。
申请公布号 CN105678430A 申请公布日期 2016.06.15
申请号 CN201610112751.1 申请日期 2016.02.29
申请人 大连大学 发明人 张强;黄丽鹏;车超;魏小鹏
分类号 G06Q10/04(2012.01)I;G06Q10/06(2012.01)I;G06K9/62(2006.01)I 主分类号 G06Q10/04(2012.01)I
代理机构 大连创达专利代理事务所(普通合伙) 21237 代理人 刘涛
主权项 基于邻近项目slope one算法的改进推荐方法,其特征在于:先对原始数据进行数据处理,之后采用k‑means聚类算法筛选与目标项目邻近的k个相似项目,再用slope one算法为当前活跃用户的目标项目预测评分,最后根据用户—项目评分矩阵向用户推荐项目;该方法具体步骤如下:1)结合数据集中的评分数据,采用k‑means聚类算法计算项目间的相似度的矩阵,构建项目相似性矩阵;2)根据用户u评价过的项目i,选择与用户u评价过的项目i最为相似的k个项目组成k邻近项目集合K′;3)使用公式(1)计算目标项目Item<sub>j</sub>与k邻近项目集合K′中项目Item<sub>i</sub>之间的评分偏差dev<sub>j,i</sub>,其中,u<sub>j</sub>和u<sub>i</sub>分别表示评价过项目Item<sub>j</sub>的用户和项目Item<sub>i</sub>的用户;S<sub>j,i</sub>(x)为对目标项目Item<sub>j</sub>与其他项目Item<sub>i</sub>进行过评分的用户集合;card(S)表示集合S中的元素个数;<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mi>dev</mi><mrow><mi>j</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>=</mo><munder><mo>&Sigma;</mo><mrow><mi>u</mi><mo>&Element;</mo><msub><mi>S</mi><mrow><mi>j</mi><mo>,</mo><mi>i</mi></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow></munder><mfrac><mrow><msub><mi>u</mi><mi>j</mi></msub><mo>-</mo><msub><mi>u</mi><mi>i</mi></msub></mrow><mrow><mi>c</mi><mi>a</mi><mi>r</mi><mi>d</mi><mrow><mo>(</mo><mrow><msub><mi>S</mi><mrow><mi>j</mi><mo>,</mo><mi>i</mi></mrow></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow></mrow><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000931277300000011.GIF" wi="694" he="127" /></maths>4)根据公式(2)计算用户u对目标项目Item<sub>j</sub>的预测评分P(u)<sub>j</sub>,并最终得到用户—项目评分矩阵R′m×n,其中,R<sub>j</sub>为用户u已评分项目的集合;<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>P</mi><msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mi>j</mi></msub><mo>=</mo><mfrac><mrow><munder><mo>&Sigma;</mo><mrow><mi>i</mi><mo>&Element;</mo><msub><mi>R</mi><mi>j</mi></msub></mrow></munder><mrow><mo>(</mo><msub><mi>dev</mi><mrow><mi>j</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>+</mo><msub><mi>u</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><mi>c</mi><mi>a</mi><mi>r</mi><mi>d</mi><mrow><mo>(</mo><msub><mi>R</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow></mfrac><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000931277300000012.GIF" wi="604" he="181" /></maths>5)根据步骤4)得到的用户—项目评分矩阵R′m×n,为用户u推荐出评分最大的r个预测项目。
地址 116622 辽宁省大连市金州新区学府大街10号