发明名称 一种基于混合式分解技术的学生能力预测方法
摘要 本发明涉及一种基于混合式分解技术的学生能力预测方法,其是基于学者在训练集中的表现,建立训练集矩阵,之后利用矩阵分解法对学者进行预测,再采用偏差矩阵分解模型对用户偏差和任务偏差进行校正,预测出该学生在其他任务的可能表现,从而为学者推荐合适的任务,从而提高学者的学效率和节约学者的时间,可以应用到教育推荐系统中。
申请公布号 CN105512770A 申请公布日期 2016.04.20
申请号 CN201510952428.0 申请日期 2015.12.17
申请人 陕西师范大学 发明人 袁柳;翟梅;张鸿洋
分类号 G06Q10/04(2012.01)I;G06Q50/20(2012.01)I 主分类号 G06Q10/04(2012.01)I
代理机构 西安永生专利代理有限责任公司 61201 代理人 曹宇飞
主权项 一种基于混合式分解技术的学生能力预测方法,其特征在于包括以下步骤:(1)建立矩阵模型X,X∈R<sup>U×I</sup>是原始的二维矩阵,U代表训练集中的学生,I代表训练集中学生对应的任务;(2)对步骤(1)的矩阵模型X进行分解,X≈WH<sup>T</sup>,得到矩阵W和矩阵H;其中:W∈R<sup>U×K1</sup>是一个矩阵,K1是测试集中学生学习能力的潜在因子数量,H∈R<sup>I×K2</sup>是一个矩阵,K2是测试集中任务的潜在因子数量;(3)根据下式(1)得到测试集学生第一次尝试是否成功的预测结果;<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><msub><mover><mi>p</mi><mo>^</mo></mover><mrow><mi>u</mi><mi>i</mi></mrow></msub><mo>=</mo><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>w</mi><mrow><mi>u</mi><mi>k</mi></mrow></msub><msub><mi>h</mi><mrow><mi>i</mi><mi>k</mi></mrow></msub><mo>=</mo><msub><mrow><mo>(</mo><msup><mi>WH</mi><mi>T</mi></msup><mo>)</mo></mrow><mrow><mi>u</mi><mo>,</mo><mi>i</mi></mrow></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>1</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000881386280000011.GIF" wi="1406" he="164" /></maths><img file="FDA0000881386280000012.GIF" wi="84" he="87" />表示测试集中学生第一次尝试是否成功的预测结果;w<sub>uk</sub>和h<sub>ik</sub>分别为W和H的元素,K=K1=K2;(4)用步骤(3)所得的测试集中学生第一次尝试是否成功的预测结果与训练集中学生的实际结果p<sub>ui</sub>进行比较,计算出预测的误差值err;<maths num="0002" id="cmaths0002"><math><![CDATA[<mrow><mi>e</mi><mi>r</mi><mi>r</mi><mo>=</mo><munder><mo>&Sigma;</mo><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>i</mi><mo>)</mo><mo>&Element;</mo><msup><mi>D</mi><mrow><mi>t</mi><mi>r</mi><mi>a</mi><mi>i</mi><mi>n</mi></mrow></msup></mrow></munder><msup><mrow><mo>(</mo><msub><mi>p</mi><mrow><mi>u</mi><mi>i</mi></mrow></msub><mo>-</mo><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>w</mi><mrow><mi>u</mi><mi>k</mi></mrow></msub><msub><mi>h</mi><mrow><mi>i</mi><mi>k</mi></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>2</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000881386280000013.GIF" wi="1310" he="191" /></maths>D<sup>train</sup>是训练集;(5)采用梯度下降法确定训练集中误差最小值,梯度下降法的计算公式为:<maths num="0003" id="cmaths0003"><math><![CDATA[<mrow><mfrac><mo>&part;</mo><mrow><mo>&part;</mo><msub><mi>w</mi><mrow><mi>u</mi><mi>k</mi></mrow></msub></mrow></mfrac><msub><msup><mi>e</mi><mn>2</mn></msup><mrow><mi>u</mi><mi>i</mi></mrow></msub><mo>=</mo><mo>-</mo><mn>2</mn><msub><mi>e</mi><mrow><mi>u</mi><mi>i</mi></mrow></msub><msub><mi>h</mi><mrow><mi>i</mi><mi>k</mi></mrow></msub><mo>=</mo><mo>-</mo><mn>2</mn><mrow><mo>(</mo><msub><mi>p</mi><mrow><mi>u</mi><mi>i</mi></mrow></msub><mo>-</mo><msub><mover><mi>p</mi><mo>^</mo></mover><mrow><mi>u</mi><mi>i</mi></mrow></msub><mo>)</mo></mrow><msub><mi>h</mi><mrow><mi>i</mi><mi>k</mi></mrow></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>3</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000881386280000014.GIF" wi="1300" he="159" /></maths><maths num="0004" id="cmaths0004"><math><![CDATA[<mrow><mfrac><mo>&part;</mo><mrow><mo>&part;</mo><msub><mi>h</mi><mrow><mi>i</mi><mi>k</mi></mrow></msub></mrow></mfrac><msub><msup><mi>e</mi><mn>2</mn></msup><mrow><mi>u</mi><mi>i</mi></mrow></msub><mo>=</mo><mo>-</mo><mn>2</mn><msub><mi>e</mi><mrow><mi>u</mi><mi>i</mi></mrow></msub><msub><mi>w</mi><mrow><mi>u</mi><mi>k</mi></mrow></msub><mo>=</mo><mo>-</mo><mn>2</mn><mrow><mo>(</mo><msub><mi>p</mi><mrow><mi>u</mi><mi>i</mi></mrow></msub><mo>-</mo><msub><mover><mi>p</mi><mo>^</mo></mover><mrow><mi>u</mi><mi>i</mi></mrow></msub><mo>)</mo></mrow><msub><mi>w</mi><mrow><mi>u</mi><mi>k</mi></mrow></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>4</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000881386280000015.GIF" wi="1301" he="173" /></maths>其中<maths num="0005" id="cmaths0005"><math><![CDATA[<mrow><msub><mi>e</mi><mrow><mi>u</mi><mi>i</mi></mrow></msub><mo>=</mo><msub><mi>p</mi><mrow><mi>u</mi><mi>i</mi></mrow></msub><mo>-</mo><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>w</mi><mrow><mi>u</mi><mi>k</mi></mrow></msub><msub><mi>h</mi><mrow><mi>i</mi><mi>k</mi></mrow></msub></mrow>]]></math><img file="FDA0000881386280000016.GIF" wi="518" he="180" /></maths>(6)根据步骤(5)所得训练集中的误差最小值,利用下式(5)和(6)计算出测试集中每个学生的学习能力预测结果;<maths num="0006" id="cmaths0006"><math><![CDATA[<mrow><msubsup><mi>w</mi><mrow><mi>u</mi><mi>k</mi></mrow><mo>&prime;</mo></msubsup><mo>=</mo><msub><mi>w</mi><mrow><mi>u</mi><mi>k</mi></mrow></msub><mo>-</mo><mi>&beta;</mi><mfrac><mo>&part;</mo><mrow><mo>&part;</mo><msub><mi>w</mi><mrow><mi>u</mi><mi>k</mi></mrow></msub></mrow></mfrac><msub><msup><mi>e</mi><mo>&prime;</mo></msup><mrow><mi>u</mi><mi>i</mi></mrow></msub><mo>=</mo><msub><mi>w</mi><mrow><mi>u</mi><mi>k</mi></mrow></msub><mo>+</mo><mn>2</mn><msub><mi>&beta;e</mi><mrow><mi>u</mi><mi>i</mi></mrow></msub><msub><mi>h</mi><mrow><mi>i</mi><mi>k</mi></mrow></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>5</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000881386280000021.GIF" wi="1230" he="142" /></maths><maths num="0007" id="cmaths0007"><math><![CDATA[<mrow><msubsup><mi>h</mi><mrow><mi>i</mi><mi>k</mi></mrow><mo>&prime;</mo></msubsup><mo>=</mo><msub><mi>h</mi><mrow><mi>i</mi><mi>k</mi></mrow></msub><mo>-</mo><mi>&beta;</mi><mfrac><mo>&part;</mo><mrow><mo>&part;</mo><msub><mi>h</mi><mrow><mi>i</mi><mi>k</mi></mrow></msub></mrow></mfrac><msub><msup><mi>e</mi><mn>2</mn></msup><mrow><mi>u</mi><mi>i</mi></mrow></msub><mo>=</mo><msub><mi>h</mi><mrow><mi>i</mi><mi>k</mi></mrow></msub><mo>+</mo><mn>2</mn><msub><mi>&beta;e</mi><mrow><mi>u</mi><mi>i</mi></mrow></msub><msub><mi>w</mi><mrow><mi>u</mi><mi>k</mi></mrow></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>6</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000881386280000022.GIF" wi="1196" he="151" /></maths>β为学习速率,取值为0.15;(7)通过添加规范化因子,对步骤(6)计算所得预测结果进行校正,校正公式为:<maths num="0008" id="cmaths0008"><math><![CDATA[<mrow><msup><msub><mover><mi>p</mi><mo>^</mo></mover><mrow><mi>u</mi><mi>i</mi></mrow></msub><mo>&prime;</mo></msup><mo>=</mo><msup><mrow><mo>(</mo><msub><mi>p</mi><mrow><mi>u</mi><mi>i</mi></mrow></msub><mo>-</mo><munderover><mo>&Sigma;</mo><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>K</mi></munderover><msub><mi>w</mi><mrow><mi>u</mi><mi>k</mi></mrow></msub><msub><mi>h</mi><mrow><mi>i</mi><mi>k</mi></mrow></msub><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><mi>&lambda;</mi><mrow><mo>(</mo><mo>|</mo><mo>|</mo><mi>W</mi><mo>|</mo><msup><mo>|</mo><mn>2</mn></msup><mo>+</mo><mo>|</mo><mo>|</mo><mi>H</mi><mo>|</mo><msup><mo>|</mo><mn>2</mn></msup><mo>)</mo></mrow><mo>-</mo><mo>-</mo><mo>-</mo><mrow><mo>(</mo><mn>7</mn><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000881386280000023.GIF" wi="1222" he="156" /></maths>其中:λ是正则化参数;得到学生u对给定任务i的第一次尝试是否成功的预测结果的较优值<img file="FDA0000881386280000025.GIF" wi="117" he="70" />
地址 710062 陕西省西安市长安南路199号