发明名称 大规模微博异构信息网络中的链接预测方法
摘要 本发明涉及互联网技术领域,提供一种大规模微博异构信息网络中的链接预测方法,该方法包括:按预设策略对用户进行过;从网络中抽取若干链接,正例集合为E<sub>T</sub>,负例集合为E<sub>F</sub>;在E‑E<sub>T</sub>‑E<sub>F</sub>网络中计算E<sub>T</sub>∪E<sub>F</sub>中所有节点的特征以及链接的特征,并将节点的特征转换为链接关系的特征;将E<sub>F</sub>∪E<sub>T</sub>分为训练集、验证集和测试集,在训练集上训练模型,在验证集上选择使预测结果最优的模型超参数,得到最终模型h<sub>θ</sub>(x)和阈值θ;将测试集中任意一条链接关系带入模型,即可得到该链接关系产生的概率P。实验表明本发明提供的方法较基于局部信息相似性和路径相似性的方法的曲线下面积和F值有明显提升,且具备更好的最大K准确率稳定性。
申请公布号 CN105893637A 申请公布日期 2016.08.24
申请号 CN201610478367.3 申请日期 2016.06.24
申请人 四川大学 发明人 李川;李旺龙
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 四川省成都市天策商标专利事务所 51213 代理人 刘兴亮
主权项 一种大规模微博异构信息网络中的链接预测方法,其特征在于包括步骤:A、按预设策略对用户进行过滤,过滤后网络中边的集合为E;B、从网络中抽取若干链接,其中正例集合为E<sub>T</sub>,负例集合为E<sub>F</sub>;C、在E‑E<sub>T</sub>‑E<sub>F</sub>网络中计算E<sub>T</sub>∪E<sub>F</sub>中所有节点的特征以及链接的特征,并将节点的特征转换为链接关系的特征,最终链接关系的特征集为X;D、将E<sub>F</sub>∪E<sub>T</sub>分为训练集、验证集和测试集,在训练集上训练模型,在验证集上选择使预测结果最优的模型超参数,得到最终模型h<sub>θ</sub>(x)和阈值θ;E、将测试集中任意一条链接关系带入最终模型h<sub>θ</sub>(x),即可得到该链接关系产生的概率P,当P&gt;θ时,预测该链接关系将会产生,否则预测该链接关系不会产生。
地址 610000 四川省成都市一环路南一段24号