发明名称 一种讨论区集合中热点讨论区的预测方法
摘要 本发明公开了一种讨论区集合中热点讨论区的预测方法,属于互联网信息挖掘领域,其包括下列步骤:针对目标讨论区集合,确定待预测的时间窗口W<sub>i+1</sub>;获得目标讨论区集合内的各个讨论区在时间窗口W<sub>i-1</sub>和时间窗口W<sub>i</sub>内的特征向量,所述特征向量由显示讨论区受关注程度的多个属性组成;在W<sub>i</sub>内,以各个讨论区的特征向量作为数据对象对各个讨论区进行聚类分析,并以得到的一个或多个类中心作为W<sub>i</sub>内的热点讨论区;以各个讨论区在W<sub>i-1</sub>内的特征向量作为输入并以W<sub>i</sub>内的热点讨论区作为输出进行SVM学;以各个讨论区在W<sub>i</sub>内的特征向量作为上述学后的SVM的输入,输出目标讨论区集合在W<sub>i+1</sub>内的热点讨论区。本发明实现了讨论区集合中热点讨论区的预测,具有较好的应用前景。
申请公布号 CN101645067A 申请公布日期 2010.02.10
申请号 CN200810117822.2 申请日期 2008.08.05
申请人 北京大学 发明人 李楠;梁循
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京君尚知识产权代理事务所(普通合伙) 代理人 余功勋
主权项 1.一种讨论区集合中热点讨论区的预测方法,其特征在于,包括下列步骤:a)针对目标讨论区集合,确定待预测的时间窗口Wi+1;b)获得目标讨论区集合内的各个讨论区在时间窗口Wi-1和时间窗口Wi内的特征向量,所述特征向量由显示讨论区受关注程度的多个属性组成,其中,Wi在时间上介于Wi-1和Wi+1之间;c)在Wi内,以各个讨论区的特征向量作为数据对象对各个讨论区进行聚类分析,并以得到的一个或多个类中心作为Wi内的热点讨论区;d)以各个讨论区在Wi-1内的特征向量作为输入并以Wi内的热点讨论区作为输出进行SVM学习;e)以各个讨论区在Wi内的特征向量作为上述学习后的SVM的输入,输出目标讨论区集合在Wi+1内的热点讨论区。
地址 100871北京市海淀区颐和园路5号