发明名称 | 一种讨论区集合中热点讨论区的预测方法 | ||
摘要 | 本发明公开了一种讨论区集合中热点讨论区的预测方法,属于互联网信息挖掘领域,其包括下列步骤:针对目标讨论区集合,确定待预测的时间窗口W<sub>i+1</sub>;获得目标讨论区集合内的各个讨论区在时间窗口W<sub>i-1</sub>和时间窗口W<sub>i</sub>内的特征向量,所述特征向量由显示讨论区受关注程度的多个属性组成;在W<sub>i</sub>内,以各个讨论区的特征向量作为数据对象对各个讨论区进行聚类分析,并以得到的一个或多个类中心作为W<sub>i</sub>内的热点讨论区;以各个讨论区在W<sub>i-1</sub>内的特征向量作为输入并以W<sub>i</sub>内的热点讨论区作为输出进行SVM学;以各个讨论区在W<sub>i</sub>内的特征向量作为上述学后的SVM的输入,输出目标讨论区集合在W<sub>i+1</sub>内的热点讨论区。本发明实现了讨论区集合中热点讨论区的预测,具有较好的应用前景。 | ||
申请公布号 | CN101645067A | 申请公布日期 | 2010.02.10 |
申请号 | CN200810117822.2 | 申请日期 | 2008.08.05 |
申请人 | 北京大学 | 发明人 | 李楠;梁循 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京君尚知识产权代理事务所(普通合伙) | 代理人 | 余功勋 |
主权项 | 1.一种讨论区集合中热点讨论区的预测方法,其特征在于,包括下列步骤:a)针对目标讨论区集合,确定待预测的时间窗口Wi+1;b)获得目标讨论区集合内的各个讨论区在时间窗口Wi-1和时间窗口Wi内的特征向量,所述特征向量由显示讨论区受关注程度的多个属性组成,其中,Wi在时间上介于Wi-1和Wi+1之间;c)在Wi内,以各个讨论区的特征向量作为数据对象对各个讨论区进行聚类分析,并以得到的一个或多个类中心作为Wi内的热点讨论区;d)以各个讨论区在Wi-1内的特征向量作为输入并以Wi内的热点讨论区作为输出进行SVM学习;e)以各个讨论区在Wi内的特征向量作为上述学习后的SVM的输入,输出目标讨论区集合在Wi+1内的热点讨论区。 | ||
地址 | 100871北京市海淀区颐和园路5号 |