发明名称 |
基于传播结构的微博谣言识别方法和系统 |
摘要 |
本发明提供了一种基于传播结构的微博谣言识别系统和方法,其通过支持向量机的机器学的方法,以微博的信息特征、用户特征以及传播特征的特征数据为数据,用随机游走法计算图核函数,再加上经典的径向基核函数,从而建立支持向量机模型,以用于识别谣言;每条微博用一棵传播树和一个特征向量表示,其中,传播树用以表示传播特征中的传播结构,特征向量的各维为信息特征、用户特征、非传播结构的传播特征;在识别微博时,利用模型建立模块已建立好的支持向量机模型,对待识别微博进行分类,根据分类结果从而判断待识别微博是否为谣言。本发明通过对微博信息传播结构的比较,可大幅提高鉴别微博谣言的准确率和召回率。 |
申请公布号 |
CN106354845A |
申请公布日期 |
2017.01.25 |
申请号 |
CN201610795407.7 |
申请日期 |
2016.08.31 |
申请人 |
上海交通大学 |
发明人 |
朱其立;吴克;杨松 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I;G06Q50/00(2012.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海汉声知识产权代理有限公司 31236 |
代理人 |
郭国中 |
主权项 |
一种基于传播结构的微博谣言识别系统,其特征在于,包括如下装置:数据采集模块:用于收集和提取微博的信息特征、用户特征以及传播特征;模型建立模块:用于通过支持向量机的机器学习的方法,以微博的信息特征、用户特征以及传播特征的特征数据为数据建立模型,以用于识别谣言;其中,建立模型时所使用的微博数据为数据库中的微博,即已经提前人工标记好是否为谣言的微博;每条微博用一棵传播树和一个特征向量表示,其中,传播树用以表示传播特征中的传播结构,将信息特征、用户特征、非传播结构的传播特征作为特征向量的各维;模型识别模块:用于利用模型建立模块已建立好的模型,分析待识别微博,从而判断待识别微博是否为谣言;其中,待识别微博的信息特征、用户特征和传播特征来自于数据采集模块。 |
地址 |
200240 上海市闵行区东川路800号 |