发明名称 基于传播结构的微博谣言识别方法和系统
摘要 本发明提供了一种基于传播结构的微博谣言识别系统和方法,其通过支持向量机的机器学的方法,以微博的信息特征、用户特征以及传播特征的特征数据为数据,用随机游走法计算图核函数,再加上经典的径向基核函数,从而建立支持向量机模型,以用于识别谣言;每条微博用一棵传播树和一个特征向量表示,其中,传播树用以表示传播特征中的传播结构,特征向量的各维为信息特征、用户特征、非传播结构的传播特征;在识别微博时,利用模型建立模块已建立好的支持向量机模型,对待识别微博进行分类,根据分类结果从而判断待识别微博是否为谣言。本发明通过对微博信息传播结构的比较,可大幅提高鉴别微博谣言的准确率和召回率。
申请公布号 CN106354845A 申请公布日期 2017.01.25
申请号 CN201610795407.7 申请日期 2016.08.31
申请人 上海交通大学 发明人 朱其立;吴克;杨松
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I;G06Q50/00(2012.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海汉声知识产权代理有限公司 31236 代理人 郭国中
主权项 一种基于传播结构的微博谣言识别系统,其特征在于,包括如下装置:数据采集模块:用于收集和提取微博的信息特征、用户特征以及传播特征;模型建立模块:用于通过支持向量机的机器学习的方法,以微博的信息特征、用户特征以及传播特征的特征数据为数据建立模型,以用于识别谣言;其中,建立模型时所使用的微博数据为数据库中的微博,即已经提前人工标记好是否为谣言的微博;每条微博用一棵传播树和一个特征向量表示,其中,传播树用以表示传播特征中的传播结构,将信息特征、用户特征、非传播结构的传播特征作为特征向量的各维;模型识别模块:用于利用模型建立模块已建立好的模型,分析待识别微博,从而判断待识别微博是否为谣言;其中,待识别微博的信息特征、用户特征和传播特征来自于数据采集模块。
地址 200240 上海市闵行区东川路800号