发明名称 高质量版本的筛选方法及系统
摘要 本发明公开一种高质量版本的筛选方法及系统,该方法包括:读取用户创建的百科版本数据,并对百科版本数据进行解析;对解析后得到的信息进行统计分析;根据统计分析的结果,过滤百科版本数据,并对符合预定标准的百科版本执行简单编辑版本进程或复杂编辑版本进程。发明能够在降低人工筛选投入的前提下,有效提高对复杂编辑的百科版本数据的筛选效率。进一步地,对进入简单编辑版本进程或复杂编辑版本进程的百科版本执行连续版本过滤进程,从而更加准确地从海量百科数据中筛选出待审核的高质量百科版本。通过快速准确筛选出高质量版本和非高质量版本,有针对性地引导用户持续完善词条信息,同时还有利于完善对百科用户的分级管理。
申请公布号 CN102314453B 申请公布日期 2015.11.25
申请号 CN201010222129.9 申请日期 2010.06.30
申请人 百度在线网络技术(北京)有限公司 发明人 支静;陈兴华;王龙
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京金律言科知识产权代理事务所(普通合伙) 11461 代理人 罗延红
主权项 一种高质量版本的筛选方法,其特征在于,所述方法包括:读取用户创建的百科版本数据,并对所述百科版本数据进行解析;对解析后得到的信息进行统计分析;根据统计分析的结果,判断所述百科版本数据的变化量是否高于复杂版本变化量阈值,并对符合预定标准的百科版本执行相应的简单编辑版本进程或复杂编辑版本进程,以筛选出待审核的高质量版本进入高质量版本审核区。
地址 100085 北京市海淀区上地十街10号百度大厦