发明名称 一种内容审核方法和装置
摘要 本发明公开了一种内容审核方法和装置。在本发明依次通过前置过滤、用户分析、文本归类,不同类的文本采用不同的方式进行过滤,对词库采取分级计分的方式,最终采用人工审核方式对用户提交的内容进行审核,并进行反向培训。本发明的技术方案,能够准确、高效地完成内容审核工作。
申请公布号 CN102098332B 申请公布日期 2014.04.16
申请号 CN201010615219.4 申请日期 2010.12.30
申请人 北京新媒传信科技有限公司 发明人 赵浩多
分类号 H04L29/08(2006.01)I;G06F17/30(2006.01)I 主分类号 H04L29/08(2006.01)I
代理机构 北京市隆安律师事务所 11323 代理人 权鲜枝
主权项 一种内容审核方法,其特征在于,对于用户所提交的内容,该审核方法包括以下步骤:A、根据高危内容检测策略,对用户所提交的内容进行前置过滤处理,如命中,则拒绝上传该内容,否则执行步骤B;B、根据所维护的用户信息,判断是否允许该用户上传所提交的内容,是则执行步骤C,否则拒绝上传该内容;C、根据用户所提交的内容的长短,将其归类为长文本、短文本或昵称类;D、如果用户所提交的内容为短文本或昵称类,则通过分词提取特征信息,对特征信息进行MD5计算后与已有的样本库进行对比,如命中,则拒绝上传该内容,否则执行步骤E;如果用户所提交的内容为长文本,则直接执行步骤E;E、将用户所提交的内容与多级词库进行匹配,计算总分值,如果总分值大于或等于第一预设阀值,则拒绝上传该内容,如果总分值小于第一预设阀值且大于第二预设阀值,则执行步骤F,如果总分值小于或等于第二预设阀值,则上传该内容;F、人工审核用户所提交的内容,判断是否允许该用户上传所提交的内容,是则上传该内容,否则拒绝上传该内容;反向培训所述多级词库。
地址 100089 北京市海淀区万泉庄路28号万柳新贵大厦A座5层