发明名称 |
一种内容审核方法和装置 |
摘要 |
本发明公开了一种内容审核方法和装置。在本发明依次通过前置过滤、用户分析、文本归类,不同类的文本采用不同的方式进行过滤,对词库采取分级计分的方式,最终采用人工审核方式对用户提交的内容进行审核,并进行反向培训。本发明的技术方案,能够准确、高效地完成内容审核工作。 |
申请公布号 |
CN102098332B |
申请公布日期 |
2014.04.16 |
申请号 |
CN201010615219.4 |
申请日期 |
2010.12.30 |
申请人 |
北京新媒传信科技有限公司 |
发明人 |
赵浩多 |
分类号 |
H04L29/08(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
H04L29/08(2006.01)I |
代理机构 |
北京市隆安律师事务所 11323 |
代理人 |
权鲜枝 |
主权项 |
一种内容审核方法,其特征在于,对于用户所提交的内容,该审核方法包括以下步骤:A、根据高危内容检测策略,对用户所提交的内容进行前置过滤处理,如命中,则拒绝上传该内容,否则执行步骤B;B、根据所维护的用户信息,判断是否允许该用户上传所提交的内容,是则执行步骤C,否则拒绝上传该内容;C、根据用户所提交的内容的长短,将其归类为长文本、短文本或昵称类;D、如果用户所提交的内容为短文本或昵称类,则通过分词提取特征信息,对特征信息进行MD5计算后与已有的样本库进行对比,如命中,则拒绝上传该内容,否则执行步骤E;如果用户所提交的内容为长文本,则直接执行步骤E;E、将用户所提交的内容与多级词库进行匹配,计算总分值,如果总分值大于或等于第一预设阀值,则拒绝上传该内容,如果总分值小于第一预设阀值且大于第二预设阀值,则执行步骤F,如果总分值小于或等于第二预设阀值,则上传该内容;F、人工审核用户所提交的内容,判断是否允许该用户上传所提交的内容,是则上传该内容,否则拒绝上传该内容;反向培训所述多级词库。 |
地址 |
100089 北京市海淀区万泉庄路28号万柳新贵大厦A座5层 |