发明名称 一种检测重复聊天内容的方法及装置
摘要 本发明涉及一种聊天内容检测方法及装置,属于信息处理领域,具体是涉及一种检测重复聊天内容的方法及装置。本发明通过检测每一条聊天内容中字符重复数量和重复比例,来判定该条聊天消息是否为重复,从而删除或隐藏重复消息。
申请公布号 CN106021231A 申请公布日期 2016.10.12
申请号 CN201610349113.1 申请日期 2016.05.24
申请人 武汉斗鱼网络科技有限公司 发明人 霍启圣
分类号 G06F17/27(2006.01)I;G06Q50/00(2012.01)I 主分类号 G06F17/27(2006.01)I
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人 鲁力
主权项 一种检测重复聊天内容的方法,其特征在于,包括:步骤1,接收用户输入的重复字符阈值、重符字符数量阈值和重复字符占有率阈值;步骤2,接收用户在聊天室中输入的消息,将所述消息拆分成单个字符,并统计各字符在消息中出现的次数;步骤3,将在消息中出现次数超过所述重复字符阈值的字符判断为重复字符;统计消息中的重复字符数量,并将消息中的所有重复字符的出现次数加权得到重复字符总字数;根据所述重复字符总字数与消息的字符数之比得到消息的重复字符占有率;步骤4,将重符字符数量超过重符字符数量阈值和/或重复字符占有率超过重复字符占有率阈值的消息判定为重复消息。
地址 430000 湖北省武汉市东湖开发区华工科技园创新企业基地2栋A单元2层