发明名称 |
信息过滤方法及系统 |
摘要 |
本发明实施例提出一种信息过滤方法及系统,其方法包括:设置一通用数据库,通用数据库中预存有多个文本信息;采集特定站点上的用户特有信息;从用户特有信息中过滤出具有分类能力的词;分别计算过滤出的每一个词在用户特有信息中的出现次数以及在通用数据库的文本信息中的出现次数,并根据计算结果以及预设的规则从具有分类能力的词中筛选出与用户相关的关键词;利用关键词计算通用数据库中的每一个文本信息与用户的相关性;根据计算出的相关性对通用数据库中的文本信息进行过滤。本发明以用户特有信息为标本,实现信息的自动化过滤,关键词完全从特定站点获取,不存在冷启动问题,且不需要人工干预,人力成本低,分析效率高,通用性强。 |
申请公布号 |
CN105512300A |
申请公布日期 |
2016.04.20 |
申请号 |
CN201510919717.0 |
申请日期 |
2015.12.11 |
申请人 |
宁波中青华云新媒体科技有限公司 |
发明人 |
冯建兴;张云刚;翁时锋;梁丰;王遵义 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
上海唯源专利代理有限公司 31229 |
代理人 |
曾耀先 |
主权项 |
一种信息过滤方法,其特征在于,包括:设置一通用数据库,所述通用数据库中预存有多个文本信息;采集特定站点上的用户特有信息;从所述用户特有信息中过滤出具有分类能力的词;分别计算过滤出的每一个词在所述用户特有信息中的出现次数以及在所述通用数据库的文本信息中的出现次数,并根据计算结果以及预设的规则从所述具有分类能力的词中筛选出与用户相关的关键词;利用所述关键词计算所述通用数据库中的每一个文本信息与用户的相关性;根据计算出的相关性对所述通用数据库中的文本信息进行过滤。 |
地址 |
315199 浙江省宁波市鄞州区泰康中路666号迪趣大厦8楼 |