发明名称 处理新闻数据的方法及装置
摘要 本发明提供一种处理新闻数据的方法及装置,涉及互联网技术领域,能够解决现有技术中识别影视相关新闻时准确率较低的问题。本发明的方法包括:获取待识别的新闻库;将新闻库中满足预设关注条件的新闻添加到第一候选新闻集合中,预设关注条件用于限定新闻受关注程度;分别将第一候选新闻集合中每篇新闻的新闻标题与目标对象的信息进行匹配;将匹配成功的新闻标题对应的新闻添加到第二候选新闻集合中;将第二候选新闻集合中满足预设相关条件的新闻正文对应的新闻确定为与目标对象相关的新闻,预设相关条件用于限定新闻正文包含与目标对象不相关信息的程度以及相关信息的程度。本发明主要适用于识别某影视相关新闻的场景中。
申请公布号 CN106294765A 申请公布日期 2017.01.04
申请号 CN201610657518.1 申请日期 2016.08.11
申请人 乐视控股(北京)有限公司;乐视网信息技术(北京)股份有限公司 发明人 康潮明
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京鼎佳达知识产权代理事务所(普通合伙) 11348 代理人 王伟锋;刘铁生
主权项 一种处理新闻数据的方法,其特征在于,所述方法包括:获取待识别的新闻库;将所述新闻库中满足预设关注条件的新闻添加到第一候选新闻集合中,所述预设关注条件用于限定新闻受关注程度;分别将所述第一候选新闻集合中每篇新闻的新闻标题与目标对象的信息进行匹配;将匹配成功的新闻标题对应的新闻添加到第二候选新闻集合中;将所述第二候选新闻集合中满足预设相关条件的新闻正文对应的新闻确定为与所述目标对象相关的新闻,所述预设相关条件用于限定新闻正文包含与所述目标对象不相关信息的程度以及相关信息的程度。
地址 100025 北京市朝阳区姚家园路105号3号楼10层1102