发明名称 基于多维相似度的个性化新闻推荐方法
摘要 一种基于多维相似度的个性化新闻推荐方法:先从新闻日志抽取设定时间记录,根据新闻源地址抓取新闻并抽取标题和正文,对其进行分词和提取名词,并用主题模型分析该名词序列而得到该新闻的主题特征向量;再根据新闻的主题特征向量和用户行为数据,分别构建用户模型和新闻模型;然后根据用户模型、新闻模型和时间特征分别计算用户和新闻的内容相似度与行为相似度,并据此计算最终的用户相似度和最终的新闻相似度,并分别提取最相似的多个用户和多个新闻;最后,依据最近的新闻日志记录和与设定用户最相似的多个相似用户,生成基于用户的个性化推荐结果;或依据设定用户产生行为的新闻和与该新闻最相似的多个新闻,生成基于新闻的个性化推荐结果。
申请公布号 CN102929928A 申请公布日期 2013.02.13
申请号 CN201210355209.0 申请日期 2012.09.21
申请人 北京格致璞科技有限公司;北京邮电大学 发明人 叶小卫;曹一鸣;卢美莲;王明华;李佳珊;刘金亮
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京德琦知识产权代理有限公司 11018 代理人 夏宪富
主权项 一种基于多维相似度的个性化新闻推荐方法,其特征在于:先从新闻日志抽取设定时间的日志记录,根据日志记录的新闻源地址抓取新闻内容;并从该新闻内容中抽取标题和正文,对其进行分词处理和提取名词,以及采用主题模型对所得到的名词序列进行分析,得到该新闻的主题特征向量;接着,根据新闻的主题特征向量和用户行为数据,分别构建用户模型和新闻模型;根据用户模型、新闻模型和时间特征分别计算用户的内容相似度、行为相似度,以及新闻的内容相似度、行为相似度;再基于内容相似度和行为相似度计算最终的用户相似度和最终的新闻相似度,并分别提取最相似的多个用户和多个新闻;然后,分别依据最近的新闻日志记录和与设定用户最相似的多个相似用户,生成基于用户的个性化推荐结果;或者依据设定用户产生行为的新闻和与该新闻最相似的多个新闻,生成基于新闻的个性化推荐结果。
地址 102399 北京市门头沟区妙峰山镇水丁路1号
您可能感兴趣的专利