发明名称 一种基于用户行为的信息推荐方法
摘要 本发明涉及一种基于用户行为的信息推荐方法,方法步骤为:步骤(1)数据来源;通过网络爬虫爬取了网络上的网页信息,并使用最大块密度算法抽取了网页中的正文,使用IKAnalyzer进行分词,使用聚类算法将词进行聚类,最终通过多个类形成了一个索引网;步骤(2)用户行为处理:系统会自动为用户分配一个唯一的用户号;会自动记录用户的搜索内容和与搜索结果的交互情况下来并存入;步骤(3)进行推荐:以现有数据为基础,用基于内容推荐的算法为用户推荐。本发明添加相应的推荐算法,为用户推荐感兴趣的信息供用户进行选择,并在一定程度上影响搜索结果的排名,使得排名更符合不同用户的兴趣。
申请公布号 CN103678710A 申请公布日期 2014.03.26
申请号 CN201310747338.9 申请日期 2013.12.31
申请人 同济大学 发明人 蒋昌俊;陈闳中;闫春钢;丁志军;王鹏伟;何源;陈雨忱
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 上海天协和诚知识产权代理事务所 31216 代理人 叶凤
主权项 一种基于用户行为的信息推荐方法,其特征在于,方法步骤为:步骤(1)数据来源,具体为:通过网络爬虫爬取了网络上的网页信息,并使用最大块密度算法抽取了网页中的正文,使用IKAnalyzer进行分词,使用聚类算法将词进行聚类,最终通过形成了多个类,同时在每个类中都有一个中心词用于较好地刻画这个类,如此网络中的海量词语就形成了一个索引网;步骤(2)用户行为处理,具体为:当用户使用搜索引擎进行搜索时,系统会自动为该用户分配一个唯一的用户号;当用户登录后,系统会自动把用户的搜索内容和与搜索结果的交互情况记录下来,并存入数据库中;所述数据库使用了一维向量来刻画用户的搜索行为;当用户登录系统之后,输入关键字进行搜索,那么就使用向量<ID,word,num,class>(ID表示用户ID,word表示关键词,num表示搜索该关键词的次数,class表示该关键词所属的类)来记录用户的搜索行为;当呈现了搜索结果之后,如果用户点击了相应的搜索内容,则同样记录用户点击行为,即使用向量<ID, class, count>(ID表示用户ID,class表示点击内容所属的类,count表示点击该类的次数)来表示;步骤(3)进行推荐,具体为:推荐算法是以现有数据为基础,采用基于内容推荐的算法为用户进行推荐。
地址 200092 上海市杨浦区四平路1239号