发明名称 导航网站实现方法和装置
摘要 本发明公开了一种导航网站实现方法和装置,属于互联网技术领域。所述装置包括:网站描述信息生成单元、客户端方访问者描述信息生成单元、概率潜在语义分析PLSA单元、综合处理单元、显示输出单元和收集单元。本发明的技术方案能够向客户端方访问者推荐其感兴趣的倾向访问的网站。
申请公布号 CN102915358A 申请公布日期 2013.02.06
申请号 CN201210392619.2 申请日期 2012.10.16
申请人 北京奇虎科技有限公司;奇智软件(北京)有限公司 发明人 彭仁刚;秦吉胜
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市隆安律师事务所 11323 代理人 权鲜枝;何立春
主权项 一种导航网站实现方法,包括:对网站列表中的每个网站,生成该网站的描述信息,将该网站的描述信息作为训练数据输入概率潜在语义分析PLSA模型,启动PLSA模型的训练过程,获取该网站所属的话题分类数据;其中,所述网站列表包括至少一个网站;综合所述网站列表中的每个网站所属的话题分类数据,得到每个话题分类数据所对应的网站;生成客户端方访问者的描述信息,将该客户端方访问者的描述信息作为预测数据输入PLSA模型,启动PLSA模型的预测过程,获取该客户端方访问者倾向访问的话题分类数据;根据该客户端方访问者倾向访问的话题分类数据和所述每个话题分类数据所对应的网站,确定该客户端方访问者倾向访问的目标网站,将客户端方访问者倾向访问的目标网站显示输出;其中,所述对网站列表中的每个网站,生成该网站的描述信息包括:收集该网站的相关信息,对收集到的该网站的相关信息依次进行规则化处理、分词处理、过滤无意义词的处理、对剩余词统计词频的处理,得到该网站的描述信息;所述生成客户端方访问者的描述信息包括:收集该客户端方访问者的相关信息,对收集到的该客户端方访问者的相关信息依次进行规则化处理、分词处理、过滤无意义词的处理、对剩余词统计词频的处理,得到该客户端方访问者的描述信息。
地址 100088 北京市西城区新街口外大街28号D座112室(德胜园区)