发明名称 一种基于连续时间马尔科夫链的网站导航性实现方法
摘要 基于连续时间马尔科夫链的网站导航性实现方法采用连续时间马尔科夫链为用户访问行为建模,以期对网站的导航性和网页的重要性做更接近实际情况的评价。网站导航性在网站设计、改进和质量评价方面受到越来越多的重视。基于连续时间马尔科夫链的网站导航度量不但考虑了网站的链接结构,还考虑了了网页内容好坏对导航性的影响。通过对用户日志的分析获取用户在网页上访问时序及停留时间,在此基础上建立连续时间马尔科夫的嵌入链模型和用户停留时间的指数分布模型,综合两种模型得到连续时间马尔科大链模型,最终得到基于连续时间马尔科夫链模型的网站导航性度量。本发明具有比已有的度量方法更好的网站导航性评价效果。
申请公布号 CN101826104A 申请公布日期 2010.09.08
申请号 CN201010139891.0 申请日期 2010.04.02
申请人 南京邮电大学 发明人 张卫丰;刘霞;张迎周;周国强;陆柳敏;许碧娣;朱丹梅;陆柳清
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 南京经纬专利商标代理有限公司 32200 代理人 叶连生
主权项 一种基于连续时间马尔科夫链的网站导航性实现方法,其特征在于该方法具体包括如下步骤:步骤1):建立用户访问行为的连续时间马尔科夫链模型以及它对应的嵌入式离散马尔科夫链;步骤2):使用网页爬虫工具收集一个网站的链接边,构建链接关系图;主要是一个链接关系矩阵,其矩阵元素表示网页间是否存在链接,简单的说,一个链接关系图就是用结点表示网页,用有向边表示网页之间的超链接;步骤3):以会话为单位划分用户访问日志;步骤4):遍历会话集合,统计网页的平均停留时间,生成网页之间的点击关系图,该图用一个点击关系矩阵表示,矩阵元素表示网页间转向的次数;步骤5):根据上述链接关系图,点击关系图以及网页平均停留时间估计网页之间的转移概率和每个网页上的转移速率;步骤6):利用幂法先计算嵌入式离散马尔科夫链的平稳分布,再计算原始模型的平稳分布,步骤7):计算连续时间马尔科夫链的平稳分布。
地址 210003 江苏省南京市新模范马路66号