发明名称 一种基于混合协同过滤的Web服务QoS预测方法
摘要 本发明公开一种基于混合协同过滤的Web服务QoS预测方法,现有的Web服务QoS预测方法的预测精确度不高,特别是在QoS数据稀疏的情况下该情况更为严重,本发明根据用户和服务的相关信息,首先将用户和服务分类,然后根据目标用户和目标服务所属分类的不同使用不同的预测方法计算其QoS预测值,并在计算预测值的过程中使用改进的欧氏距离方法计算用户间和服务间的相似度。与传统方法相比,本发明具有较高的Web服务QoS的预测精度,尤其在历史QoS数据稀疏情况下,其预测精度相比现有方法有明显提高。
申请公布号 CN103139310B 申请公布日期 2016.04.27
申请号 CN201310070867.X 申请日期 2013.03.06
申请人 杭州电子科技大学 发明人 俞东进;吴萌萌;殷昱煜;李万清;穆海伦
分类号 H04L29/08(2006.01)I;H04L12/26(2006.01)I 主分类号 H04L29/08(2006.01)I
代理机构 杭州君度专利代理事务所(特殊普通合伙) 33240 代理人 杜军
主权项 一种基于混合协同过滤的Web服务QoS预测方法,定义1特殊用户类;用户QoS均值最大的N<sub>u</sub>个用户组成特殊用户类;其中,用户QoS均值是指与该用户相关的所有QoS记录的平均值,N<sub>u</sub>是控制特殊用户类中用户个数的阈值,根据实际情况指定;定义2特殊服务类;服务QoS均值最大的N<sub>s</sub>个服务组成特殊服务类;其中,服务QoS均值是指与该服务相关的所有QoS记录的平均值,N<sub>s</sub>是控制特殊服务类中服务个数的阈值,根据实际情况指定;定义3用户区域;将用户按照所在物理位置的不同分成f类,用户UR<sub>i</sub>表示属于第i个区域的用户的集合,用UR表示用户区域的集合,即UR={UR<sub>1</sub>,UR<sub>2</sub>,...,UR<sub>f</sub>};定义4区域敏感服务;若服务s满足s∈{s<sub>j</sub>||median(UR<sub>i</sub>,s<sub>j</sub>)‑median(UR,s<sub>j</sub>)|≥λ×MMAD(UR,s<sub>j</sub>)},则称服务s对区域UR<sub>i</sub>敏感;其中,s<sub>j</sub>表示一个名为s<sub>j</sub>的服务;λ为控制区域敏感服务的阈值,根据实际情况指定;median(UR<sub>i</sub>,s)表示区域UR<sub>i</sub>中用户调用服务s所得QoS记录的集合的中值,简称区域UR<sub>i</sub>的中值;median(UR,s)表示用户区域集合UR中各个区域中值所组成的集合的中值;MMAD(UR,s)表示用户区域集合UR中各个区域中值与median(UR,s)的差的绝对值所组成的集合的中值,计算公式为MMAD(UR,s)=median(|median(UR<sub>i</sub>,s)‑median(UR,s)|),i=1,2,...,f,median(UR,s<sub>j</sub>)表示区域UR中用户调用服务s<sub>j</sub>所得QoS记录的集合的中值;定义5区域中心;区域UR<sub>i</sub>对服务s的中心是指:区域UR<sub>i</sub>中所有用户调用服务s所得QoS集合的中值,计算公式为:<img file="FDA0000894834970000012.GIF" wi="685" he="71" />定义6用户相似度;用户u<sub>1</sub>和u<sub>2</sub>的相似度使用改进欧式距离计算,具体公式为:<img file="FDA0000894834970000011.GIF" wi="541" he="155" />其中,S表示用户u<sub>1</sub>和u<sub>2</sub>共同调用过的服务集合,|S|表示用户u<sub>1</sub>和用户u<sub>2</sub>共同调用服务的个数,d<sub>s</sub>表示服务s被用户调用所得QoS数据的标准偏差,计算公式为:<img file="FDA0000894834970000021.GIF" wi="575" he="159" />U<sub>s</sub>表示调用服务s的用户集合,|U<sub>s</sub>|表示调用服务s的用户的个数,<img file="FDA0000894834970000029.GIF" wi="73" he="59" />表示用户u<sub>i</sub>调用服务s的QoS值,<img file="FDA0000894834970000022.GIF" wi="48" he="65" />表示与服务s相关的所有QoS记录的平均值,r<sub>u,s</sub>表示用户u调用服务s的QoS值;定义7服务相似度;服务s<sub>1</sub>和s<sub>2</sub>的相似度使用改进欧式距离计算,具体公式为:<img file="FDA0000894834970000023.GIF" wi="541" he="153" />其中,U表示共同调用服务s<sub>1</sub>和s<sub>2</sub>的用户集合,|U|表示共同调用服务s<sub>1</sub>和s<sub>2</sub>的用户的个数,d<sub>u</sub>表示用户u调用服务所得QoS数据的标准偏差,计算公式为:<img file="FDA0000894834970000024.GIF" wi="565" he="156" />S<sub>u</sub>表示用户u调用的服务集合,|S<sub>u</sub>|表示用户u调用服务的个数,r<sub>u,s</sub>表示用户u调用服务s的QoS值,<img file="FDA0000894834970000025.GIF" wi="58" he="67" />表示与服务u相关的所有QoS记录的平均值;定义8综合预测方法;综合预测方法的计算公式为:P(r<sub>u,s</sub>)=w<sub>u</sub>*P<sub>u</sub>+w<sub>s</sub>*P<sub>s</sub>,其中,P<sub>u</sub>表示基于用户的预测结果,计算公式为<img file="FDA0000894834970000026.GIF" wi="511" he="151" />L<sub>u</sub>表示目标用户u的相似邻居集合,<img file="FDA00008948349700000210.GIF" wi="68" he="60" />表示用户u<sub>1</sub>调用服务s的QoS,<img file="FDA00008948349700000211.GIF" wi="70" he="63" />表示用户u与u<sub>1</sub>的相似度,P<sub>s</sub>表示基于服务的预测结果,计算公式为<img file="FDA0000894834970000027.GIF" wi="488" he="142" />其中L<sub>s</sub>表示目标服务s的相似邻居集合,<img file="FDA00008948349700000212.GIF" wi="61" he="61" />表示用户u调用服务s<sub>1</sub>的QoS,<img file="FDA00008948349700000213.GIF" wi="59" he="51" />表示服务s与服务s<sub>1</sub>的相似度,w<sub>u</sub>和w<sub>s</sub>分别表示基于用户预测结果和基于服务预测结果的权重,w<sub>u</sub>+w<sub>s</sub>=1,计算公式为:<img file="FDA0000894834970000028.GIF" wi="975" he="110" />con<sub>u</sub>和con<sub>s</sub>分别为调节基于用户和基于服务预测结果权重的固定因子,计算公式为:<img file="FDA0000894834970000031.GIF" wi="910" he="174" />w为调节基于用户和基于服务预测结果权重的可变因子,根据实际情况指定;其特征在于该方法包括以下步骤:步骤(1)获取用户调用Web服务QoS历史记录信息,并将所获取的初始QoS矩阵正规化,具体计算公式为:<img file="FDA0000894834970000032.GIF" wi="396" he="157" />其中,r<sub>u,s</sub>表示用户u调用服务s的QoS,<img file="FDA0000894834970000033.GIF" wi="54" he="64" />表示与用户u相关的所有QoS记录的平均值,σ<sub>u</sub>表示用户u调用服务所得QoS数据的标准偏差,r′<sub>u,s</sub>表示将所获取的初始QoS矩阵正规化得到的值;步骤(2)根据用户和服务的相关信息,将用户分为普通用户类和特殊用户类,将服务分为普通服务类、特殊服务类和区域敏感服务类;根据定义1确定特殊用户类,根据定义2确定特殊服务类,根据定义3和定义4确定区域敏感服务类,未被划分入特殊用户类、特殊服务类、区域敏感服务类的用户和服务分别组成普通用户类和普通服务类;步骤(3)目标用户属于特殊用户类,而目标服务不属于特殊服务类,则使用UMEAN方法计算预测值,即将目标用户调用过的QoS记录的均值作为预测值;步骤(4)目标服务属于特殊服务类,而目标用户不属于特殊用户类,则使用IMEAN方法计算预测值,即将目标服务被调用的QoS记录的均值作为预测值;步骤(5)目标服务属于特殊服务类,且目标用户属于特殊用户类,则将使用UMEAN方法和IMEAN方法获得的预测值的均值作为最终的预测值;步骤(6)目标服务对于目标用户所属区域敏感,根据定义5,将目标用户所属区域对目标服务的中心作为最终的预测值;步骤(7)目标用户和目标服务分别属于普通用户类和普通服务类,根据定义6和定义7,使用改进欧氏距离计算用户间和服务间的相似度,使用Top‑K算法选择目标用户和目标服务的相似邻居,最后根据定义8使用综合预测方法计算最终的预测值。
地址 310018 浙江省杭州市下沙高教园区2号大街