发明名称 一种基于混合协同过滤的Web服务QoS预测方法
摘要 本发明公开一种基于混合协同过滤的Web服务QoS预测方法,现有的Web服务QoS预测方法的预测精确度不高,特别是在QoS数据稀疏的情况下该情况更为严重,本发明根据用户和服务的相关信息,首先将用户和服务分类,然后根据目标用户和目标服务所属分类的不同使用不同的预测方法计算其QoS预测值,并在计算预测值的过程中使用改进的欧氏距离方法计算用户间和服务间的相似度。与传统方法相比,本发明具有较高的Web服务QoS的预测精度,尤其在历史QoS数据稀疏情况下,其预测精度相比现有方法有明显提高。
申请公布号 CN103139310A 申请公布日期 2013.06.05
申请号 CN201310070867.X 申请日期 2013.03.06
申请人 杭州电子科技大学 发明人 俞东进;吴萌萌;殷昱煜;李万清;穆海伦
分类号 H04L29/08(2006.01)I;H04L12/26(2006.01)I 主分类号 H04L29/08(2006.01)I
代理机构 杭州求是专利事务所有限公司 33200 代理人 杜军
主权项 1.一种基于混合协同过滤的Web服务QoS预测方法,定义1 特殊用户类;用户QoS均值最大的<img file="201310070867X100001DEST_PATH_IMAGE002.GIF" wi="21" he="21" />个用户组成“特殊用户类”;其中,用户QoS均值是指与该用户相关的所有QoS记录的平均值,<img file="97035DEST_PATH_IMAGE002.GIF" wi="21" he="21" />是控制特殊用户类中用户个数的阈值,可根据实际情况指定;定义2 特殊服务类;服务QoS均值最大的<img file="201310070867X100001DEST_PATH_IMAGE004.GIF" wi="20" he="21" />个服务组成“特殊服务类”;其中,服务QoS均值是指与该服务相关的所有QoS记录的平均值,<img file="184202DEST_PATH_IMAGE004.GIF" wi="20" he="21" />是控制特殊服务类中服务个数的阈值,可根据实际情况指定;定义3 用户区域;将用户按照所在物理位置的不同分成f类,用户<img file="201310070867X100001DEST_PATH_IMAGE006.GIF" wi="25" he="26" />表示属于第i个区域的用户的集合,用<img file="201310070867X100001DEST_PATH_IMAGE008.GIF" wi="24" he="21" />表示用户区域的集合,即<img file="201310070867X100001DEST_PATH_IMAGE010.GIF" wi="138" he="26" />;定义4区域敏感服务;若服务s满足<img file="201310070867X100001DEST_PATH_IMAGE012.GIF" wi="348" he="32" />,则称服务s对区域<img file="201310070867X100001DEST_PATH_IMAGE014.GIF" wi="21" he="42" />敏感;其中,<img file="201310070867X100001DEST_PATH_IMAGE016.GIF" wi="16" he="22" />表示一个名为<img file="489413DEST_PATH_IMAGE016.GIF" wi="16" he="22" />的服务;<img file="201310070867X100001DEST_PATH_IMAGE018.GIF" wi="9" he="21" />为控制区域敏感服务的阈值,可根据实际情况指定;<img file="201310070867X100001DEST_PATH_IMAGE020.GIF" wi="81" he="21" />表示区域<img file="91558DEST_PATH_IMAGE006.GIF" wi="25" he="26" />中用户调用服务s所得QoS记录的集合的中值,简称区域<img file="201310070867X100001DEST_PATH_IMAGE022.GIF" wi="25" he="21" />的中值;<img file="201310070867X100001DEST_PATH_IMAGE024.GIF" wi="77" he="21" />表示用户区域集合<img file="756894DEST_PATH_IMAGE008.GIF" wi="24" he="21" />中各个区域中值所组成的集合的中值;<img file="201310070867X100001DEST_PATH_IMAGE026.GIF" wi="79" he="21" />表示用户区域集合<img file="106359DEST_PATH_IMAGE008.GIF" wi="24" he="21" />中各个区域中值与<img file="201310070867X100001DEST_PATH_IMAGE028.GIF" wi="82" he="21" />的差的绝对值所组成的集合的中值,计算公式为<img file="201310070867X100001DEST_PATH_IMAGE030.GIF" wi="379" he="42" />;定义5区域中心;区域<img file="129941DEST_PATH_IMAGE006.GIF" wi="25" he="26" />对服务s的中心是指:区域<img file="858862DEST_PATH_IMAGE006.GIF" wi="25" he="26" />中所有用户调用服务s所得QoS集合的中值,计算公式为:<img file="201310070867X100001DEST_PATH_IMAGE032.GIF" wi="213" he="24" />;定义6 用户相似度;本发明中,用户u<sub>1</sub>和u<sub>2</sub>的相似度使用改进欧式距离计算,具体公式为:<img file="201310070867X100001DEST_PATH_IMAGE034.GIF" wi="169" he="51" />,其中,<img file="201310070867X100001DEST_PATH_IMAGE036.GIF" wi="14" he="17" />表示用户u<sub>1</sub>和u<sub>2</sub>共同调用过的服务集合,<img file="201310070867X100001DEST_PATH_IMAGE038.GIF" wi="18" he="24" />表示用户u<sub>1</sub>和用户u<sub>2</sub>共同调用服务的个数,<img file="201310070867X100001DEST_PATH_IMAGE040.GIF" wi="16" he="19" />表示服务s被用户调用所得QoS数据的标准偏差,计算公式为:<img file="201310070867X100001DEST_PATH_IMAGE042.GIF" wi="178" he="53" />,<img file="201310070867X100001DEST_PATH_IMAGE044.GIF" wi="17" he="42" />表示调用服务s的用户集合,<img file="201310070867X100001DEST_PATH_IMAGE046.GIF" wi="25" he="42" />表示调用服务s的用户的个数,<img file="201310070867X100001DEST_PATH_IMAGE048.GIF" wi="21" he="42" />表示用户u<sub>i</sub>调用服务s的QoS值,<img file="201310070867X100001DEST_PATH_IMAGE050.GIF" wi="12" he="42" />表示与服务s相关的所有QoS记录的平均值;定义7 服务相似度;本发明中,服务s<sub>1</sub>和s<sub>2</sub>的相似度使用改进欧式距离计算,具体公式为:<img file="201310070867X100001DEST_PATH_IMAGE052.GIF" wi="170" he="50" />,其中,<img file="201310070867X100001DEST_PATH_IMAGE054.GIF" wi="17" he="17" />表示共同调用服务s<sub>1</sub>和s<sub>2</sub>的用户集合,<img file="201310070867X100001DEST_PATH_IMAGE056.GIF" wi="21" he="24" />表示共同调用服务s<sub>1</sub>和s<sub>2</sub>的用户的个数,<img file="201310070867X100001DEST_PATH_IMAGE058.GIF" wi="18" he="22" />表示表示用户u调用服务所得QoS数据的标准偏差,计算公式为:<img file="201310070867X100001DEST_PATH_IMAGE060.GIF" wi="177" he="53" />,<img file="201310070867X100001DEST_PATH_IMAGE062.GIF" wi="15" he="42" />表示用户u调用的服务集合,<img file="201310070867X100001DEST_PATH_IMAGE064.GIF" wi="23" he="42" />表示用户u调用服务的个数,<img file="201310070867X100001DEST_PATH_IMAGE066.GIF" wi="19" he="42" />表示用户u调用服务s的QoS值,<img file="201310070867X100001DEST_PATH_IMAGE068.GIF" wi="17" he="28" />表示与服务u相关的所有QoS记录的平均值;定义8 综合预测方法;综合预测方法的计算公式为:<img file="201310070867X100001DEST_PATH_IMAGE070.GIF" wi="147" he="24" />,其中,<img file="201310070867X100001DEST_PATH_IMAGE072.GIF" wi="17" he="21" />表示基于用户的预测结果,计算公式为<img file="201310070867X100001DEST_PATH_IMAGE074.GIF" wi="162" he="54" />(<img file="201310070867X100001DEST_PATH_IMAGE076.GIF" wi="18" he="21" />表示目标用户u的相似邻居集合,<img file="201310070867X100001DEST_PATH_IMAGE078.GIF" wi="19" he="42" />表示用户u<sub>1</sub>调用服务s的QoS,<img file="201310070867X100001DEST_PATH_IMAGE080.GIF" wi="25" he="25" />表示用户u与u<sub>1</sub>的相似度),<img file="201310070867X100001DEST_PATH_IMAGE082.GIF" wi="20" he="22" />表示基于服务的预测结果,计算公式为<img file="201310070867X100001DEST_PATH_IMAGE084.GIF" wi="166" he="54" />其中<img file="201310070867X100001DEST_PATH_IMAGE086.GIF" wi="17" he="21" />表示目标服务s的相似邻居集合,<img file="201310070867X100001DEST_PATH_IMAGE088.GIF" wi="17" he="42" />表示用户u调用服务s<sub>1</sub>的QoS,<img file="201310070867X100001DEST_PATH_IMAGE090.GIF" wi="19" he="42" />表示服务s与服务s<sub>1</sub>的相似度,<img file="201310070867X100001DEST_PATH_IMAGE092.GIF" wi="19" he="23" />和<img file="201310070867X100001DEST_PATH_IMAGE094.GIF" wi="19" he="23" />(<img file="201310070867X100001DEST_PATH_IMAGE096.GIF" wi="65" he="23" />)分别表示基于用户预测结果和基于服务预测结果的权重,计算公式为:<img file="201310070867X100001DEST_PATH_IMAGE098.GIF" wi="149" he="39" />,<img file="201310070867X100001DEST_PATH_IMAGE100.GIF" wi="145" he="38" />,<img file="201310070867X100001DEST_PATH_IMAGE102.GIF" wi="29" he="22" />和<img file="201310070867X100001DEST_PATH_IMAGE104.GIF" wi="29" he="22" />分别为调节基于用户和基于服务预测结果权重的固定因子,计算公式为:<img file="201310070867X100001DEST_PATH_IMAGE106.GIF" wi="138" he="49" />,<img file="201310070867X100001DEST_PATH_IMAGE108.GIF" wi="133" he="50" />,<img file="201310070867X100001DEST_PATH_IMAGE110.GIF" wi="16" he="14" />为调节基于用户和基于服务预测结果权重的可变因子,可根据实际情况指定;其特征在于该方法包括以下步骤: 步骤(1) 获取用户调用Web服务QoS历史记录信息,并将所获取的初始QoS矩阵正规化,具体计算公式为:<img file="201310070867X100001DEST_PATH_IMAGE112.GIF" wi="121" he="52" />,其中,<img file="201310070867X100001DEST_PATH_IMAGE114.GIF" wi="22" he="26" />表示用户u调用服务s的QoS,<img file="931817DEST_PATH_IMAGE068.GIF" wi="17" he="28" />表示与用户u相关的所有QoS记录的平均值,<img file="201310070867X100001DEST_PATH_IMAGE116.GIF" wi="21" he="25" />表示用户u调用服务所得QoS数据的标准偏差;步骤(2) 根据用户和服务的相关信息,将用户分为“普通用户类”和“特殊用户类”,将服务分为“普通服务类”、“特殊服务类”和“区域敏感服务类”;根据定义1确定“特殊用户类”,根据定义2确定“特殊服务类”,根据定义3和定义4确定“区域敏感服务类”,未被划分入以上任意类的用户和服务分别组成“普通用户类”和“普通服务类”;步骤(3)目标用户属于“特殊用户类”,而目标服务不属于“特殊服务类”,则使用UMEAN方法计算预测值,即将目标用户调用过的QoS记录的均值作为预测值;步骤(4) 目标服务属于“特殊服务类”,而目标用户不属于“特殊用户类”,则使用IMEAN方法计算预测值,即将目标服务被调用的QoS记录的均值作为预测值;步骤(5) 目标服务属于“特殊服务类”,且目标用户属于“特殊用户类”,则将使用UMEAN方法和IMEAN方法获得的预测值的均值作为最终的预测值;步骤(6) 目标服务对于目标用户所属区域敏感,根据定义5,将目标用户所属区域对目标服务的中心作为最终的预测值;步骤(7) 目标用户和目标服务分别属于“普通用户类”和“普通服务类”,根据定义6和定义7,使用改进欧氏距离计算用户间和服务间的相似度,使用Top-K算法选择目标用户和目标服务的相似邻居,最后根据定义8使用综合预测方法计算最终的预测值。
地址 310018 浙江省杭州市下沙高教园区2号大街