发明名称 一种基于云平台的服务推送方法
摘要 本发明提供了一种云平台下的服务推送方法,本发明的方法包括:首先客户端主动向云端申请所需资源,云端收到客户端的请求后首先分别计算云中不同服务器的资源与客户端所需资源的相似性,然后采用机器学中的KNN分类算法将各个服务器中的资源进行分类。如服务器<img file="2011103666453100004dest_path_image001.GIF" wi="18" he="25" />将资源分为<img file="267427dest_path_image002.GIF" wi="64" he="25" />和<img file="dest_path_image003.GIF" wi="58" he="25" />两部分,服务器<img file="514869dest_path_image004.GIF" wi="20" he="25" />此时将资源分为<img file="dest_path_image005.GIF" wi="65" he="25" />和<img file="585593dest_path_image006.GIF" wi="60" he="25" />,……,服务器<img file="dest_path_image007.GIF" wi="17" he="25" />此时将资源分为<img file="514366dest_path_image008.GIF" wi="62" he="25" />,<img file="dest_path_image009.GIF" wi="58" he="25" />。对资源<img file="354146dest_path_image008.GIF" wi="62" he="25" />(i=1,2……n)进行K-means聚类,找到和用户需求最相似的一些,将结果保存在云中间件中,该中间件将最后服务采用基于属性相似度的推送技术将服务推送到客户端,实现云环境下服务推送的功能。
申请公布号 CN102447737A 申请公布日期 2012.05.09
申请号 CN201110366645.3 申请日期 2011.11.18
申请人 浪潮电子信息产业股份有限公司 发明人 于治楼;张化祥;刘丽娜
分类号 H04L29/08(2006.01)I 主分类号 H04L29/08(2006.01)I
代理机构 代理人
主权项 1.一种基于云平台的服务推送方法, 其特征在于,首先客户端主动向云端申请所需资源,云端收到客户端的请求后首先分别计算云中不同服务器的资源与客户端所需资源的相似性,然后采用机器学习中的KNN分类算法将各个服务器中的资源进行分类,如服务器<img file="226285DEST_PATH_IMAGE001.GIF" wi="18" he="25" />将资源分为<img file="784306DEST_PATH_IMAGE002.GIF" wi="64" he="25" />和<img file="313507DEST_PATH_IMAGE003.GIF" wi="58" he="25" />两部分,服务器<img file="7794DEST_PATH_IMAGE004.GIF" wi="20" he="25" />此时将资源分为<img file="924934DEST_PATH_IMAGE005.GIF" wi="65" he="25" />和<img file="662862DEST_PATH_IMAGE006.GIF" wi="60" he="25" />,……,服务器<img file="58071DEST_PATH_IMAGE007.GIF" wi="17" he="25" />此时将资源分为<img file="872444DEST_PATH_IMAGE008.GIF" wi="62" he="25" />,<img file="632589DEST_PATH_IMAGE009.GIF" wi="58" he="25" />,对资源<img file="899622DEST_PATH_IMAGE008.GIF" wi="62" he="25" />(i=1,2……n)进行K-means聚类,找到和用户需求最相似的一些,将结果保存在云中间件中,该中间件将最后服务采用基于属性相似度的推送技术将服务推送到客户端,实现云环境下服务推送的功能;具体步骤如下:1)初始阶段采用KNN分类算法和K-means聚类算法,将各个服务器中的资源采用KNN进行分类,得到与所需服务有一定相似度的资源<img file="98523DEST_PATH_IMAGE008.GIF" wi="62" he="25" />,再对<img file="705085DEST_PATH_IMAGE008.GIF" wi="62" he="25" />进行K-means聚类,找到一个最优的结果存放到云中间件中,在云中间件辅助下实现基于属性相似度的服务推送;2) 服务获取的方式有两种,拉模式和推模式,当用户需要某资源时,避免了服务过载和服务迷向,不在采用拉模式,而是采取推模式,本文中的服务推送是通过在云中间件协作下完成的,并采用了基于属性相似度的服务推送技术;3)以用户浏览过的信息集合作为挖掘对象,以偏离相似度为基础,从中提取出用户的信息兴趣,然后把用户未浏览过的信息与用户兴趣相比较,判定该信息是否满足用户信息兴趣,进而决定是否推送该信息给用户;4)为了对信息进行统一管理, 信息库的所有信息都必须转换成一个统一的格式,本文将具备该格式的一个信息称为信息项,信息项是信息内容与信息属性的组合,可表示为 KI=(KC,KA),其中KC是信息的内容, KA=(<img file="698448DEST_PATH_IMAGE010.GIF" wi="29" he="25" />,<img file="390461DEST_PATH_IMAGE011.GIF" wi="30" he="25" />,…,<img file="127473DEST_PATH_IMAGE012.GIF" wi="30" he="25" />)是该信息的属性值,由于信息属性是对信息内容的一个概括,因而,在信息推送过程中,仅需知道信息属性值即可,为此,信息项可简化为属性的集合,可表示为:KV=<img file="650858DEST_PATH_IMAGE013.GIF" wi="195" he="82" />其中,<img file="80702DEST_PATH_IMAGE014.GIF" wi="27" he="30" />表示第i个信息项的第j个属性的值,给定内含m 个信息项的信息集合,假设<img file="260011DEST_PATH_IMAGE015.GIF" wi="18" he="25" />,<img file="535134DEST_PATH_IMAGE016.GIF" wi="18" he="26" />为2个信息项,则<img file="178605DEST_PATH_IMAGE015.GIF" wi="18" he="25" />和<img file="451455DEST_PATH_IMAGE016.GIF" wi="18" he="26" />关于属性f的属性相似度为:<img file="180376DEST_PATH_IMAGE017.GIF" wi="216" he="36" />其中,<img file="259191DEST_PATH_IMAGE018.GIF" wi="28" he="32" />为<img file="694851DEST_PATH_IMAGE015.GIF" wi="18" he="25" />的属性 f 的值,<img file="466498DEST_PATH_IMAGE019.GIF" wi="31" he="33" />为<img file="417137DEST_PATH_IMAGE016.GIF" wi="18" he="26" />的属性f的值,<img file="237325DEST_PATH_IMAGE020.GIF" wi="24" he="30" />为所有信息项的属性f的均值;考虑到各个属性,其值的范围可能相差较大,为此,对属性相似度进行规范化为:<img file="589809DEST_PATH_IMAGE021.GIF" wi="135" he="72" />则属性综合相似度<img file="532357DEST_PATH_IMAGE022.GIF" wi="29" he="30" />为:<img file="905045DEST_PATH_IMAGE023.GIF" wi="94" he="43" />属性最大相似度<img file="325662DEST_PATH_IMAGE024.GIF" wi="38" he="30" />为:<img file="735915DEST_PATH_IMAGE025.GIF" wi="138" he="35" />假设<img file="849365DEST_PATH_IMAGE015.GIF" wi="18" he="25" />为信息项,其属性综合相似度为<img file="774595DEST_PATH_IMAGE022.GIF" wi="29" he="30" />,则<img file="936586DEST_PATH_IMAGE015.GIF" wi="18" he="25" />的偏离相似度<img file="998083DEST_PATH_IMAGE026.GIF" wi="25" he="25" />为:<img file="282434DEST_PATH_IMAGE027.GIF" wi="113" he="51" />偏离相似度反映了该信息项与信息项集合的综合兴趣相背离的程度,其值越小,偏离的程度越高,因此,可以把该值作为知识推送的依据:设定一个阈值λ,若某信息项的偏离相似度高于λ,则认为该信息项符合用户兴趣,可作为推送的对象;5)基于属性的相似度推送过程分成如下的主要4步: 1)把用户浏览过的所有信息项构成信息项集合 D1,以 D1 作为挖掘对象,计算出D1的属性最大相似度, 进而得到D1中每个信息项的偏离相似度; 2)依据预先设定的阈值λ,把偏离相似度低于λ的信息项剔除出信息集合D1,从而使得集合中仅留下偏离相似度高于λ的信息项,形成新集合 D2,显然,D2 中的信息项都与用户兴趣吻合,因而可作为用户信息兴趣的表示;3)把用户未浏览过的信息项 NK 添加进集合D2中,形成新集合D3,并计算出D3 的属性最大相似度以及每个信息项的偏离相似度; 4)若NK 的偏离相似度高于λ,则NK与用户兴趣有较高相似性,可作为推送对象,否则不予推送。
地址 250014 山东省济南市高新区舜雅路1036号