发明名称 |
一种面向领域主题的Web服务聚类方法 |
摘要 |
本发明涉及一种面向领域主题的Web服务聚类方法。包括以下步骤:1:收集Web服务描述文档,对收集的文档进行预处理;2:使用迭代式支持向量机对Web服务进行面向领域的分类;3:使用基于概率的Web服务聚类方法对特定领域内的Web服务进行面向主题的聚类。本发明的有益效果是:1)可以对通过WSDL、OWL-S和文本等方式描述的Web服务进行聚类,具有较好的通用性;2)具有更高的效率;3)在面向领域的Web服务分类的基础上进行聚类,与直接对Web服务进行聚类的方法相比具有更高的聚类准确度;4)Web服务聚类结果既可以用于Web服务发现、Web服务组合,还可以用于Web服务推荐,具有广泛的适用性。 |
申请公布号 |
CN102855312A |
申请公布日期 |
2013.01.02 |
申请号 |
CN201210305031.9 |
申请日期 |
2012.08.24 |
申请人 |
武汉大学 |
发明人 |
何克清;李征;王健;张能;李昭 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
武汉科皓知识产权代理事务所(特殊普通合伙) 42222 |
代理人 |
鲁力 |
主权项 |
一种面向领域主题的Web服务聚类方法,其特征在于,包括以下步骤:步骤1,收集Web服务描述文档,对收集的文档进行预处理,得到用户所需要的Web服务描述文档中的关键词,并对Web服务描述文档中每个关键词在该文档中的出现次数进行统计,所述Web服务描述文档来源于能够被访问的Web服务注册中心或Web服务门户网站;步骤2,使用迭代式支持向量机对完成步骤1的Web服务进行面向领域的分类,直到分类领域词汇排序表的前K个关键词保持不变后,分类结束;初始的分类领域词汇表按照该领域内所有Web服务包括的全部关键词的词频进行排序,用于进行迭代的领域词汇排序表通过计算分类领域中每个关键词对该领域的重要性进行排序;步骤3,使用基于概率的Web服务聚类方法针对完成步骤2的分类领域内的Web服务进行面向主题的聚类,得到T个主题类簇的Web服务。 |
地址 |
430072 湖北省武汉市武昌区珞珈山武汉大学 |