发明名称 Web服务资源库数据的清洗方法和服务器
摘要 本发明提供一种Web服务资源库数据的清洗方法和服务器,方法包括:服务器获取Web服务资源库中多个Web服务的描述语言WSDL文件并对其进行分类,以得到多个Web服务集合;针对每个Web服务集合中的Web服务,计算每两个Web服务对应的WSDL文件间的编辑距离,并在编辑距离小于预设阈值的WSDL文件对应的Web服务间确定连通关系;根据每个Web服务集合中各Web服务之间的连通关系构建各Web服务集合对应的连通组图;将连通组图中包含的每个连通子图中度最大的Web服务作为第一Web服务,并删除该连通子图中其他Web服务。本发明实施例解决了现有技术中,没有针对Web服务资源库数据的清洗方案的技术空缺。
申请公布号 CN103559225B 申请公布日期 2017.04.05
申请号 CN201310495796.8 申请日期 2013.10.21
申请人 北京航空航天大学 发明人 孙海龙;刘旭东;郭莉莎;李春娥
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京同立钧成知识产权代理有限公司 11205 代理人 刘芳
主权项 一种Web服务资源库数据的清洗方法,其特征在于,包括:服务器获取Web服务资源库中多个Web服务的描述语言WSDL文件;所述服务器对所述多个Web服务的WSDL文件进行分类,以得到多个不同类别的Web服务集合;针对于每个所述Web服务集合中的各Web服务,所述服务器计算每两个所述Web服务对应的WSDL文件间的编辑距离,并在所述编辑距离小于预设阈值的WSDL文件对应的两个Web服务之间确定连通关系;所述服务器根据每个所述Web服务集合中各Web服务之间的所述连通关系构建各所述Web服务集合对应的连通组图,所述连通组图包括至少一个连通子图;所述服务器将每个所述连通子图中度最大的一个Web服务作为第一Web服务,并删除所述连通子图中除所述第一Web服务外的其他Web服务。
地址 100191 北京市海淀区学院路37号