发明名称 一种面向Web 服务描述的本体学方法
摘要 本发明公开了一种面向Web服务描述的本体学方法,包括以下步骤:1:收集Web服务描述文档,得到文档中的输入输出参数,对每个输入输出参数预处理;2:使用hHDP方法以自下而上的学方法生成主题的层次;3:使用“餐馆问题”采样方法估计层级主题;4:获得代表单词并构造初始本体,使用语义增强规则增强生成本体的语义形成最终本体。本发明的有益效果是:1.对使用WSDL描述的Web服务无监督学生成本体,具有较好的通用性;2.既能够找出隐含的语义层次关系又能够利用保证学出的本体语义丰富程度,具有较好的本体学效果。3.学的本体可以用于Web服务语义标注,能够支撑语义Web服务发现和推荐,具有较广泛的适用性。
申请公布号 CN103530419B 申请公布日期 2016.08.17
申请号 CN201310524073.6 申请日期 2013.10.29
申请人 武汉大学 发明人 何克清;田刚;王健
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 代理人 张火春
主权项 一种面向Web服务描述的本体学习方法,其特征在于,包括以下步骤:步骤1:收集Web服务描述文档,对收集的Web服务描述文档进行预处理,得到Web服务描述文档中的输入输出参数,并对Web服务描述文档中每个输入输出参数预处理,得到一组原型单词的集合,对所述的原型单词进行进一步预处理,得到词性标注单词的集合;步骤2:使用hHDP方法对步骤1中得到的原型单词以自下而上的学习方法生成原型单词所属主题的层次;步骤3:使用“中国餐馆问题”的HDP采样模式计算出步骤2中生成的每一层主题层次的概率度量G<sub>i</sub>,基准概率G<sub>0</sub>和主题数目;步骤4:计算主题中包含的原型单词的覆盖率并排序,覆盖率最大的单词对该主题的覆盖程度最大,将覆盖率最大的单词作为代表单词的候选,采用自下而上的方法抽取每个主题对应的代表单词;对词性标注单词使用模式分析技术分析参数中词汇之间的关系,并将这些关系的组织形式形成语义丰富的规则,当抽取出代表单词之后按照语义丰富的规则对生成的本体进一步扩充语义。
地址 430072 湖北省武汉市武昌区珞珈山武汉大学