发明名称 一种基于Gaussian LDA和词嵌入的语义稀疏Web服务发现方法
摘要 本发明公开了一种基于Gaussian LDA和词嵌入的语义稀疏Web服务发现方法,具体涉及服务计算技术领域。该方法具体按如下顺序进行:收集Web服务描述文档,对收集的Web服务描述文档进行预处理,得到Web服务描述文档中的特征词汇,并对Web服务描述文档中的词汇进行预处理,得到一组原型单词的集合;使用词嵌入训练模型Word2Vec训练步骤1中得到的原型单词的集合,得到原型单词的集合中每个单词的连续向量表示;使用Gaussian LDA模型对步骤1中得到的原型单词的集合进行训练,获得每个Web服务层次结构;使用步骤2训练得到的连续向量的集合丰富用户查询,得到扩展以后的用户查询;利用步骤2得到的服务层次结构,使用概率排序方法,得到针对扩展之后用户查询所对应的查询输出。
申请公布号 CN106599086A 申请公布日期 2017.04.26
申请号 CN201611049185.0 申请日期 2016.11.25
申请人 山东科技大学 发明人 田刚;高艳峰;孙承爱
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 青岛智地领创专利代理有限公司 37252 代理人 肖峰
主权项 一种基于Gaussian LDA和词嵌入的语义稀疏Web服务发现方法,其特征在于,具体按如下顺序进行:步骤1:收集Web服务描述文档,对收集的Web服务描述文档进行预处理,得到Web服务描述文档中的特征词汇,并对Web服务描述文档中的词汇进行预处理,得到一组原型单词的集合;步骤2:使用词嵌入训练模型Word2Vec训练步骤1中得到的原型单词的集合,得到原型单词的集合中每个单词的连续向量表示;使用Gaussian LDA模型对步骤1中得到的原型单词的集合进行训练,获得每个Web服务层次结构;步骤3:使用步骤2训练得到的连续向量的集合丰富用户查询,得到扩展以后的用户查询;利用步骤2得到的服务层次结构,使用概率排序方法,得到针对扩展之后用户查询所对应的查询输出。
地址 266590 山东省青岛市经济技术开发区前湾港路579号