发明名称 |
一种基于Gaussian LDA和词嵌入的语义稀疏Web服务发现方法 |
摘要 |
本发明公开了一种基于Gaussian LDA和词嵌入的语义稀疏Web服务发现方法,具体涉及服务计算技术领域。该方法具体按如下顺序进行:收集Web服务描述文档,对收集的Web服务描述文档进行预处理,得到Web服务描述文档中的特征词汇,并对Web服务描述文档中的词汇进行预处理,得到一组原型单词的集合;使用词嵌入训练模型Word2Vec训练步骤1中得到的原型单词的集合,得到原型单词的集合中每个单词的连续向量表示;使用Gaussian LDA模型对步骤1中得到的原型单词的集合进行训练,获得每个Web服务层次结构;使用步骤2训练得到的连续向量的集合丰富用户查询,得到扩展以后的用户查询;利用步骤2得到的服务层次结构,使用概率排序方法,得到针对扩展之后用户查询所对应的查询输出。 |
申请公布号 |
CN106599086A |
申请公布日期 |
2017.04.26 |
申请号 |
CN201611049185.0 |
申请日期 |
2016.11.25 |
申请人 |
山东科技大学 |
发明人 |
田刚;高艳峰;孙承爱 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
青岛智地领创专利代理有限公司 37252 |
代理人 |
肖峰 |
主权项 |
一种基于Gaussian LDA和词嵌入的语义稀疏Web服务发现方法,其特征在于,具体按如下顺序进行:步骤1:收集Web服务描述文档,对收集的Web服务描述文档进行预处理,得到Web服务描述文档中的特征词汇,并对Web服务描述文档中的词汇进行预处理,得到一组原型单词的集合;步骤2:使用词嵌入训练模型Word2Vec训练步骤1中得到的原型单词的集合,得到原型单词的集合中每个单词的连续向量表示;使用Gaussian LDA模型对步骤1中得到的原型单词的集合进行训练,获得每个Web服务层次结构;步骤3:使用步骤2训练得到的连续向量的集合丰富用户查询,得到扩展以后的用户查询;利用步骤2得到的服务层次结构,使用概率排序方法,得到针对扩展之后用户查询所对应的查询输出。 |
地址 |
266590 山东省青岛市经济技术开发区前湾港路579号 |