发明名称 |
类目标签匹配映射方法及装置 |
摘要 |
本发明实施例提供一种类目标签匹配映射方法及装置,该方法包括:获取源类目标签的标签信息和目标类目标签的标签信息;根据标签字符串,分别确定各源类目标签和各目标类目标签的字面相似度;根据标签信息得到标签的向量化信息,结合标签路径信息,分别确定各源类目标签和各目标类目标签的语义相似度;根据标签路径信息,分别确定各源类目标签和各目标类目标签的结构相似度;根据各源类目标签与各目标类目标签的字面相似度、语义相似度和结构相似度中的至少一个,选择出相似度符合设定条件的源类目标签和目标类目标签,建立映射关系。能够实现快速、准确的标签相似度匹配和标签映射,匹配映射的效率高,不需要人工参与,节约人力物力财力。 |
申请公布号 |
CN105893349A |
申请公布日期 |
2016.08.24 |
申请号 |
CN201610195707.1 |
申请日期 |
2016.03.31 |
申请人 |
新浪网技术(中国)有限公司 |
发明人 |
方庆安;范羽;崔世起 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京和信华成知识产权代理事务所(普通合伙) 11390 |
代理人 |
胡剑辉 |
主权项 |
一种类目标签匹配映射方法,其特征在于,包括:获取源类目标签的标签信息和目标类目标签的标签信息;根据标签信息中包括的标签字符串,分别确定各源类目标签和各目标类目标签的字面相似度;根据标签信息得到标签的向量化信息,根据标签的向量化信息和标签信息中包括的标签路径信息,分别确定各源类目标签和各目标类目标签的语义相似度;根据标签信息中包括的标签路径信息,结合字面相似度和语义相似度,分别确定各源类目标签和各目标类目标签的结构相似度;根据各源类目标签与各目标类目标签的字面相似度、语义相似度和结构相似度中的至少一个,选择出相似度符合设定条件的源类目标签和目标类目标签,建立映射关系。 |
地址 |
100080 北京市海淀区北四环西路58号理想国际大厦20层 |