发明名称 类目标签匹配映射方法及装置
摘要 本发明实施例提供一种类目标签匹配映射方法及装置,该方法包括:获取源类目标签的标签信息和目标类目标签的标签信息;根据标签字符串,分别确定各源类目标签和各目标类目标签的字面相似度;根据标签信息得到标签的向量化信息,结合标签路径信息,分别确定各源类目标签和各目标类目标签的语义相似度;根据标签路径信息,分别确定各源类目标签和各目标类目标签的结构相似度;根据各源类目标签与各目标类目标签的字面相似度、语义相似度和结构相似度中的至少一个,选择出相似度符合设定条件的源类目标签和目标类目标签,建立映射关系。能够实现快速、准确的标签相似度匹配和标签映射,匹配映射的效率高,不需要人工参与,节约人力物力财力。
申请公布号 CN105893349A 申请公布日期 2016.08.24
申请号 CN201610195707.1 申请日期 2016.03.31
申请人 新浪网技术(中国)有限公司 发明人 方庆安;范羽;崔世起
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 北京和信华成知识产权代理事务所(普通合伙) 11390 代理人 胡剑辉
主权项 一种类目标签匹配映射方法,其特征在于,包括:获取源类目标签的标签信息和目标类目标签的标签信息;根据标签信息中包括的标签字符串,分别确定各源类目标签和各目标类目标签的字面相似度;根据标签信息得到标签的向量化信息,根据标签的向量化信息和标签信息中包括的标签路径信息,分别确定各源类目标签和各目标类目标签的语义相似度;根据标签信息中包括的标签路径信息,结合字面相似度和语义相似度,分别确定各源类目标签和各目标类目标签的结构相似度;根据各源类目标签与各目标类目标签的字面相似度、语义相似度和结构相似度中的至少一个,选择出相似度符合设定条件的源类目标签和目标类目标签,建立映射关系。
地址 100080 北京市海淀区北四环西路58号理想国际大厦20层