发明名称 | 一种同类数据对象的匹配方法和装置 | ||
摘要 | 本申请涉及一种同类数据对象的匹配方法和装置。其中,该方法包括:分别获得多个同类数据对象集合;分别挖掘所述同类数据对象集合的每一数据对象的核心词,获取各同类数据对象集合的核心词词组;计算任意两个同类数据对象集合的核心词词组的相似度;当所述相似度大于设定阈值时,将发生比较的两个同类数据对象集合中的数据对象确定为同类数据对象。其通过根据数据对象的一个或多个数据标签,挖掘出核心词,在来自各数据平台的多个同类数据对象集合中进一步做匹配,最终在各数据平台海量数据对象中确定绝对同类数据对象,从而解决跨平台准确匹配同类数据对象的问题,提高跨数据平台的同类数据对象匹配的准确性。 | ||
申请公布号 | CN104424302A | 申请公布日期 | 2015.03.18 |
申请号 | CN201310397429.4 | 申请日期 | 2013.09.04 |
申请人 | 阿里巴巴集团控股有限公司 | 发明人 | 何宪;隋宜桓 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京国昊天诚知识产权代理有限公司 11315 | 代理人 | 许志勇 |
主权项 | 一种同类数据对象的匹配方法,其特征在于,包括:分别获得多个同类数据对象集合;分别挖掘所述同类数据对象集合的每一数据对象的核心词,获取各同类数据对象集合的核心词词组;计算任意两个同类数据对象集合的核心词词组的相似度;当所述相似度大于设定阈值时,将发生比较的两个同类数据对象集合中的数据对象确定为同类数据对象。 | ||
地址 | 英属开曼群岛大开曼资本大厦一座四层847号邮箱 |