发明名称 |
一种名称相似度获取方法及装置 |
摘要 |
本申请公开了一种名称相似度获取方法及装置,所述方法包括:确定第一对象和第二对象;获取字包含相似度值,字包含相似度值为第一对象中包含有与第二对象中相同字符的字符数量在第一对象中所占的比重值;获取字顺序相似度值,字顺序相似度值为第一对象中包含有第二对象中相同字符的字顺序相似度值;获取字距离相似度值,字距离相似度值为第一对象中包含有第二对象中相同的字符将第一对象中名称字符分割后的字符片段均匀度值;依据字包含相似度值、字顺序相似度值及字距离相似度值,获取第一对象与第二对象的三维相似度值。本申请在获取两个名称对象的相似度值的过程中,无需语料库、统计规划或分词库等做基础计算,计算量较小,效率较高。 |
申请公布号 |
CN104462055A |
申请公布日期 |
2015.03.25 |
申请号 |
CN201310436119.9 |
申请日期 |
2013.09.23 |
申请人 |
北京捷软世纪信息技术有限公司 |
发明人 |
李振星 |
分类号 |
G06F17/27(2006.01)I;G06F17/30(2006.01)I |
主分类号 |
G06F17/27(2006.01)I |
代理机构 |
北京集佳知识产权代理有限公司 11227 |
代理人 |
王宝筠 |
主权项 |
一种名称相似度获取方法,其特征在于,包括:确定第一对象和第二对象,所述第一对象包括至少一个名称字符,所述第二对象包括至少一个名称字符,所述第一对象的字符数量大于或等于所述第二对象的字符数量;获取字包含相似度值,所述字包含相似度值为所述第一对象中包含有与所述第二对象中相同字符的字符数量在所述第一对象中所占的比重值;获取字顺序相似度值,所述字顺序相似度值为所述第一对象中包含有所述第二对象中相同字符的字顺序相似度值;获取字距离相似度值,所述字距离相似度值为所述第一对象中包含有所述第二对象中相同的字符将所述第一对象中名称字符分割后的字符片段均匀度值;依据所述字包含相似度值、所述字顺序相似度值及所述字距离相似度值,获取所述第一对象与所述第二对象的三维相似度值。 |
地址 |
100085 北京市海淀区上地信息路2号D栋505 |