发明名称 |
文本信息相似度的计算方法、装置及服务器 |
摘要 |
本公开提供一种文本信息相似度的计算方法、装置及服务器,所述方法的一具体实施方式包括:判断第一文本信息与第二文本信息的结构类型是否相同;若结构类型不同,则确定第一文本信息与第二文本信息的相似度为0;若结构类型相同,则获取第一文本信息与第二文本信息的主题近似度;获取第一文本信息与第二文本信息的内容近似度;基于所述主题近似度以及所述内容近似度确定第一文本信息与第二文本信息的相似度。该实施方式提高了计算两个文本信息之间相似度的准确性。 |
申请公布号 |
CN105469104A |
申请公布日期 |
2016.04.06 |
申请号 |
CN201510737222.6 |
申请日期 |
2015.11.03 |
申请人 |
小米科技有限责任公司 |
发明人 |
汪平仄;张涛;陈志军 |
分类号 |
G06K9/62(2006.01)I |
主分类号 |
G06K9/62(2006.01)I |
代理机构 |
北京博思佳知识产权代理有限公司 11415 |
代理人 |
林祥 |
主权项 |
一种文本信息相似度的计算方法,其特征在于,所述方法包括:判断第一文本信息与第二文本信息的结构类型是否相同;若结构类型不同,则确定第一文本信息与第二文本信息的相似度为0;若结构类型相同,则获取第一文本信息与第二文本信息的主题近似度;获取第一文本信息与第二文本信息的内容近似度;基于所述主题近似度以及所述内容近似度确定第一文本信息与第二文本信息的相似度。 |
地址 |
100085 北京市海淀区清河中街68号华润五彩城购物中心二期13层 |