发明名称 |
一种基于人的信息聚合方法和装置 |
摘要 |
本发明公开了一种基于人的信息聚合方法和装置,方法包括以下步骤:利用数据模板中定义的匹配规则对相应的网页中的数据进行匹配,获取个人属性数据,个人属性数据包括姓名和与姓名对应的属性数据;针对两条姓名不同的个人属性数据进行相似度匹配,若相似度大于预设阈值,则将该两条个人属性数据进行融合,否则不融合该两条个人属性数据;针对两条姓名相同的个人属性数据进行相似度匹配,若相似度大于预设阈值,则将该两条个人属性数据进行融合,否则不融合该两条个人属性数据。本发明通过从不同数据源进行数据获取,实现以人为单位,对其相关的属性信息进行深度的挖掘,以形成针对个人的全面信息描述。 |
申请公布号 |
CN104504138A |
申请公布日期 |
2015.04.08 |
申请号 |
CN201410857598.6 |
申请日期 |
2014.12.31 |
申请人 |
广州索答信息科技有限公司 |
发明人 |
石忠民;徐亚波;莫敏 |
分类号 |
G06F17/30(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
广州市越秀区哲力专利商标事务所(普通合伙) 44288 |
代理人 |
汤喜友 |
主权项 |
一种基于人的信息聚合方法,其特征在于,包括以下步骤:步骤A:利用数据模板中定义的匹配规则对相应的网页中的数据进行匹配,获取个人属性数据,个人属性数据包括姓名和与姓名对应的属性数据;步骤B:针对两条姓名不同的个人属性数据进行相似度匹配,判断相似度是否大于预设阈值,若是,则将该两条个人属性数据进行融合;若否,则不融合该两条个人属性数据;步骤C:针对两条姓名相同的个人属性数据进行相似度匹配,判断相似度是否大于预设阈值,若是,则将该两条个人属性数据进行融合;若否,则不融合该两条个人属性数据。 |
地址 |
510000 广东省广州市广州高新技术产业开发区科学城科学大道182号C1区第11层1101单元 |