发明名称 信息确定方法及装置
摘要 本发明实施例提供一种信息确定方法及装置,该方法包括:估计待标记样本的特征向量与待预测属性信息之间的关联关系;将关联关系分解为与N个领域一一对应的N个子关联关系,并将每个样本的特征向量分解为与N个领域一一对应的特征子向量;获取每个领域中每个已标记样本的特征子向量代入对应的子关联关系得到的第一数值;基于公共属性信息将同一用户在N个领域得到的第一数值求和得到估计的属性信息;根据所有已标记样本的估计的属性信息对应的已知属性信息和估计的属性信息确定关联关系;根据确定的关联关系和待标记样本的特征向量确定待标记样本的待预测属性信息。从而保证不同领域数据之间的保密性。
申请公布号 CN105426534A 申请公布日期 2016.03.23
申请号 CN201510959360.9 申请日期 2015.12.21
申请人 华为技术有限公司 发明人 胡楠;徐礼锋;张观侣;钟颙
分类号 G06F17/30(2006.01)I;G06F21/60(2013.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京同立钧成知识产权代理有限公司 11205 代理人 杨贝贝;黄健
主权项 一种信息确定方法,所述方法基于N个领域,N为大于或者等于2的整数,每个所述领域包括多个用户的实例数据,每个所述实例数据包括多个属性信息,同一用户在N个领域中的实例数据存在至少一个公共属性信息,同一用户在N个领域中的实例数据组成一个样本,将所述样本所包括的部分或者全部的已知属性信息生成所述样本的特征向量,每个样本的特征向量所包括的已知属性信息个数相同,其特征在于,包括:估计待标记样本的特征向量与待预测属性信息之间的关联关系,其中所述待标记样本为包括至少一个待预测属性信息的样本;将所述关联关系分解为与所述N个领域一一对应的N个子关联关系,并将每个样本的特征向量分解为与所述N个领域一一对应的特征子向量;获取每个领域中每个所述已标记样本的特征子向量代入对应的子关联关系得到的第一数值;基于所述公共属性信息将同一用户在所述N个领域得到的第一数值求和得到估计的属性信息;所述估计的属性信息为根据所述关联关系和已标记样本的特征向量估计已标记样本中与所述待预测属性信息对应的属性信息,所述已标记样本为包括的所有属性信息为已知属性信息的样本;根据所有已标记样本的估计的属性信息对应的已知属性信息和所述估计的属性信息确定所述关联关系;根据确定的关联关系和所述待标记样本的特征向量确定所述待标记样本的待预测属性信息。
地址 518129 广东省深圳市龙岗区坂田华为总部办公楼