发明名称 一种多源异构大数据的一致性表示方法
摘要 本发明公开了一种多源异构大数据的一致性表示方法。本方法针对多源异构数据的特征异构性问题,利用多源异构数据间的语义互补性,基于子空间学方法,将多源异构数据投影到一个中层冗余特征同构空间。并在这个同构空间中,将来自不同来源的相关描述耦合到一起。为了挖掘出中层空间中同构描述之间的语义一致性,利用先验知识,将特征同构描述投影到高层语义共享子空间上,进而消除冗余和噪声信息。由此,可以获得多源异构数据的语义一致模式。本发明有助于在多媒体分析、信息检索和医疗诊断等领域,获得准确且鲁棒的多源数据评估分析结果。
申请公布号 CN105893612A 申请公布日期 2016.08.24
申请号 CN201610266857.7 申请日期 2016.04.26
申请人 中国科学院信息工程研究所 发明人 张磊;王树鹏;云晓春
分类号 G06F17/30(2006.01)I;G06F17/27(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京君尚知识产权代理事务所(普通合伙) 11200 代理人 邱晓锋
主权项 一种多源异构大数据的一致性表示方法,其特征在于,包括以下步骤:1)利用多源异构数据之间的互补性学习多个线性变换,以消除不同来源间的特征异构性,从而将多源异构数据投影到一个中层冗余特征同构空间,在这个中层冗余特征同构空间中,来自不同来源的相关描述被耦合到一起,以此捕捉到不同来源间的互补信息;2)在所述中层冗余特征同构空间中,利用先验知识将特征同构描述投影到高层语义共享子空间上,在高层语义共享子空间中来自同一来源相同类别的样本靠拢在一起,而不同类别的实例则保持一定距离,从而消除冗余和噪声信息,获得多源异构数据的语义一致模式。
地址 100093 北京市海淀区闵庄路甲89号