发明名称 |
一种多源异构大数据的一致性表示方法 |
摘要 |
本发明公开了一种多源异构大数据的一致性表示方法。本方法针对多源异构数据的特征异构性问题,利用多源异构数据间的语义互补性,基于子空间学方法,将多源异构数据投影到一个中层冗余特征同构空间。并在这个同构空间中,将来自不同来源的相关描述耦合到一起。为了挖掘出中层空间中同构描述之间的语义一致性,利用先验知识,将特征同构描述投影到高层语义共享子空间上,进而消除冗余和噪声信息。由此,可以获得多源异构数据的语义一致模式。本发明有助于在多媒体分析、信息检索和医疗诊断等领域,获得准确且鲁棒的多源数据评估分析结果。 |
申请公布号 |
CN105893612A |
申请公布日期 |
2016.08.24 |
申请号 |
CN201610266857.7 |
申请日期 |
2016.04.26 |
申请人 |
中国科学院信息工程研究所 |
发明人 |
张磊;王树鹏;云晓春 |
分类号 |
G06F17/30(2006.01)I;G06F17/27(2006.01)I |
主分类号 |
G06F17/30(2006.01)I |
代理机构 |
北京君尚知识产权代理事务所(普通合伙) 11200 |
代理人 |
邱晓锋 |
主权项 |
一种多源异构大数据的一致性表示方法,其特征在于,包括以下步骤:1)利用多源异构数据之间的互补性学习多个线性变换,以消除不同来源间的特征异构性,从而将多源异构数据投影到一个中层冗余特征同构空间,在这个中层冗余特征同构空间中,来自不同来源的相关描述被耦合到一起,以此捕捉到不同来源间的互补信息;2)在所述中层冗余特征同构空间中,利用先验知识将特征同构描述投影到高层语义共享子空间上,在高层语义共享子空间中来自同一来源相同类别的样本靠拢在一起,而不同类别的实例则保持一定距离,从而消除冗余和噪声信息,获得多源异构数据的语义一致模式。 |
地址 |
100093 北京市海淀区闵庄路甲89号 |