发明名称 面向多元数据的自动关联方法
摘要 本发明公开了面向多元数据的自动关联方法,选择多元数据,提取每个数据的时间属性,对时间属性不全的根据上下文自动补全,提取每个数据的地理中心位置和覆盖范围,并转换到统一的椭球坐标系下;对数据添加属性标签;根据数据的来源、类别、等级、分辨率属性对数据自动添加属性标签,具有相同标签的数据存在着隐含的关联关系;利用多属性信息挖掘数据间的关联关系;同时考虑数据的时间属性、位置属性和标签信息,利用改进的距离依赖中餐馆过程挖掘数据间的关联关系;保存数据之间的关联关系,作为已知信息用于后续自动关联组织。本发明的有益效果是充分考虑了多种属性信息进行数据关联,使得大量信息得到有效利用。
申请公布号 CN104516975A 申请公布日期 2015.04.15
申请号 CN201410838117.7 申请日期 2014.12.29
申请人 中国科学院电子学研究所 发明人 付琨;许光銮;孙显;黄宇;王磊;田璟;宋俊
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京科亿知识产权代理事务所(普通合伙) 11350 代理人 汤东凤
主权项 面向多元数据的自动关联方法,其特征在于按照以下步骤进行:步骤1、选择多元数据,多元数据是指不同类型但具有一定共性的数据;步骤2、提取每个数据的时间属性,对时间属性不全的根据上下文补全;步骤3、提取每个数据的地理中心位置和覆盖范围,并转换到统一的椭球坐标系下;步骤4、对数据添加属性标签;根据数据的来源、类别、等级、分辨率属性对数据自动添加属性标签,具有相同标签的数据存在着隐含的关联关系;步骤5:利用多属性信息挖掘数据间的关联关系;同时考虑数据的时间属性、位置属性和标签信息,利用改进的距离依赖中餐馆过程挖掘数据间的关联关系;步骤6:保存数据之间的关联关系,作为已知信息用于后续自动关联组织。
地址 100190 北京市海淀区北四环西路19号