发明名称 | 企业级数据仓库系统的样本数据获取方法及装置 | ||
摘要 | 本发明提供一种企业级数据仓库系统的样本数据获取方法及装置,其中,该方法包括:解析企业级数据仓库系统的包括模型关联关系信息的逻辑模型信息,以获取模型关联关系信息;根据模型关联关系信息生成样本数据抽取配置信息;根据样本数据抽取配置信息、以及预先设置的抽取参数生成全量抽取脚本;对全量抽取脚本进行迭代运算以确定全量抽取脚本调度的依赖关系;根据依赖关系生成基于有向图数据结构的调度文件;根据调度文件并行调度全量抽取脚本以获取样本数据。通过本发明,可以方便快速的获取企业级数据仓库系统的样本数据。 | ||
申请公布号 | CN102073698A | 申请公布日期 | 2011.05.25 |
申请号 | CN201010611704.4 | 申请日期 | 2010.12.28 |
申请人 | 中国工商银行股份有限公司 | 发明人 | 金雁峰;邬敏炜;黄兆斌;马雯瑾 |
分类号 | G06F17/30(2006.01)I | 主分类号 | G06F17/30(2006.01)I |
代理机构 | 北京三友知识产权代理有限公司 11127 | 代理人 | 任默闻 |
主权项 | 一种企业级数据仓库系统的样本数据获取方法,其特征在于,所述的方法包括:解析企业级数据仓库系统的包括模型关联关系信息的逻辑模型信息,以获取所述的模型关联关系信息;根据所述的模型关联关系信息生成样本数据抽取配置信息;根据所述的样本数据抽取配置信息、以及预先设置的抽取参数生成全量抽取脚本;对所述的全量抽取脚本进行迭代运算以确定全量抽取脚本调度的依赖关系;根据所述的依赖关系生成基于有向图数据结构的调度文件;根据所述的调度文件并行调度所述的全量抽取脚本以获取样本数据。 | ||
地址 | 100140 北京市西城区复兴门内大街55号 |