发明名称 |
一种基于Spark语义的数据重用方法及其系统 |
摘要 |
本发明提供一种基于Spark语义的数据重用方法,其中,所述方法包括:语义信息收集步骤、收集Spark应用运行时的语义信息;语义维护步骤、维护来自所述语义信息收集步骤所收集到的语义信息;数据主动缓存步骤、根据所述语义信息和预设的阈值模型缓存未被用户程序显式缓存的数据;缓存数据迁移步骤、根据所述语义信息和预设的阈值模型将缓存数据在动态随机存取存储器与固定存储器之间迁移。本发明还提供一种基于Spark语义的数据重用系统。本发明提供的技术方案能减少重复数据计算,提升计算效率,有效避免了对开发人员经验的依赖。 |
申请公布号 |
CN106484368A |
申请公布日期 |
2017.03.08 |
申请号 |
CN201610835530.7 |
申请日期 |
2016.09.20 |
申请人 |
深圳大学 |
发明人 |
陆克中;毛一帆;黄泽成;王明俭;毛睿;廖好 |
分类号 |
G06F9/38(2006.01)I;G06F9/30(2006.01)I;G06F3/06(2006.01)I |
主分类号 |
G06F9/38(2006.01)I |
代理机构 |
深圳市恒申知识产权事务所(普通合伙) 44312 |
代理人 |
王利彬 |
主权项 |
一种基于Spark语义的数据重用方法,其特征在于,所述方法包括:语义信息收集步骤、收集Spark应用运行时的语义信息;语义维护步骤、维护来自所述语义信息收集步骤所收集到的语义信息;数据主动缓存步骤、根据所述语义信息和预设的阈值模型缓存未被用户程序显式缓存的数据;缓存数据迁移步骤、根据所述语义信息和预设的阈值模型将缓存数据在动态随机存取存储器与固定存储器之间迁移。 |
地址 |
518000 广东省深圳市南山区南海大道3688号 |