发明名称 |
一种低存储开销的运行时递推数据溯源方法 |
摘要 |
本发明属于数据溯源领域,特别是一种低存储开销的运行时递推数据溯源方法。将起源信息分为粗粒度起源信息和细粒度起源信息,在数据处理系统中最后一个处理单元产生输出数据元组时,对该输出数据元组的起源信息进行递推,递推得到数据处理系统中第一个处理单元的触发运行的时间范围,并将该时间范围与输出数据元组一起进行持久存储,溯源查询时,根据存储在输出数据元组中的第一个处理单元的触发运行的时间范围,推算出数据处理系统输入数据流中所有对待溯源输出数据元组的产生有贡献的输入数据元组,即完成了数据溯源的过程。本发明由于不需要对每个处理单元的起源信息进行存储,因此拥有更低的存储开销。 |
申请公布号 |
CN103177184A |
申请公布日期 |
2013.06.26 |
申请号 |
CN201310034449.5 |
申请日期 |
2013.01.30 |
申请人 |
南京理工大学常熟研究院有限公司 |
发明人 |
李千目;谢新;戚湧;於东军;侯君;朱长林 |
分类号 |
G06F19/00(2006.01)I |
主分类号 |
G06F19/00(2006.01)I |
代理机构 |
|
代理人 |
|
主权项 |
1.一种低存储开销的运行时递推数据溯源方法,其特征在于步骤如下:第一步,在数据处理系统部署时,记录其粗粒度起源信息;第二步,在数据处理系统运行过程中,记录其细粒度起源信息;第三步,在数据处理系统中最后一个处理单元产生输出数据元组时,对该输出数据元组的起源信息进行递推,递推得到数据处理系统中第一个处理单元的触发运行的时间范围,将第一个处理单元的触发运行的时间范围<img file="764394DEST_PATH_IMAGE001.GIF" wi="72" he="32" />与输出数据元组一起进行持久存储;第四步,溯源查询时,根据存储在输出数据元组中的第一个处理单元的触发运行的时间范围<img file="159603DEST_PATH_IMAGE001.GIF" wi="72" he="32" />,推算出数据处理系统输入数据流中所有对待溯源输出数据元组的产生有贡献的输入数据元组。 |
地址 |
215513 江苏省苏州市常熟市经济技术开发区科创园研究院路5号 |