发明名称 |
一种基于分布式文件系统的批量文件操作方法及系统 |
摘要 |
本发明涉及一种基于分布式文件系统的批量文件操作方法,具体包括以下步骤:步骤1:初始化;步骤2:打开分布式文件系统中的一个或多个文件;步骤3:判断是否有需要连续写入的数据内容,如果有,进行步骤4;否则,进行步骤5;步骤4:将多个字符串拼接成长字符;步骤5:对文件进行写操作;步骤6:判断是否到达预设的批次时间,如果到达,进行步骤7,否则,转向步骤3;步骤7:将缓存的数据刷到磁盘上,判断数据是否写完,如果写完,进行步骤8;否则,跳转至步骤3;步骤8:关闭该文件。本发明提高了应用程序在分布式文件系统上的写性能和文件操作的性能;同时保证数据的正确性和准确性。 |
申请公布号 |
CN103488433A |
申请公布日期 |
2014.01.01 |
申请号 |
CN201310429874.4 |
申请日期 |
2013.09.18 |
申请人 |
北京思特奇信息技术股份有限公司 |
发明人 |
李晓静 |
分类号 |
G06F3/06(2006.01)I;G06F11/07(2006.01)I |
主分类号 |
G06F3/06(2006.01)I |
代理机构 |
北京轻创知识产权代理有限公司 11212 |
代理人 |
杨立 |
主权项 |
一种基于分布式文件系统的批量文件操作方法,其特征在于,具体包括以下步骤:步骤1:初始化,读入程序的配置信息,记录第一个批次开始的时间;步骤2:打开分布式文件系统中的一个或多个文件,对于频繁读写的文件,将文件句柄和对应的文件名称保存在内存中;步骤3:判断是否有需要连续写入的数据内容,如果有,进行步骤4;否则,进行步骤5;步骤4:将准备连续写入的多个字符串拼接成一个长字符串,以便将长字符串一次性写入分布式文件系统的文件;步骤5:对文件进行写操作,根据步骤2在内存中记录的内容,按照文件名称找到对应的文件句柄,直接进行写入操作,把数据写入分布式文件系统文件中;步骤6:获取当前时间,判断是否到达预设的批次时间,如果到达预设的批次时间,进行步骤7,否则,转向步骤3,进行下一个循环的数据写入;步骤7:对于频繁写的文件,需要调用分布式文件系统的刷数据接口,将写入分布式文件系统缓存的数据刷到磁盘上,判断对应文件的数据是否写完,如果写完,进行步骤8;否则,将当前时间置为下一个批次的开始时间;跳转至步骤3,进行下一个循环的数据写入;步骤8:对应文件的数据写完,关闭该文件。 |
地址 |
100086 北京市海淀区中关村南大街6号中电信息大厦16层 |