发明名称 基因测序数据读取方法及系统
摘要 本发明涉及生物信息学技术领域,提出了一种基因测序数据读取方法,包括如下步骤:对用户参数进行解析,确定任务个数;根据任务个数将测序数据分割成相同大小的文件块;对每个文件块的起始地址和终止地址进行调整;各任务对调整后的文件块结果进行读取。本发明还提供了基因测序数据读取系统及设有所述系统的基因测序数据分析装置。本发明实现了基因测序数据的并行读取,且各个文件块大小均匀,还避免了将一个序列分割到两个不同的文件块中。
申请公布号 CN103049680B 申请公布日期 2016.09.07
申请号 CN201210592061.2 申请日期 2012.12.29
申请人 深圳先进技术研究院 发明人 孟金涛;魏延杰;成杰峰;冯圣中
分类号 G06F19/20(2011.01)I;G06F17/21(2006.01)I 主分类号 G06F19/20(2011.01)I
代理机构 深圳市科进知识产权代理事务所(普通合伙) 44316 代理人 宋鹰武
主权项 一种基因测序数据读取方法,其特征在于,包括如下步骤:步骤a:对用户参数进行解析,确定任务个数;步骤b:根据任务个数将测序数据分割成相同大小的文件块;步骤c:对每个文件块的起始地址和终止地址进行调整;步骤d:各任务对调整后的文件块结果进行读取;在所述步骤a之前还包括如下步骤:对任务进行初始化,在所有节点之间建立连接,并对节点信息、任务信息进行统计;所述步骤d为各任务对调整后的文件块结果进行多视口并行文件读取;所述步骤b具体为:根据任务个数将测序数据分割成相同大小的文件块,得到每个文件块的起始位置和终止位置;所述步骤c具体为:将步骤b所得每个文件块的起始位置调整为所述起始位置后第一个序列的起始点;将步骤b所得每个文件块的终止位置调整为所述终止位置后第一个序列的起始点,或调整为所述终止位置后的文件终止符;所述任务为进程,或程序中的线程。
地址 518055 广东省深圳市南山区西丽大学城学苑大道1068号