发明名称 |
核酸序列拼接方法及装置 |
摘要 |
本发明公开了一种核酸序列拼接方法及装置,包括:接收测序序列,测序序列包括读段和测通数据;根据读段构建原始拼接图;将测通数据比对到原始拼接图的边上;从原始拼接图的边集中选择锚点边;构建以锚点边为中心的局部子图;化简局部子图,在化简结果中重复选择锚点边进行处理直至不存在新的锚点边;对处理后剩余的局部子图进行合并,将合并结果作为拼接结果输出。依据本发明的方法,通过将测通数据比对到由读段构建得的原始拼接图,从中选择出锚点边并据此构建局部子图,再通过对局部子图的化简和合并得到更长的路径,达到解决锚点边之间的重复序列的路径选择问题,进而可完成测序序列的拼接任务,为提升scaffold构建效果提供可能。 |
申请公布号 |
CN104850761A |
申请公布日期 |
2015.08.19 |
申请号 |
CN201410053255.4 |
申请日期 |
2014.02.17 |
申请人 |
深圳华大基因科技有限公司 |
发明人 |
李振宇;陈燕香;张浩;袁剑颖;张广鑫;李一萱 |
分类号 |
G06F19/18(2011.01)I;G06F19/20(2011.01)I |
主分类号 |
G06F19/18(2011.01)I |
代理机构 |
深圳鼎合诚知识产权代理有限公司 44281 |
代理人 |
彭家恩;罗瑶 |
主权项 |
一种核酸序列拼接方法,其特征在于,包括:接收测序序列,所述测序序列包括读段和测通数据;根据所述读段构建原始拼接图;将所述测通数据比对到所述原始拼接图的边上;从原始拼接图的边集中选择锚点边,所述锚点边的两端没有分叉且跨过该锚点边的读段的路径没有冲突;构建以所述锚点边为中心的局部子图;化简所述局部子图,在化简结果中重复选择锚点边进行处理直至不存在新的锚点边;对处理后剩余的局部子图进行合并,将合并结果作为拼接结果输出。 |
地址 |
518083 广东省深圳市盐田区北山路146号北山工业区综合楼11F-3 |