发明名称 核酸序列拼接方法及装置
摘要 本发明公开了一种核酸序列拼接方法及装置,包括:接收测序序列,测序序列包括读段和测通数据;根据读段构建原始拼接图;将测通数据比对到原始拼接图的边上;从原始拼接图的边集中选择锚点边;构建以锚点边为中心的局部子图;化简局部子图,在化简结果中重复选择锚点边进行处理直至不存在新的锚点边;对处理后剩余的局部子图进行合并,将合并结果作为拼接结果输出。依据本发明的方法,通过将测通数据比对到由读段构建得的原始拼接图,从中选择出锚点边并据此构建局部子图,再通过对局部子图的化简和合并得到更长的路径,达到解决锚点边之间的重复序列的路径选择问题,进而可完成测序序列的拼接任务,为提升scaffold构建效果提供可能。
申请公布号 CN104850761A 申请公布日期 2015.08.19
申请号 CN201410053255.4 申请日期 2014.02.17
申请人 深圳华大基因科技有限公司 发明人 李振宇;陈燕香;张浩;袁剑颖;张广鑫;李一萱
分类号 G06F19/18(2011.01)I;G06F19/20(2011.01)I 主分类号 G06F19/18(2011.01)I
代理机构 深圳鼎合诚知识产权代理有限公司 44281 代理人 彭家恩;罗瑶
主权项 一种核酸序列拼接方法,其特征在于,包括:接收测序序列,所述测序序列包括读段和测通数据;根据所述读段构建原始拼接图;将所述测通数据比对到所述原始拼接图的边上;从原始拼接图的边集中选择锚点边,所述锚点边的两端没有分叉且跨过该锚点边的读段的路径没有冲突;构建以所述锚点边为中心的局部子图;化简所述局部子图,在化简结果中重复选择锚点边进行处理直至不存在新的锚点边;对处理后剩余的局部子图进行合并,将合并结果作为拼接结果输出。
地址 518083 广东省深圳市盐田区北山路146号北山工业区综合楼11F-3