主权项 |
一种利用复数个长定序片段(long reads)重组一核酸序列(nucleic acid assembly)之方法,其系应用于一电脑系统中,而该些长定序片段储存于该电脑系统中,该方法包含下列步骤:读取储存于该电脑系统之该些长定序片段;根据一错误率决定一预设跳跃间距为J及一预设比对长度为H,其中该跳跃间距及该预设比对长度系核苷酸之数量;比对该些长定序片段,若该些长定序片段之间具有该预设比对长度之一共有序列,则依据该预设跳跃间距朝一预设方向跳跃,并重覆此比对与跳跃步骤直到达到该些长定序片段序列其中之一的末端为止;若比对出的该些共有序列之数量大于一阀值,则判断该些长定序片段之该些共有序列系重叠,其中重叠之该些共有序列具有一重叠长度为L,且该重叠长度系根据该错误率决定;该错误率系满足下列关系式:;以及将具有该些共有序列之该些长定序片段重组成该核酸序列。 |