发明名称 基于酶切建库测序与贝叶斯统计的单核苷酸多态性位点鉴定的方法
摘要 本发明公开了基于酶切建库测序与贝叶斯统计的单核苷酸多态性位点鉴定的新的算法。它用于处理RAD测序数据,寻找RAD测序片段上的候选SNP,采用贝叶斯统计的生物信息学分析方法鉴定SNP可靠性。该方法一方面可以用于模式与非模式生物,摆脱大量物种缺少参考序列的限制,减少了测序成本;另一方面解决了目前利用RAD数据进行SNP鉴定时无可靠统计方法的瓶颈,使获得的SNP位点准确性极大提升。
申请公布号 CN103114150B 申请公布日期 2016.07.06
申请号 CN201310077509.1 申请日期 2013.03.11
申请人 上海美吉生物医药科技有限公司 发明人 张祥林;张一桐;陶晔;郑泽群;胡秋萍
分类号 C12Q1/68(2006.01)I 主分类号 C12Q1/68(2006.01)I
代理机构 上海伯瑞杰知识产权代理有限公司 31227 代理人 张美娟
主权项 基于酶切建库测序与贝叶斯统计的非疾病诊断目的的单核苷酸多态性位点鉴定的方法,其步骤如下:1)在获得RAD高通量测序技术的测序结果后,对RAD测序序列进行过滤以去除不合格的测序序列;2)利用序列的全同性生成每个个体序列堆的信息,并计算每个序列堆测序深度信息;3)将一个个体内所有序列堆进行两两比对,对堆进行聚类以确定个体内的候选杂合SNP位点;4)将不同个体内所有序列堆进行两两比对,对堆进行聚类以确定不同个体间的候选SNP位点;5)利用贝叶斯统计方法对每个候选SNP位点上各种基因型的深度信息进行分析,鉴定候选SNP的准确性,用于后续群体分析或者实验;步骤1)中,所述的不合格的测序序列为测序质量低于预定的低质量阈值的碱基个数超过整条序列碱基个数的50%的序列,以及起始处没有酶切特征序列的序列。
地址 201203 上海市浦东新区张江高科技园区蔡伦路720号1号楼630室