发明名称 利用基因组测序片段检测拷贝数变异的方法
摘要 本发明提供了一种检测拷贝数变异的方法。该方法通过对目标样本进行测序,并对测序片段的覆盖深度进行分析来实现对拷贝数变异的评估。
申请公布号 CN104603284B 申请公布日期 2016.08.24
申请号 CN201280075581.4 申请日期 2012.09.12
申请人 深圳华大基因研究院;深圳华大基因科技有限公司 发明人 张帆;罗锐邦;李娜;李英睿;王俊;汪建;杨焕明
分类号 C12Q1/68(2006.01)I;G06F19/22(2006.01)I 主分类号 C12Q1/68(2006.01)I
代理机构 北京北翔知识产权代理有限公司 11285 代理人 张广育;姜建成
主权项 一种检测拷贝数变异的方法,包括步骤:1)对目标样本进行测序,得到测序片段;2)将以上得到的测序片段与参考基因组序列比对,得到参考序列每个位点的覆盖深度,即比对结果中涵盖该位点的测序片段数目;3)根据以上每个位点的覆盖深度,将所有位点的覆盖深度取平均得出序列的平均覆盖深度,以同样的方式计算参考序列上具有预设片段长度的所有窗口的覆盖深度信息,这些窗口被定义为正常窗口、重复窗口、缺失窗口和N窗口四种类型之一,其中正常窗口为覆盖深度与序列平均覆盖深度相同的窗口,重复窗口为覆盖深度明显大于平均覆盖深度的窗口,缺失窗口为覆盖深度明显小于平均覆盖深度的窗口,N窗口为基本没有覆盖深度的窗口;4)将满足以下条件任一项的三个以上连续窗口合并,并判断合并后的区域是否属于缺失和重复这两种拷贝数变异:i.连续重复窗口或连续缺失窗口、ii.缺失窗口之间有N窗口间隔,其中N窗口不能连续出现一个以上、iii.重复窗口之间有N窗口间隔,其中N窗口不能连续出现一个以上、iv.缺失窗口之间有正常窗口间隔,其中正常窗口的覆盖深度应满足减去3倍SD后落在缺失窗口的覆盖深度范围内,并且其中正常窗口不能连续出现一个以上、v.重复窗口之间有正常窗口间隔,其中正常窗口的覆盖深度应满足加上3倍SD后落在重复窗口覆盖深度范围内,并且其中正常窗口不能连续出现一个以上其中,SD为所有位点的覆盖深度取平均得出序列的平均覆盖深度标准差;5)对以上合并区域降低假阳性,所得到的区域就是发生了插入或缺失的拷贝数变异区域。
地址 518083 广东省深圳市盐田区北山工业区综合楼