发明名称 一种利用DNA序列条码矫正二代高通量测序的序列丰度偏差的方法
摘要 本发明涉及一种利用DNA序列条码矫正二代高通量测序的序列丰度偏差的方法,通过引进10个或10个以上的DNA序列作为条码标签,对各种不同样品的DNA通过高通量测序获得的丰度数据进行矫正。本专利通过三种不同的设计引入DNA序列条码,这三种方法可适用于各种不同的样品条件。在描述这三个技术设计时,我们的设计以454高通量测序为例。但这个原理同样适用于其他的高通量测序技术平台,包括SOLiD、Polynator等等。本发明有效地克服了当前二代高通量测序的几个平台建库中的emulsion PCR步骤引入的实验误差。本专利设计的技术方法和实验流程,通过引入100万种以上(410=1048576)的DNA序列条码,来区分和纠正在emulsion PCR过程中某一模板序列由于油包水小球破裂污染产生的偏高的序列读出丰度。
申请公布号 CN101845500B 申请公布日期 2013.02.27
申请号 CN201010174553.0 申请日期 2010.05.18
申请人 苏州众信生物技术有限公司 发明人 李轩;熊慧;郝沛;李亦学
分类号 C12Q1/68(2006.01)I;C12Q1/70(2006.01)I 主分类号 C12Q1/68(2006.01)I
代理机构 南京众联专利代理有限公司 32206 代理人 赵枫
主权项 1.一种利用DNA序列条码矫正二代高通量测序的序列丰度偏差的方法,其特征是采用:方式一:将10个核酸序列组成的序列条码N加到454建库adaptor的下游直接与样本DNA相连的部分,其中字体加框的部分为序列互补部分5′-CCATCT<img file="FSB00000935855800011.GIF" wi="45" he="70" />ATCCCTGCGTG<img file="FSB00000935855800012.GIF" wi="44" he="70" />CT<img file="FSB00000935855800013.GIF" wi="43" he="70" />C<img file="FSB00000935855800014.GIF" wi="44" he="71" />A<img file="FSB00000935855800015.GIF" wi="535" he="73" />T3′-ATAG<img file="FSB00000935855800016.GIF" wi="46" he="69" />GGACACACGGA<img file="FSB00000935855800017.GIF" wi="44" he="70" />CC<img file="FSB00000935855800018.GIF" wi="42" he="71" />T<img file="FSB00000935855800019.GIF" wi="43" he="70" />A<img file="FSB000009358558000110.GIF" wi="550" he="72" />本方式通过DNA接头与DNA样本的连接反应来引入核酸序列条码,DNA样本片段利用nebulization的方法打断后,使用Agencourt的AMPure XP试剂提取400-800bp的DNA片段,经过末端修复后,利用Klenow polymerase酶和dATP加入3’A-tail,然后对3’A-tailed DNA样品和核酸序列条码的DNA接头连接,本方式的产物,可直接进入454的高通量测序的emPCR步骤,或者,方式二:将10个核酸序列组成的序列条码N通过2个PCR引物加到测序样品的一端,核酸序列条码通过最后一轮PCR引入5’-NNNNNNNNNN-与样本序列上游互补的特异序列-3’5’-NNNNNNNNNN-与样本序列下游互补的特异序列-3’,本方式利用与样本序列互补的特异序列作为引物,通过一轮的PCR反应来引入核酸序列条码,为了提高核酸序列条码的引入效率,将使用较长的annealing时间,此种设计的引入核酸序列条码后产物,还要通过建库步骤才能进入454的高通量测序的emPCR步骤;或者,方式三:将高通量测序引导序列和10个核酸序列条码N通过PCR加到测序样品的两端,每端5个核酸条码序列,核酸序列条码通过最后一轮PCR引入#PA:5’-CCATCTCATCCCTGCGTGTCTCCGACTCAG-N5-与样本序列上游互补的特异序列#PB:5’-CCTATCCCCTGTGTGCCTTGGCAGTCTCAG-N5-与样本序列下游互补的特异序列,本方式利用与样本序列互补的特异序列作为引物,通过一轮的PCR反应来引入核酸序列条码,为了提高核酸序列条码的引入效率,将使用较长的annealing时间,此种设计方法的产物,可直接进入454的高通量测序的emPCR步骤,上述三种方式DNA序列条码对不同样品DNA通过测序平台高通量测序获得的丰度数据进行矫正,所述测序平台为454Genome Sequencer、SOLiD或Polynator;所述方式一应用于多种不知序列DNA混合片段;所述方式二和方式三应用于已知序列的单一或几种DNA混合片段。
地址 215125 江苏省苏州市工业园区星湖街218号生物纳米园A2楼426单元(137-6149-5255)