主权项 |
1.基于克隆DNA混合池的全基因组测序方法,其特征在于:包括以下步骤:1)提取全基因组DNA,构建BAC文库;2)构建BAC克隆混合池;3)提取BAC克隆混合池的DNA;4)对步骤3)中的BAC克隆混合池的DNA利用NGS进行双末端测序;5)扫描各个混合池的序列,获得各个混合池的特征序列集合与k-mer集合;6)根据混合池的特征序列集合与k-mer集合,解析出各个克隆的特征序列集合与k-mer集合;7)利用克隆的特征序列集合构建克隆重叠群;8)利用克隆重叠群将克隆的k-mer集合分割成小的k-mer集合并定位到克隆重叠群上;9)对步骤4)中混合池的NGS序列进行拼装得到序列重叠群;10)将序列重叠群定位到克隆重叠群上,并利用测序的双末端信息连接序列重叠群,确定它们的方向,得到克隆重叠群的序列;11)利用分子标记确定克隆重叠群的相对位置与方向,将克隆重叠群的序列连接成整条染色体序列,得到全基因组序列;其中,关于克隆特征序列集合与k-mer集合的解析的总算法如下:某一物种BAC文库的克隆总数为a,构建的混合池总数为x,则;第κ维,索引为λ混合池的k-mer集合表示为:P<sub>(κ,λ);</sub>包含某一给定克隆的混合池的k-mer集合为:{P<sub>(δ)</sub>|δ<m, P<sub>(δ)</sub>∈P};包含同一克隆的混合池的k-mer集合的交集,即克隆的IKS为:<img file="FDA0000348870261.GIF" wi="325" he="100" />某一克隆在混合池中的排除并集EUKS为:<img file="FDA0000348870262.GIF" wi="828" he="100" />;某一克隆k-mer集合的所有排除并集的交集为:<img file="FDA0000348870263.GIF" wi="409" he="100" />;某一克隆的最终k-mer集合FKS为:CF=C<sub>x-</sub>CI<sub>x</sub>。 |