发明名称 基于克隆DNA混合池的全基因组测序方法
摘要 本发明公开了一种基于克隆DNA混合池的全基因组测序方法。该方法首先构建BAC文库并构建BAC克隆DNA混合池,再对混合池DNA进行高能量测序;解析出克隆的特征序列集合与k-mer集合,利用克隆的特征序列构建出克隆重叠群,利用克隆重叠群上将克隆k-mer集合分割成小的k-mer集合,将混合池的NGS序列组装后的序列定位到克隆重叠群上;根据组装后序列与混合池的NGS序列双末端比对结果连接定位后的序列,并确定它们的方向;最后利用分子标记确定克隆重叠群的相对位置与方向,将克隆重叠群的序列连接成整条染色体序列,得到全基因组序列。本发明利用NGS高通量测序技术与克隆DNA混合池,不仅构建出全基因组的物理图谱,同时将拼装后的序列定位到物理图谱上,实现两者的整合。
申请公布号 CN103388025A 申请公布日期 2013.11.13
申请号 CN201310288791.8 申请日期 2013.07.10
申请人 华中农业大学 发明人 罗美中;潘永龙
分类号 C12Q1/68(2006.01)I 主分类号 C12Q1/68(2006.01)I
代理机构 武汉开元知识产权代理有限公司 42104 代理人 王和平
主权项 1.基于克隆DNA混合池的全基因组测序方法,其特征在于:包括以下步骤:1)提取全基因组DNA,构建BAC文库;2)构建BAC克隆混合池;3)提取BAC克隆混合池的DNA;4)对步骤3)中的BAC克隆混合池的DNA利用NGS进行双末端测序;5)扫描各个混合池的序列,获得各个混合池的特征序列集合与k-mer集合;6)根据混合池的特征序列集合与k-mer集合,解析出各个克隆的特征序列集合与k-mer集合;7)利用克隆的特征序列集合构建克隆重叠群;8)利用克隆重叠群将克隆的k-mer集合分割成小的k-mer集合并定位到克隆重叠群上;9)对步骤4)中混合池的NGS序列进行拼装得到序列重叠群;10)将序列重叠群定位到克隆重叠群上,并利用测序的双末端信息连接序列重叠群,确定它们的方向,得到克隆重叠群的序列;11)利用分子标记确定克隆重叠群的相对位置与方向,将克隆重叠群的序列连接成整条染色体序列,得到全基因组序列;其中,关于克隆特征序列集合与k-mer集合的解析的总算法如下:某一物种BAC文库的克隆总数为a,构建的混合池总数为x,则;第κ维,索引为λ混合池的k-mer集合表示为:P<sub>(κ,λ);</sub>包含某一给定克隆的混合池的k-mer集合为:{P<sub>(δ)</sub>|δ&lt;m, P<sub>(δ)</sub>∈P};包含同一克隆的混合池的k-mer集合的交集,即克隆的IKS为:<img file="FDA0000348870261.GIF" wi="325" he="100" />某一克隆在混合池中的排除并集EUKS为:<img file="FDA0000348870262.GIF" wi="828" he="100" />;某一克隆k-mer集合的所有排除并集的交集为:<img file="FDA0000348870263.GIF" wi="409" he="100" />;某一克隆的最终k-mer集合FKS为:CF=C<sub>x-</sub>CI<sub>x</sub>。
地址 430070 湖北省武汉市洪山区狮子山街1号
您可能感兴趣的专利