发明名称 小麦BSR‑Seq基因定位的方法
摘要 本发明公开了一种小麦BSR‑Seq基因定位的方法,包括混池的构建和测序、质量变异挖掘、与目的基因紧密连锁的转录本的筛选、分子标记开发和定位等步骤。将下一代转录组测序技术(转录组测序,RNA‑Seq)和混池技术(Bulked Segregant Analysis,BSA)相结合,首先利用小麦测序草图序列作为参考序列;其次采用下一代测序技术高通量挖掘转录本上的大量的高质量SNP遗传变异,再结合混池技术精确计算等位基因频率来快速的筛选出可能与目的性状紧密连锁的转录本,并通过Fish精确检验控制假阳性。不依赖于参考基因组序列、低成本、快速、精度高,提升了小麦基因定位的效率和精度并降低了小麦多态性分子标记开发的成本,使小麦基因的精细定位工作时长从数年降低到数月、定位精度从数cM降低到零点几或0cM以及精细定位成本从数万降低到数千。
申请公布号 CN106202995A 申请公布日期 2016.12.07
申请号 CN201610551811.X 申请日期 2016.07.13
申请人 北京麦美瑞生物科技有限公司 发明人 谢菁忠;刘志勇;吴秋红
分类号 G06F19/22(2011.01)I 主分类号 G06F19/22(2011.01)I
代理机构 北京凯特来知识产权代理有限公司 11260 代理人 郑立明;赵镇勇
主权项 一种小麦BSR‑Seq基因定位的方法,其特征在于,包括步骤:A、混池的构建和测序:根据重组自交系作图群体、加倍双单倍体群体、回交渗入系群体、F<sub>2</sub>或F<sub>2:3</sub>分离群体表型鉴定结果,分别用15‑30个以上纯合极端高值个体和15‑30以上个纯合极端低值个体分别组建高值混合池和低值混合池,在表型未表现出差异,或表现出差异后分别取等量叶片组织混合而成高值池和低值池,并提取高值池和低值池的mRNA后进行转录组测序,从而得到两个混池的转录组测序数据;B、高质量变异挖掘:首先,对转录组测序原始数据进行过滤得到高质量数据,过滤标准是去除两端测序质量值小于20的碱基,小于25bp的测序读长将被丢弃,过滤采用自写Perl程序执行;其次,用STAR软件将高质量转录组测序序列数据比对到参考序列上并进行过滤,保留只有唯一比对位置且错配数小于2%的序列比对结果,比对结果使用Samtools软件挖掘可能的变异位点,再用自写Perl程序仅保留比对质量大于phred值15、变异质量大于phred值30、只有2种基因型、总深度大于6小于100000、参考序列基因型深度大于3、变异基因型深度大于3、参考序列基因型深度比例大于5%和变异基因型深度比例大于5%的比对结果;C、与目的基因紧密连锁的转录本的筛选:混池筛选和目的基因紧密连锁转录本的原理是:和目的基因越近的转录本在两混池间的等位基因频率差异越大,从而通过计算转录本SNP等位基因频率差异大小可以判断其与目的基因的远近;用自写Perl脚本从比对结果中得到SNP位点不同基因型在混池中的表达深度,以此计算等位基因频率;另外用自写Perl脚本计算各转录本各SNP位点最可能的两基因型在高值池和低值池的等位基因频率并计算其差值,同时用Fish精确检验计算两基因型在两混池中的表达量列联表差异p‑value,排除两混池间等位基因频率差值小于0.6和Fish精确检验p‑value值大于1e‑8的SNP位点,然后排除含有两混池间等位基因频率差值小于0.6或Fish精确检验p‑value值大于1e‑8的SNP位点的转录本,最后剩下的转录本我们认为是和目的基因紧密连锁的转录本;D、分子标记开发和定位:首先,依据得到的SNP位点设计CAPS或dCAPS标记,并依据与IWGSC数据库比对的结果找出转录本中在A/B/D同源基因间存在差异的特定位置,根据该位置设计EST标记,此外依据转录本序列和比对上的IWGSC序列设计SSR标记;其次,在作图群体中对分子标记进行多态性检验和分型;最后依据表型和各标记基因型数据进行遗传定位。
地址 100094 北京市海淀区永澄北路2号院1号楼B座二层1号