发明名称 一种特异性等温寡核苷酸探针的批量获取方法
摘要 本发明提供了一种基于全基因组序列的特异性等温寡核苷酸探针的批量获取方法,首先利用设计算法获得该细菌性致病菌全基因组的特有基因片段序列,利用设计的基于致病菌特有基因片段序列的特异性等温探针设计算法在不同的致病菌基因上批量设计等温寡核苷酸探针,结合芯片扫描,从而实现致病菌全基因组的扫描分析,发展用于检测已知细菌特异性基因、毒力基因的检测芯片,从而达到对未知病原细菌的快速筛查与确认;该方法的实施对于相关技术领域具有较大的经济和社会意义。
申请公布号 CN105274092A 申请公布日期 2016.01.27
申请号 CN201510849278.0 申请日期 2015.11.30
申请人 中国人民解放军军事医学科学院卫生学环境医学研究所 发明人 牛超;高志贤;刘颖;王涛;王静;王尚
分类号 C12N15/10(2006.01)I;C12Q1/68(2006.01)I 主分类号 C12N15/10(2006.01)I
代理机构 天津市尚仪知识产权代理事务所(普通合伙) 12217 代理人 周晓雨
主权项 一种特异性等温寡核苷酸探针的批量获取方法,其特征在于包括以下步骤:(1)构建非致病性细菌蛋白质数据库;构建非致病性细菌蛋白质数据库是从NCBI基因组工程公布的已完成全基因组测序的细菌菌株中选取对人、动物和植物都不致病的非致病菌菌株,并且从NCBI GenBank获取非致病菌菌株的全基因组蛋白质序列来构建非致病性细菌蛋白质数据库;(2)致病性细菌特有基因的生物信息学预测;致病性细菌特有基因的生物信息学预测是将致病菌蛋白数据库中的每一个蛋白质序列和整个非致病菌蛋白数据库中的蛋白质序列利用Blast工具进行同源比对,去除致病菌蛋白数据库中在非致病菌库中存在同源比对e值小于1e‑7的所有蛋白质序列,将剩余的致病菌库中蛋白质序列定义为致病菌侯选蛋白质;在获得的所有致病菌侯选蛋白质中进行内部同源比对,如果任一个致病菌侯选蛋白质与其余所有侯选蛋白质在同源比对时不存在e值小于1e‑5,则该侯选致病菌侯选蛋白质被定义为致病菌孤儿蛋白(由基因替代产生),否则被定义为致病菌特有蛋白;(3)识别批量致病菌特有基因片段序列;基于样本库减模式的相似性比对方法获得致病菌特有基因以及致病菌孤儿基因,包括以下步骤:①在NCBI GenBank数据库中获取致病菌特有基因以及致病菌孤儿基因的相应核酸序列;②批量获取致病菌特有基因片段序列,按照四个步骤进行:第一步:首先去除基因序列中存在的具有生物学意义上的干扰序列片段,即去除低复杂度序列LCR;第二步:将基因全长序列打散为基因片段序列:设计基因序列打散算法,将112,421条致病菌菌株基因序列按长度length=29mer,步长step=7mer,重叠overlap=22mer进行打散;第三步:对于打散的总基因片段序列中去除包含简并密码子的序列;所述简并密码子包含:Y=CT,R=AG,W=AT,S=CG,K=GT,M=AC,D=AGT,V=ACG,H=ACT,B=CGT,N=ACGT;第四步:去除在非致病菌基因序列中出现的基因片段;在去除包含有简并密码子的片段序列后,对于剩余的片段序列,如果任何一条片段中存在连续15个碱基同所述步骤(1)构建非致病性细菌蛋白质数据库的序列完全匹配,则去除该片段,最终剩余的片段集合即为致病菌特有基因片段序列;(4)获得批量致病菌特有指纹片段序列;基于步骤(3)中获得的长度为29mer的致病菌菌株基因序列,获取其致病菌特有片段的七个相关信息:id:致病菌特有基因片段编号;seq:致病菌特有基因片段序列;gi:致病菌特有基因片段在基因上有分布的蛋白质号;chromosome/plasmid:致病菌特有基因片段在基因上有分布的基因所属于染色体或者质粒号;gene product:致病菌特有基因片段在基因上有分布相应基因产物描述;strain:致病菌特有基因片段分布的细菌菌株名称;position:致病菌特有基因片段在基因上分布的起始位置信息;计算得出基因片段中每一条致病菌特有基因片段在不同致病菌及其基因中的分布,并得到不同致病菌菌属、菌种、菌株所特有的保守片段,构建批量致病菌特有指纹片段序列;(5)获得批量致病菌特异性探针;从步骤(4)中获得的批量致病菌特有指纹片段序列中提取所有特有基因片段在不同致病菌及其基因中的分布信息,包括如下:gi:致病菌特有基因片段在基因上有分布的蛋白质号;position:致病菌特有基因片段在基因上分布的起始位置信息;采用基于致病菌特有基因片段的特异性等温探针设计算法,利用该算法在不同的致病菌及基因上设计等温探针,构建致病菌特异性探针数据库。
地址 300000 天津市和平区大理道一号