发明名称 一种快速自动分析原核生物蛋白质基因组学数据的方法
摘要 本发明提供一种快速自动分析原核生物蛋白质基因组学数据的方法,用户只需提供质谱数据与对应的数据库文件,并设置简单的检索参数;本发明既可完成蛋白质基因组数据的检索,同时还能够兼容用户自定义的数据检索结果,从而提高了蛋白质组学数据的鉴定覆盖率;本发明预先整合了不同算法的搜库引擎,弥补单一检索方法的不足;本发明还能兼容用户自定义的搜库结果,具有很好的兼容性,最大限度的提高了肽段鉴定覆盖率;本发明中自动完成新基因的功能注释,并首次实现了蛋白质翻译后修饰的大规模鉴定以及非标记定量蛋白质组学的分析,真正实现了蛋白质基因组学数据的自动快速深度分析。
申请公布号 CN105956416A 申请公布日期 2016.09.21
申请号 CN201610303315.2 申请日期 2016.05.10
申请人 湖北普罗金科技有限公司 发明人 杨明坤;张珈;洪斌;葛峰
分类号 G06F19/18(2011.01)I 主分类号 G06F19/18(2011.01)I
代理机构 北京高沃律师事务所 11569 代理人 李娜
主权项 一种快速自动分析原核生物蛋白质基因组学数据的方法,其特征在于,步骤如下:1)对基因组数据进行六阅读框翻译,对转录组数据、EST序列以及非编码RNA数据进行三阅读框翻译,构建蛋白序列数据库文件,对原始质谱数据进行格式转化得到转化后的质谱数据,对数据库检索参数定义;2)选择具有不同算法的数据检索引擎,对步骤1)所述转化后的质谱数据进行数据库检索,得到检索结果;3)整合所述步骤2)得到的检索结果和用户自定义的搜索引擎检索鉴定结果,并将鉴定到的肽段回贴基因组,进行假阳性概率计算,根据计算结果删除假阳性肽段,得到筛选后的肽段信息;4)根据所述步骤3)得到的筛选后的肽段,一类用于验证已注释编码基因的表达和结构,另一类用于发现新基因和校正已注释基因的结构,得到新基因,并综合转录组信息,利用对应的转录单元对重注释的新基因进行验证;5)对所述步骤4)得到的新基因进行功能注释;6)采用蛋白质非限制性翻译后修饰分析方法,对所述步骤1)中得到的转化后的质谱数据进行蛋白质翻译后修饰的大规模鉴定;7)对所述步骤1)中的质谱数据进行全细胞蛋白的非标记定量分析。
地址 430000 湖北省武汉市东湖高新区高新大道666号光谷生物城创新园C4栋