发明名称 一种开放式蛋白质鉴定的分布式加速方法及其系统
摘要 本发明公开了一种开放式蛋白质鉴定的分布式加速方法及其系统,其中开放式蛋白质鉴定的分布式加速系统包括:蛋白库索引建立模块、谱图数据准备模块、查询打分模块、结果汇总输出模块。本发明提供的一种开放式蛋白质鉴定的分布式加速方法和系统,能有效利用集群资源,允许用户在蛋白质大库下不指定酶切和修饰的类型,或指定其中的任意类型进行蛋白质鉴定,有效的提高了蛋白质谱鉴定速度和解析率。
申请公布号 CN103678950B 申请公布日期 2016.05.18
申请号 CN201210316345.9 申请日期 2012.08.30
申请人 中国科学院计算技术研究所 发明人 张文力;迟浩;路远征;王乐珩;赵晓芳;贺思敏
分类号 G06F19/18(2011.01)I 主分类号 G06F19/18(2011.01)I
代理机构 北京律诚同业知识产权代理有限公司 11006 代理人 祁建国;梁挥
主权项 一种开放式蛋白质鉴定的分布式加速方法,其特征在于,包括:步骤1,根据蛋白质序列数据库分批创建肽段索引,并将所述肽段索引分块存入磁盘持久化;步骤2,输入欲鉴定的蛋白质谱图数据,将所述的蛋白质谱图数据多线程生成查询集合,并预存所述肽段索引到内存储器里;步骤3,对所述查询集合在所述肽段索引上进行分块检索,初选潜在匹配的肽序列,并将检索结果暂存于内存储器里,对所述检索结果考虑修饰类型生成候选肽段并打分,对应每张谱图得到肽序列集合,每检索一块肽段索引,更新一次肽序列集合,直到所有分块检索处理完成;步骤4,汇总所述肽序列集合,得出每张谱图对应的候选肽序列,并进行肽段到蛋白质的推断,生成鉴定结果存入所述磁盘。
地址 100190 北京市海淀区中关村科学院南路6号