发明名称 | 一种开放式蛋白质鉴定的分布式加速方法及其系统 | ||
摘要 | 本发明公开了一种开放式蛋白质鉴定的分布式加速方法及其系统,其中开放式蛋白质鉴定的分布式加速系统包括:蛋白库索引建立模块、谱图数据准备模块、查询打分模块、结果汇总输出模块。本发明提供的一种开放式蛋白质鉴定的分布式加速方法和系统,能有效利用集群资源,允许用户在蛋白质大库下不指定酶切和修饰的类型,或指定其中的任意类型进行蛋白质鉴定,有效的提高了蛋白质谱鉴定速度和解析率。 | ||
申请公布号 | CN103678950B | 申请公布日期 | 2016.05.18 |
申请号 | CN201210316345.9 | 申请日期 | 2012.08.30 |
申请人 | 中国科学院计算技术研究所 | 发明人 | 张文力;迟浩;路远征;王乐珩;赵晓芳;贺思敏 |
分类号 | G06F19/18(2011.01)I | 主分类号 | G06F19/18(2011.01)I |
代理机构 | 北京律诚同业知识产权代理有限公司 11006 | 代理人 | 祁建国;梁挥 |
主权项 | 一种开放式蛋白质鉴定的分布式加速方法,其特征在于,包括:步骤1,根据蛋白质序列数据库分批创建肽段索引,并将所述肽段索引分块存入磁盘持久化;步骤2,输入欲鉴定的蛋白质谱图数据,将所述的蛋白质谱图数据多线程生成查询集合,并预存所述肽段索引到内存储器里;步骤3,对所述查询集合在所述肽段索引上进行分块检索,初选潜在匹配的肽序列,并将检索结果暂存于内存储器里,对所述检索结果考虑修饰类型生成候选肽段并打分,对应每张谱图得到肽序列集合,每检索一块肽段索引,更新一次肽序列集合,直到所有分块检索处理完成;步骤4,汇总所述肽序列集合,得出每张谱图对应的候选肽序列,并进行肽段到蛋白质的推断,生成鉴定结果存入所述磁盘。 | ||
地址 | 100190 北京市海淀区中关村科学院南路6号 |