发明名称 通过应用参考基因组的分层结构使诧异数据最小
摘要 一种使诧异数据最小的方法、计算机程序产品、和计算机系统包含:在源头上,计算机读取和识别生物体的基因序列的特性;接收生物体的基因序列的至少两种所识别特性的等级的输入;根据生物体的基因序列的至少两种所识别特性的等级生成分级的所识别特性的分层结构;将分级的所识别特性的分层结构与参考基因组的中心库相比较;以及如果来自中心库的至少一个参考基因组与分级的所识别特性的分层结构匹配,则将生物体的基因序列的核苷酸与来自至少一个匹配参考基因组的核苷酸相比较,以获取差异和创建诧异数据。
申请公布号 CN104335213A 申请公布日期 2015.02.04
申请号 CN201380026006.X 申请日期 2013.05.15
申请人 国际商业机器公司 发明人 J.克雷默;R.弗里德兰德
分类号 G06F19/22(2006.01)I 主分类号 G06F19/22(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 周少杰;张贵东
主权项 一种使诧异数据最小的方法,该方法包含如下步骤:a)在源头上,计算机读取和识别生物体的基因序列的特性;b)该计算机接收生物体的基因序列的至少两种所识别特性的等级的输入;c)该计算机根据生物体的基因序列的至少两种所识别特性的等级生成分级的所识别特性的分层结构;d)该计算机将分级的所识别特性的分层结构与参考基因组的中心库相比较;以及e)如果来自中心库的至少一个参考基因组与分级的所识别特性的分层结构匹配,则i)该计算机将至少一个匹配参考基因组存储在中心库中;ii)该计算机将生物体的基因序列的核苷酸与来自至少一个匹配参考基因组的核苷酸相比较,以找出生物体的基因序列的核苷酸与来自至少一个匹配参考基因组的核苷酸不同的差异;以及iii)该计算机使用该差异创建诧异数据并将该诧异数据存储在中心库中,该诧异数据包含参考基因组内该差异的开始地点、和与参考基因组的核苷酸不同的来自生物体的基因序列的核苷酸;如果来自中心库的另一个参考基因组与分级的所识别特性的分层结构匹配,则重复步骤(e)(i)、(e)(ii)、和(e)(iii)。
地址 美国纽约阿芒克