发明名称 用于管理基因序列的方法和装置
摘要 本发明提供了用于管理基因序列的方法和装置。在一个实施方式中,提供了一种用于确定第一基因序列与第二基因序列之间的相似性的方法,包括:分别在第一基因序列和第二基因序列上移动预定长度的滑动窗口;在滑动窗口的第i次移动期间,提取所述第一基因序列在所述滑动窗口内的第一部分、和所述第二基因序列在所述滑动窗口内的第二部分;以及基于第一部分和第二部分确定第一基因序列与第二基因序列之间的相似性。在其他实施方式中,还用于压缩基因序列的方法、以及用于对经压缩的基因序列进行解压缩的方法。采用本发明,可以以更加适合于基因序列的自身特点的方式来度量两个基因序列之间的相似性,还可以基于该相似性来找到参考数据库中的最为匹配参考基因序列,并压缩基因序列。
申请公布号 CN105631239A 申请公布日期 2016.06.01
申请号 CN201410599394.7 申请日期 2014.10.30
申请人 国际商业机器公司 发明人 丁建栋;朱俊;黄胜;张亚楠;严骏驰
分类号 G06F19/10(2011.01)I 主分类号 G06F19/10(2011.01)I
代理机构 北京市金杜律师事务所 11256 代理人 酆迅;李峥宇
主权项 一种用于确定第一基因序列与第二基因序列之间的相似性的方法,包括:分别在所述第一基因序列和所述第二基因序列上移动预定长度的滑动窗口;在所述滑动窗口的第i次移动期间,提取所述第一基因序列在所述滑动窗口内的第一部分String1<sub>i</sub>、和所述第二基因序列在所述滑动窗口内的第二部分String2<sub>i</sub>;以及基于所述第一部分String1<sub>i</sub>和所述第二部分String2<sub>i</sub>确定所述第一基因序列与所述第二基因序列之间的相似性。
地址 美国纽约阿芒克