发明名称 碱基序列比对系统及方法
摘要 本发明公开一种碱基序列比对系统及方法。根据本发明一个实施例的碱基序列比对系统,用于将包含第一序列及第二序列的一对碱基序列比对到参考序列,包括:种子序列生成单元,从所述第一序列及所述第二序列中分别生成一个以上的片段,并由此构成第一种子序列集合及第二种子序列集合;映射值计算单元,将所述参考序列划分为多个区间,并按所述多个区间分别计算包含于所述第一种子序列集合中的种子序列在对应区间内的第一映射值以及包含于所述第二种子序列集合中的种子序列在对应区间内的第二映射值;比对单元,选择计算出的所述第一映射值及所述第二映射值均为基准值以上的第一区间,并在所述第一区间内搜寻所述第一序列及所述第二序列的映射位置。
申请公布号 CN103793626B 申请公布日期 2017.03.01
申请号 CN201310367008.7 申请日期 2013.08.21
申请人 三星SDS株式会社;延世大学校产学协力团 发明人 朴旻胥;朴商贤;吕润九
分类号 G06F19/22(2011.01)I 主分类号 G06F19/22(2011.01)I
代理机构 北京铭硕知识产权代理有限公司 11286 代理人 金光军;金玉兰
主权项 一种碱基序列比对系统,用于将包含第一序列及第二序列的一对碱基序列比对到参考序列,包括:误差估计单元,针对所述第一序列及所述第二序列各自的正向序列及反向互补序列,从第一个碱基开始到末尾碱基为止以一个碱基为单位逐个移动而与所述参考序列进行精确匹配,并将判断为无法实现精确匹配的位置的个数设定为所述第一序列及所述第二序列各自的正向序列及反向互补序列的最小误差估计值;种子序列生成单元,选择所述第一序列及所述第二序列各自的正向序列及反向互补序列中所述最小误差估计值为预先设定的最大误差允许值以下的序列,并从所述选择的各个序列中分别生成一个以上的片段,由此构成所述选择的各个序列的种子序列集合;映射值计算单元,将所述参考序列划分为多个区间,并按所述多个区间分别计算包含于所述选择的各个序列的种子序列集合中的种子序列在对应区间内的映射值;比对单元,从所述多个区间中选择包含于所述选择的各个序列的种子序列集合中的种子序列的映射值均为基准值以上的第一区间,并在所述第一区间内搜寻所述选择的各个序列的映射位置。
地址 韩国首尔市