发明名称 一种高通量测序数据匹配方法
摘要 本发明属于在分子生物学技术领域,本发明属于分子生物信息检测领域,具体涉及在已有高通量DNA测序数据匹配基础上,基于环境平台修正因子增加测序数据的匹配数量,以提高测序数据的利用率的一种高通量DNA测序数据匹配方法。本发明包括:获取测序数据;初步匹配高通量DNA测序数据得到匹配成功数据集和匹配失败数据集;设置基于实验平台和环境的匹配修正因子k;用基于修正因子k的模型对匹配失败集中数据重新匹配;提取测序数据匹配失败集中成功匹配数据。本发明在原有高通量DNA测序数据匹配映射基础上,通过评估匹配失败测序数据集中数据发生成功匹配的可能,进一步增加成功匹配映射的数据数量,以提高测序数据的利用率。
申请公布号 CN105320850A 申请公布日期 2016.02.10
申请号 CN201410376285.9 申请日期 2014.08.03
申请人 晶能生物技术(上海)有限公司 发明人 张艺;何飞;马丰收;邹晓文
分类号 G06F19/22(2011.01)I 主分类号 G06F19/22(2011.01)I
代理机构 代理人
主权项 一种高通量测序数据匹配方法,其特征在于,包括如下步骤:1)获取测序数据;2)初步匹配高通量DNA测序数据;利用常规高通量DNA测序数据匹配方法,对测序实验获得的高通量DNA测序数据进行初步匹配,将测序数据分为匹配成功和匹配失败两个数据集合;3)设置基于实验平台和环境的匹配修正因子k;对于不同的实验平台和不同的实验环境,设置不同的修正因子k,用于修正匹配规则;4)用基于修正因子k的模型对匹配失败集中数据重新匹配;用修正因子k修正匹配规则,对匹配失败数据集中的数据进行匹配;5)将步骤4中匹配成功的数据集合加入匹配成功数据集合中。
地址 201111 上海市闵行区元江路5500号第2幢1187室