发明名称 |
一种高通量测序数据匹配方法 |
摘要 |
本发明属于在分子生物学技术领域,本发明属于分子生物信息检测领域,具体涉及在已有高通量DNA测序数据匹配基础上,基于环境平台修正因子增加测序数据的匹配数量,以提高测序数据的利用率的一种高通量DNA测序数据匹配方法。本发明包括:获取测序数据;初步匹配高通量DNA测序数据得到匹配成功数据集和匹配失败数据集;设置基于实验平台和环境的匹配修正因子k;用基于修正因子k的模型对匹配失败集中数据重新匹配;提取测序数据匹配失败集中成功匹配数据。本发明在原有高通量DNA测序数据匹配映射基础上,通过评估匹配失败测序数据集中数据发生成功匹配的可能,进一步增加成功匹配映射的数据数量,以提高测序数据的利用率。 |
申请公布号 |
CN105320850A |
申请公布日期 |
2016.02.10 |
申请号 |
CN201410376285.9 |
申请日期 |
2014.08.03 |
申请人 |
晶能生物技术(上海)有限公司 |
发明人 |
张艺;何飞;马丰收;邹晓文 |
分类号 |
G06F19/22(2011.01)I |
主分类号 |
G06F19/22(2011.01)I |
代理机构 |
|
代理人 |
|
主权项 |
一种高通量测序数据匹配方法,其特征在于,包括如下步骤:1)获取测序数据;2)初步匹配高通量DNA测序数据;利用常规高通量DNA测序数据匹配方法,对测序实验获得的高通量DNA测序数据进行初步匹配,将测序数据分为匹配成功和匹配失败两个数据集合;3)设置基于实验平台和环境的匹配修正因子k;对于不同的实验平台和不同的实验环境,设置不同的修正因子k,用于修正匹配规则;4)用基于修正因子k的模型对匹配失败集中数据重新匹配;用修正因子k修正匹配规则,对匹配失败数据集中的数据进行匹配;5)将步骤4中匹配成功的数据集合加入匹配成功数据集合中。 |
地址 |
201111 上海市闵行区元江路5500号第2幢1187室 |