发明名称 确定异质样本的基因组中的变异
摘要 在DNA片段被测序并被映射至参考之后,可以对变异区域中的序列的各个假设进行评分以发现哪个/些序列假设更有可能。假设可以包括对于包括该区域中的序列假设的多个等位基因的特定可变分数。可以使用说明相应序列假设中指定的等位基因的分数的概率确定每个假设的似然性。因此,可以通过在优化中明确包括等位基因的可变分数作为参数,探索除了标准纯合和相等杂合(即,细胞中具有A的一个染色体和具有B的一个染色体)之外的其它假设。而且,可以相对于参考为变异确定变异得分。变异得分可以用于确定指示变异识别正确的似然性的变异校准得分。
申请公布号 CN104160391A 申请公布日期 2014.11.19
申请号 CN201280056506.3 申请日期 2012.09.17
申请人 考利达基因组股份有限公司 发明人 J.巴卡什;A.哈尔彭;C.田;K.潘特;P.卡尼瓦利
分类号 G06F17/18(2006.01)I;G01N33/48(2006.01)I;C12Q1/68(2006.01)I 主分类号 G06F17/18(2006.01)I
代理机构 北京市柳沈律师事务所 11105 代理人 张文辉
主权项 一种确定参考基因组与来自二倍体生物体的生物样本的样本基因组之间的一个或多个变异(variant)的方法,所述方法包括:接收所述样本基因组的读段(read)以及所述读段至所述参考基因组的映射(mapping),其中从来自所述生物样本的多个基因组片段的测序获得所述读段;辨识所述样本基因组的第一区域,所述第一区域具有包括相对于所述参考基因组中的对应区域的一个或多个变异的第一似然性,所述第一似然性在第一阈值之上;确定所述第一区域中的样本基因组的起始假设;基于所述起始假设,生成所述第一区域中的样本基因组的每个的一组假设,其中该组假设中的至少一个包括多个等位基因以及对应于所述多个等位基因的每个的相应等位基因分数;对于该组假设中的每个假设:使用概率函数为该假设计算概率得分,所述概率函数接收该假设的每个等位基因以及相应等位基因分数的输入,其中,该组假设中的第一假设包括具有在最小阈值分数与0.5之间的相应等位基因分数的第一等位基因;基于所述概率得分选择顶级假设(top hypothesis);基于所述顶级假设,为所述第一区域识别(call)所述参考基因组与所述样本基因组之间的一个或多个变异,其中,所述方法由一个或多个计算设备执行。
地址 美国加利福尼亚州