发明名称 一种基因序列测定结果质量的简化评定方法
摘要 本发明涉及一种基因序列测定结果质量的简化评定方法,可用于评价基于双脱氧原理基因测序方法或程序的测序质量。一种基因序列测定结果质量的简化评定方法。在评价某种基于双脱氧原理基因测序方法或程序的测序质量时,首次提出了5种用于测序质量比较的评价参数。本发明提供的基因序列测定结果质量的简化评定方法,可完整、全面系统、准确地评价基于双脱氧测序技术测序方法或程序的单次或成组样品的测序质量。本发明提供的基因序列测定结果质量的简化评定方法,填补了序列测定结果质量评定方法的空白。提供的基因序列测定结果质量的简化评定方法,对于促进研究机构及检测机构改良传统的双脱氧测序技术,在基层实验室推广基因测序法成为可能。
申请公布号 CN105718758A 申请公布日期 2016.06.29
申请号 CN201510217873.2 申请日期 2015.04.30
申请人 汕头国际旅行卫生保健中心 发明人 蔡颖;周广彪;魏锐;朱俊贤;黄琦容;王立忠;林楚炎;吴烽;陈霖祥;林昆
分类号 G06F19/20(2011.01)I 主分类号 G06F19/20(2011.01)I
代理机构 代理人
主权项 一种基因序列测定结果质量的简化评定方法,在评价某种基于双脱氧原理基因测序方法或程序的测序质量时,首次提出了5种用于测序质量比较的评价参数,包括PLQ(Percentage of Low QVs)、PHQ(Percentage of High QVs)、CCS(Complex Comparison Score)、CIS(Complex Individual score)、CIS‑L(Complex individual score, including LOR),PLQ、PHQ一般用于测序质量的成组比较,CCS用于单个样品测序质量的两两比较,CIS、CIS‑L用于单个样品测序质量的综合评价,当测序样品的预期读长未知时,使用CIS进行评价,当测序样品的预期读长已知时,使用CIS‑L进行评价;具体计算方法为:设:A<sub>LOR</sub>=某样品A方法测序的LOR,B<sub>LOR</sub>=某样品B方法测序的LORA<sub>PLQ</sub>=某样品A方法测序的PLQ,B<sub>PLQ</sub>=某样品B方法测序的PLQA<sub>PHQ</sub>=某样品A方法测序的PHQ,B<sub>PHQ</sub>=某样品B方法测序的PHQA<sub>SS</sub>=某样品A方法测序的SS,B<sub>SS</sub>=某样品B方法测序的SSLOR<sub>P</sub>=某样品的预计读长则:PLQ=(Low QV/LOR)×100%PHQ=(High QV/LOR)×100%CCS=(A<sub>LOR</sub>/B<sub>LOR</sub>)‑(A<sub>PLQ</sub>‑B<sub>PLQ</sub>)+(A<sub>PHQ</sub>‑B<sub>PHQ</sub>)+(A<sub>SS</sub>‑B<sub>SS</sub>)/50CIS=(A<sub>PHQ</sub>‑A<sub>PLQ</sub>)×0.7+A<sub>SS</sub>/50×0.3CIS‑L=(LOR/LOR<sub>P</sub>)×0.5+(A<sub>PHQ</sub>‑A<sub>PLQ</sub>)×0.4+(A<sub>SS</sub>/50)×0.1基于上述目的,本发明采用以下具体实施方案:分析测序谱图的所有关键特征,发现测序仪自动生成的反映测序质量的参数有4个:LOR、低质量碱基数量Low QV、高质量碱基数量High QV、样品得分SS;不能完整、系统地反映整个序列的测序质量;因此,以这4个参数为基础,使用比例法、加权法等创造了5个新的自定义参数:PLQ、PHQ、CCS、CIS、CIS‑L;PLQ、PHQ一般用于测序质量的成组比较,CCS用于单个样品测序质量的两两比较,CIS、CIS‑L用于单个样品测序质量的综合评价,当测序样品的预期读长未知时,使用CIS进行评价,当测序样品的预期读长已知时,使用CIS‑L进行评价;基于本发明建立的一种基因序列测定结果质量的简化评定方法,按下列步骤进行:1)基因测序后获得测序谱图和测序仪自动生成的4个参数采用双脱氧测序技术进行基因测序后获得测序谱图,可同时读取LOR、Low QV、High QV、SS的值;2)计算5个新的自定义参数PLQ、PHQ、CCS、CIS、CIS‑L;设:A<sub>LOR</sub>=某样品A方法测序的LOR,B<sub>LOR</sub>=某样品B方法测序的LORA<sub>PLQ</sub>=某样品A方法测序的PLQ,B<sub>PLQ</sub>=某样品B方法测序的PLQA<sub>PHQ</sub>=某样品A方法测序的PHQ,B<sub>PHQ</sub>=某样品B方法测序的PHQA<sub>SS</sub>=某样品A方法测序的SS,B<sub>SS</sub>=某样品B方法测序的SSLOR<sub>P</sub>=某样品的预计读长则:PLQ=(Low QV/LOR)×100%PHQ=(High QV/LOR)×100%CCS=(A<sub>LOR</sub>/B<sub>LOR</sub>)‑(A<sub>PLQ</sub>‑B<sub>PLQ</sub>)+(A<sub>PHQ</sub>‑B<sub>PHQ</sub>)+(A<sub>SS</sub>‑B<sub>SS</sub>)/50CIS=(A<sub>PHQ</sub>‑A<sub>PLQ</sub>)×0.7+A<sub>SS</sub>/50×0.3CIS‑L=(LOR/LOR<sub>P</sub>)×0.5+(A<sub>PHQ</sub>‑A<sub>PLQ</sub>)×0.4+(A<sub>SS</sub>/50)×0.13)测序质量效果评价A. 当通过两种或以上方法的比较进行测序质量评价时,可通过t检验、方差分析等比较4个机器参数和这5个自定义参数,以统计学方法判断两种或以上方法的测序质量是否存在差别;B. 当单独评价某个样品的某次测序结果质量时,可通过CCS、CIS‑L、CIS这3个参数值来判断测序质量的好坏;其中,当测序样品的预期读长未知时,使用CIS进行评价,当测序样品的预期读长已知时,使用CIS‑L进行评价;当CCS、CIS‑L、CIS分别大于0.9、0.8、0.7时认为测序质量好,数值越大,测序质量越好。
地址 515041 广东省汕头市龙湖区丹霞庄东区1栋