发明名称 |
鉴定病毒的方法和装置 |
摘要 |
本发明公开了一种鉴定病毒的方法,该方法包括:获取待测样本的RNA测序数据;对测序数据的第一部分进行组装,获得组装序列;将测序数据的第一部分与组装序列进行比对,获得比对结果;基于比对结果,确定组装序列上的突变位点,以及确定各组装序列的(a)‑(c)中的至少之一:(a)平均熵值和中位数熵值至少之一,以及突变位点比例,(b)平均突变率和中位数突变率至少之一,以及突变位点比例,(c)突变位点比例;将组装序列的(a)‑(c)至少之一和与其对应的界限比较,判定落入界限的组装序列来自病毒。本发明还公开一种鉴定病毒的装置。利用本发明的方法和/或装置鉴定病毒,能够不依赖同源序列比对来准确预测未知序列是否为病毒序列。 |
申请公布号 |
CN106033502A |
申请公布日期 |
2016.10.19 |
申请号 |
CN201510125249.X |
申请日期 |
2015.03.20 |
申请人 |
深圳华大基因股份有限公司 |
发明人 |
麻锦敏;王珲 |
分类号 |
G06F19/22(2011.01)I;C12Q1/70(2006.01)I;C12Q1/68(2006.01)I;C12M1/34(2006.01)I |
主分类号 |
G06F19/22(2011.01)I |
代理机构 |
北京清亦华知识产权代理事务所(普通合伙) 11201 |
代理人 |
李志东 |
主权项 |
一种病毒鉴定方法,其特征在于,包括,获取待测样本的RNA测序数据,所述测序数据包括多个读段;对所述测序数据的第一部分进行组装,获得组装序列,所述测序数据的第一部分包括不能比对上ncRNA参考序列的读段;将所述测序数据的第一部分与所述组装序列进行比对,获得比对结果;基于所述比对结果,确定所述组装序列上的突变位点,所述突变位点包括SNV,以及确定各条组装序列的(a)‑(c)中的至少之一,(a)平均熵值和中位数熵值至少之一,以及突变位点比例,(b)平均突变率和中位数突变率至少之一,以及突变位点比例,(c)突变位点比例,一条组装序列的平均熵值为其上的SNV的熵值的平均值,一条组装序列的中位数熵值为其上的SNV的熵值的中位数,一条组装序列的平均突变率为其上的SNV的突变率的平均值,一条组装序列的中位数突变率为其上的SNV的突变率的中位数,一条组装序列的突变位点比例为其上的SNV的数目所占的比例,SNV的熵值=‑100*∑(Pi*logPi),Pi为该SNV的各种碱基的深度,SNV的突变率=支持该SNV的读段数目/比对上该SNV的读段数目,将所述确定的组装序列的(a)‑(c)至少之一和与其对应的界限比较,判定落入所述界限的组装序列来自病毒。 |
地址 |
518083 广东省深圳市盐田区洪安三街21号华大综合园7栋7层-14层 |