发明名称 鉴定病毒的方法和装置
摘要 本发明公开了一种鉴定病毒的方法,该方法包括:获取待测样本的RNA测序数据;对测序数据的第一部分进行组装,获得组装序列;将测序数据的第一部分与组装序列进行比对,获得比对结果;基于比对结果,确定组装序列上的突变位点,以及确定各组装序列的(a)‑(c)中的至少之一:(a)平均熵值和中位数熵值至少之一,以及突变位点比例,(b)平均突变率和中位数突变率至少之一,以及突变位点比例,(c)突变位点比例;将组装序列的(a)‑(c)至少之一和与其对应的界限比较,判定落入界限的组装序列来自病毒。本发明还公开一种鉴定病毒的装置。利用本发明的方法和/或装置鉴定病毒,能够不依赖同源序列比对来准确预测未知序列是否为病毒序列。
申请公布号 CN106033502A 申请公布日期 2016.10.19
申请号 CN201510125249.X 申请日期 2015.03.20
申请人 深圳华大基因股份有限公司 发明人 麻锦敏;王珲
分类号 G06F19/22(2011.01)I;C12Q1/70(2006.01)I;C12Q1/68(2006.01)I;C12M1/34(2006.01)I 主分类号 G06F19/22(2011.01)I
代理机构 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人 李志东
主权项 一种病毒鉴定方法,其特征在于,包括,获取待测样本的RNA测序数据,所述测序数据包括多个读段;对所述测序数据的第一部分进行组装,获得组装序列,所述测序数据的第一部分包括不能比对上ncRNA参考序列的读段;将所述测序数据的第一部分与所述组装序列进行比对,获得比对结果;基于所述比对结果,确定所述组装序列上的突变位点,所述突变位点包括SNV,以及确定各条组装序列的(a)‑(c)中的至少之一,(a)平均熵值和中位数熵值至少之一,以及突变位点比例,(b)平均突变率和中位数突变率至少之一,以及突变位点比例,(c)突变位点比例,一条组装序列的平均熵值为其上的SNV的熵值的平均值,一条组装序列的中位数熵值为其上的SNV的熵值的中位数,一条组装序列的平均突变率为其上的SNV的突变率的平均值,一条组装序列的中位数突变率为其上的SNV的突变率的中位数,一条组装序列的突变位点比例为其上的SNV的数目所占的比例,SNV的熵值=‑100*∑(Pi*logPi),Pi为该SNV的各种碱基的深度,SNV的突变率=支持该SNV的读段数目/比对上该SNV的读段数目,将所述确定的组装序列的(a)‑(c)至少之一和与其对应的界限比较,判定落入所述界限的组装序列来自病毒。
地址 518083 广东省深圳市盐田区洪安三街21号华大综合园7栋7层-14层