发明名称 |
DNA序列的快速并且安全的检索 |
摘要 |
从序列索引检索序列模型。所述序列模型对被存储在数据库中的DNA或RNA序列进行建模,并且每个均包括有限内存树源模型和针对所述有限内存树源模型的参数。基于所检索的序列模型到查询DNA或RNA序列的拟合,来将被存储在所述数据库中的一个或多个DNA或RNA序列识别为最相似于所述查询DNA或RNA序列。所述序列模型可以为上下文树加权(CTW)模型<img file="DDA0000854470370000013.GIF" wi="216" he="83" />其中,S<sub>x</sub>指代针对被存储在所述数据库中的所述DNA或RNA序列x的所述上下文树模型,并且<img file="DDA0000854470370000014.GIF" wi="76" he="66" />指代所述上下文树模型S<sub>x</sub>的参数。针对每个CTW模型<img file="DDA0000854470370000012.GIF" wi="210" he="83" />所述拟合能够包括使用所述CTW模型<img file="DDA0000854470370000011.GIF" wi="187" he="83" />来计算针对所述查询DNA或RNA序列y的代码字长度。 |
申请公布号 |
CN105229651A |
申请公布日期 |
2016.01.06 |
申请号 |
CN201480029612.1 |
申请日期 |
2014.04.30 |
申请人 |
皇家飞利浦有限公司 |
发明人 |
T·伊格纳坚科 |
分类号 |
G06F19/22(2006.01)I;G06F19/28(2006.01)I |
主分类号 |
G06F19/22(2006.01)I |
代理机构 |
永新专利商标代理有限公司 72002 |
代理人 |
李光颖;王英 |
主权项 |
一种非暂态存储介质,其存储能够由电子数据处理设备(30)运行的指令,以执行包括以下的方法:生成序列索引(20),所述序列索引包括针对被存储在数据库(28)中的脱氧核糖核酸(DNA)或核糖核酸(RNA)序列的序列模型,所述生成包括计算作为有限内存树源模型的针对被存储在所述数据库中的每个DNA或RNA序列的所述序列模型和针对所述有限内存树源模型的参数;并且基于所述序列模型到查询DNA或RNA序列(40)的拟合,来将被存储在所述数据库中的一个或多个DNA或RNA序列识别为最相似于所述查询DNA或RNA序列。 |
地址 |
荷兰艾恩德霍芬 |