发明名称 |
コンパクトな次世代シーケンシングデータセット及び該データセットを使用した効率的な配列の処理 |
摘要 |
組織試料を処理することによって取得された塩基配列を含む遺伝子配列決定リードに効力をもたらす方法において、遺伝子配列決定リードのコンパクトなテキスト表現が生成される。コンパクトなテキスト表現は、(1)塩基の配列を表すテキスト列、及び、(2)前記塩基配列のうち最長部分列を同定する塩基クオリティテキストフィールドであり、前記部分列の塩基の塩基クオリティスコアが塩基クオリティスコアの閾値を満たす、塩基クオリティテキストフィールドを含む。当該方法は、前記遺伝子配列決定リードのコンパクトなテキスト表現を、生リードストレージ内に記憶するステップも含む。融通性を提供するために、塩基クオリティテキストフィールドは、2つ以上の異なる塩基クオリティスコアの閾値のそれぞれに対する最長部分列を同定してもよい。リードアラインメントの間、遺伝子配列決定リードに対するオフセット境界を、塩基クオリティテキストフィールドの内容を使用して効率的に選ぶことができる。 |
申请公布号 |
JP2015515042(A) |
申请公布日期 |
2015.05.21 |
申请号 |
JP20140558264 |
申请日期 |
2013.02.26 |
申请人 |
コーニンクレッカ フィリップス エヌ ヴェ |
发明人 |
クマル,スボード;シン,ランディープ;チャクラバルティ,ビスワループ;クマル,スニル |
分类号 |
G06F19/22;C12M1/00;C12N15/00;C12Q1/68 |
主分类号 |
G06F19/22 |
代理机构 |
|
代理人 |
|
主权项 |
|
地址 |
|