发明名称 从二个资料序列搜寻一对片段的方法、系统以及程式
摘要 本发明提供一种从二资料序列中搜寻一对相似片段的新颖方法、系统以及电脑程式,特别是提供一种从二生物性序列搜寻一对片段的方法,例如,核酸序列以及胺基酸序列。首先,从二资料序列中选出一对具有特定资料排列的片段。接着同方向延伸出下一对片段,若是新片段对的资料排列满足使用者所定义的条件,则继续进行下一对片段的延伸;若是此资料排列不满足上述定义的条件,则藉由间隔的插入,使片段间进行匹配化。在插入间隔之后,若是片段间的资料排列可满足使用者定义的条件,则继续进行下一次的延伸步骤;否则便终止延伸步骤,而得到产生的片段。
申请公布号 TW539983 申请公布日期 2003.07.01
申请号 TW090126496 申请日期 2001.10.26
申请人 财团法人工业技术研究院 发明人 姚文萱
分类号 G06F19/00 主分类号 G06F19/00
代理机构 代理人
主权项 1.一种从二资料序列(X序列和Y序列)搜寻一对片段(Fx和Fy)的方法、使Fx和Fy之样式要满足一预定要件,该方法包含以下步骤:(1.1)选择X序列的第一片段Fx1和Y序列的第一片段Fy1,使Fx1和Fy1之样式p1要满足一预定条件c1;(1.2)从Fx1延伸出另一片段Fx2,而Fy1也从同方向延伸出一片段Fy2;(1.3)确认Fx2和Fy2之样式p2;以及(1.4)基于p2,由一预定的方式得到一对片段Fx和Fy。2.如申请专利范围第1项所述之方法,其中该预定方式包含以下步骤:(2.1)判断p2是否满足一预定条件c2;(2.1.1)若p2满足c2,则从Fx2延伸出另一片段Fx3,而Fy2也从同方向延伸出一片段Fy3;以及(2.1.2)若p2不满足c2,则使Fx2和Fy2进行匹配化。3.如申请专利范围第2项所述之方法,其中步骤(2.1.1)系包含下列步骤:(3.1)确认Fx3和Fy3之样式p3;(3.2)判断p3是否满足一预定条件c3;以及(3.3)若p3满足c3,则得到一对片段Fx和Fy,其中Fx包括Fx1.Fx2和Fx3,而Fy包括Fy1.Fy2和Fy3。4.如申请专利范围第2项所述之方法,其中Fx2和Fy2匹配化的步骤(2.1.2)系包含下列步骤:(4.1)在Fx2和Fy2中各自选择一子片段Fx2.1和Fy2.1,使Fx2.1和Fy2.1之子样式p2.1要满足预定子条件c2.1;(4.2)在Fx2.1和Fx1之间的区域内插入间隔,而排除Fx2部份的资料,藉此Fx2成为一更新片段Fx2',该更新片段Fx2'包括上述间隔,但不包括上述Fx2排除的资料部分;(4.3)确认Fx2'与Fy2之间更新的p2,以p2'表示之;(4.4)判断p2'是否满足一预定需求r;(4.4.1)若p2'满足r,则从Fx2'延伸出另一片段Fx3,而Fy2也从同方向延伸出一片段Fy3,其中Fx3包括部分的Fx2资料;以及(4.4.2)若p2'不满足r,则得到一对片段Fx和Fy,其中Fx包括Fx1和Fx2',而Fy包括Fy1和Fy2。5.如申请专利范围第4项所述之方法,其中步骤(4.4.1)系包含下列步骤:(5.1)确认Fx3和Fy3之样式p3;(5.2)判断p3是否满足一预定条件c3;以及(5.3)若p3满足c3,则得到一对片段Fx和Fy,其中Fx包括Fx1.Fx2'和Fx3,而Fy包括Fy1.Fy2和Fy3。6.一种从二生物性序列(X序列和Y序列)搜寻一对片段(Fx和Fy)的方法,使Fx和Fy之样式要满足一预定要件,该方法包含以下步骤:(6.1)选择X序列的第一片段Fx1和Y序列的第一片段Fy1,使Fx1和Fy1之样式p1要满足一预定条件c1;(6.2)从Fx1延伸出另一片段Fx2,而Fy1也从同方向延伸出一片段Fy2;(6.3)确认Fx2和Fy2之样式p2;以及(6.4)基于p2,由一预定的方式得到一对片段Fx和Fy。7.如申请专利范围第6项所述之方法,其中该预定方式包含以下步骤:(7.1)判断p2是否满足一预定条件c2;(7.1.1)若p2满足c2,则从Fx2延伸出另一片段Fx3,而Fy2也从同方向延伸出一片段Fy3;以及(7.1.2)若p2不满足c2,则使Fx2和Fy2进行匹配化。8.如申请专利范围第7项所述之方法,其中步骤(7.1.1)系包含下列步骤:(8.1)确认Fx3和Fy3之样式p3;(8.2)判断p3是否满足一预定条件c3;以及(8.3)若p3满足c3,则得到一对片段Fx和Fy,其中Fx包括Fx1.Fx2和Fx3,而Fy包括Fy1.Fy2和Fy3。9.如申请专利范围第7项所述之方法,其中使Fx2和Fy2匹配化的步骤(7.1.2)系包含下列步骤:(9.1)在Fx2和Fy2中自选择一子片段Fx2.1和Fy2.1,使Fx2.1和Fy2.1之子样式p2.1要满足预定子条件c2.1;(9.2)在Fx2.1和Fx1之间的区域内插入间隔,而排除Fx2部份的生物性资料,藉此Fx2成为一更新片段Fx2',该更新片段Fx2'包括上述间隔,但不包括上述Fx2排除的生物性资料部分;(9.3)确认Fx2'与Fy2之间更新的p2,以p2'表示之;(9.4)判断p2'是否满足一预定需求r;(9.4.1)若p2'满足r,则从Fx2'延伸出另一片段Fx3,而Fy2也从同方向延伸出一片段Fy3,其中Fx3包括部分的Fx2生物性资料;以及(9.4.2)若p2'不满足r,则得到一对片段Fx和Fy,其中Fx包括Fx1和Fx2',而Fy包括Fy1和Fy2。10.如申请专利范围第9项所述之方法,其中步骤(9.4.1)系包含下列步骤:(10.1)确认Fx3与Fy3之样式p3;(10.2)判断p3是否满足一预定条件c3;以及(10.3)若p3满足c3,则得到一对片段Fx和Fy,其中Fx包括Fx1.Fx2'和Fx3,而Fy包括Fy1.Fy2和Fy3。11.一种从二资料序列(X序列和Y序列)搜寻一对片段(Fx和Fy)的系统,使Fx和Fy要满足一预定要件,该系统包含:(11.1)选择X序列的第一片段Fx1和Y序列的第一片段Fy1,使Fx1和Fy1之样式p1要满足一预定条件c1的逻辑;(11.2)从Fx1延伸出另一片段Fx2,而Fy1也从同方向延伸出一片段Fy2的逻辑;(11.3)确认Fx2和Fy2之样式p2的逻辑;以及(11.4)基于p2,由一预定逻辑,而得到一对片段Fx和Fy的逻辑。12.如申请专利范围第11项所述之系统,其中该预定逻辑包含:(12.1)判断p2是否满足一预定条件c2的逻辑;(12.1.1)若p2满足条件c2,则从Fx2延伸出另一片段Fx3,而Fy2也从同方向延伸出一片段Fy3的逻辑;以及(12.1.2)若p2不满足c2,则使Fx2和Fy2进行匹配化。13.如申请专利范围第12项所述之系统,其中该逻辑(12.1.1)系包含:(13.1)确认Fx3和Fy3之样式p3的逻辑;(13.2)判断p3是否满足一预定条件c3的逻辑;以及(13.3)若p3满足c3,则得到一对片段Fx和Fy,其中Fx包括Fx1.Fx2和Fx3,而Fy包括Fy1.Fy2和Fy3。14.如申请专利范围第12项所述之系统,其中使Fx2和Fy2匹配化的逻辑(12.1.2)系包含:(14.1)在Fx2和Fy2中各自选择一子片段Fx2.1和Fy2.1,使Fx2.1和Fy2.1之子样式p2.1要满足预定子条件c2.1的逻辑;(14.2)在Fx2.1和Fx1之间的区域内插入间隔,而排除Fx2部分的资料,藉此Fx2成为一更新片段Fx2'的逻辑,该更新片段Fx2'包括上述间隔,但不包括上述Fx2排除的资料部分;(14.3)确认Fx2'和Fy2之间更新之p2,以p2'表示之逻辑;(14.4)判断p2'是否满足一预定需求r的逻辑;(14.4.1)若p2'满足r,则从Fx2'延伸出另一片段Fx3,而Fy2也从同方向延伸出一片段Fy3的逻辑,其中Fx3包括部分的Fx2资料;以及(14.4.2)若p2'不满足r,则得到一对片段Fx和Fy的逻辑,其中Fx包括Fx1和Fx2',而Fy包括Fy1和Fy2。15.如申请专利范围第14项所述之系统,其中逻辑(14.4.1)系包含:(15.1)确认Fx3和Fy3之样式p3的逻辑;(15.2)判断p3是否满足一预定条件c3的逻辑;以及(15.3)若p3满足c3,则得到一对片段Fx和Fy的逻辑,其中Fx包括Fx1.Fx2'和Fx3,而Fy包括Fy1.Fy2和Fy3。16.一种从二生物性序列(X序列和Y序列)搜寻一对片段(Fx和Fy)的系统,使Fx和Fy之样式要满足一预定要件,该系统包含:(16.1)选择X序列的第一片段Fx1和Y序列的第一片段Fy1,使Fx1和Fy1之样式p1要满足一预定条件c1的逻辑;(16.2)从Fx1延伸出另一片段Fx2,而Fy1也从同方向延伸出一片段Fy2的逻辑;(16.3)确认Fx2和Fy2之样式p2的逻辑;以及(16.4)基于p2,由一预定逻辑,而得到一对片段Fx和Fy的逻辑。17.如申请专利范围第16项所述之系统,其中该预定逻辑包含:(17.1)判断p2是否满足一预定条件c2的逻辑;(17.1.1)若p2满足条件c2,则从Fx2延伸出另一片段Fx3,而Fy2也从同方向延伸出一片段Fy3的逻辑;以及(17.1.2)若p2不满足c2,则使Fx2和Fy2进行匹配化。18.如申请专利范围第17项所述之系统,其中该逻辑(17.1.1)系包含:(18.1)确认Fx3和Fy3之样式p3的逻辑;(18.2)判断p3是否满足一预定条件c3的逻辑;以及(18.3)若p3满足c3,则得到一对片段Fx和Fy,其中Fx包括Fx1.Fx2和Fx3,而Fy包括Fy1.Fy2和Fy3。19.如申请专利范围第17项所述之系统,其中使Fx2和Fy2匹配化的逻辑(17.1.2)系包含:(19.1)在Fx2和Fy2中各自选择一子片段Fx2.1和Fy2.1,使Fx2.1和Fy2.1之子样式p2.1要满足预定子条件c2.1的逻辑;(19.2)在Fx2.1和Fx1之间的区域内插入间隔,而排除Fx2部分的生物性资料,藉此Fx2成为一更新片段Fx2'的逻辑,该更新片段Fx2'包括上述间隔,但不包括上述Fx2排除的生物性资料部分;(19.3)确认Fx2'和Fy2之间更斯之p2,以p2'表示之逻辑;(19.4)判断p2'是否满足一预定需求r的逻辑;(19.4.1)若p2'满足r,则从Fx2'延伸出另一片段Fx3,而Fy2也从同方向延伸出一片段Fy3的逻辑,其中Fx3包括部分的Fx2资料;以及(19.4.2)若p2'不满足r,则得到一对片段Fx和Fy的逻辑,其中Fx包括Fx1和Fx2',而Fy包括Fy1和Fy2。20.如申请专利范围第19项所述之系统,其中逻辑(19.4.1)系包含:(20.1)确认Fx3和Fy3之样式p3的逻辑;(20.2)判断p3是否满足一预定条件c3的逻辑;以及(20.3)若p3满足c3,则得到一对片段Fx和Fy的逻辑,其中Fx包括Fx1.Fx2'和Fx3,而Fy包括Fy1.Fy2和Fy3。21.一种电脑可读取记录媒体,载有一电脑程式,该电脑程式用以从二资料序列(X序列和Y序列)搜寻一对片段(Fx和Fy),使Fx和Fy之样式要满足一预定要件,该程式包含:(21.1)选择X序列的第一片段Fx1和Y序列的第一片段Fy1,使Fx1和Fy1之样式p1要满足一预定条件c1的程式码区段;(21.2)从Fx1延伸出另一片段Fx2,而Fy1也从同方向延伸出一片段Fy2的程式码区段;(21.3)确认Fx2和Fy2之样式p2的程式码区段;以及(21.4)基于p2,由一预定程式码区段,而得到一对片段Fx和Fy的程式码区段。22.如申请专利范围第21项所述之电脑可读取记录媒体,其中该预定程式码区段包含:(22.1)判断p2是否满足一预定条件c2的程式码区段;(22.1.1)若p2满足条件c2,则从Fx2延伸出另一片段Fx3,而Fy2也从同方向延伸出一片段Fy3的程式码区段;以及(22.1.2)若p2不满足c2,则使Fx2和Fy2进行匹配化。23.如申请专利范围第22项所述之电脑可读取记录媒体,其中该程式码区段(22.1.1)系包含:(23.1)确认Fx3和Fy3之样式p3的程式码区段;(23.2)判断p3是否满足一预定条件c3的程式码区段;以及(23.3)若p3满足c3,则得到一对片段Fx和Fy,其中Fx包括Fx1.Fx2和Fx3,而Fy包括Fy1.Fy2和Fy3。24.如申请专利范围第22项所述之电脑可读取记录媒体,其中使Fx2和Fy2匹配化的程式码区段(22.1.2)系包含:(24.1)在Fx2和Fy2中各自选择一子片段Fx2.1和Fy2.1,使Fx2.1和Fy2.1之子样式p2.1要满足预定子条件c2.1的程式码区段;(24.2)在Fx2.1和Fx1之间的区域内插入间隔,而排除Fx2部分的资料,藉此Fx2成为一更新片段Fx2'的程式码区段,该更新片段Fx2'包括上述间隔,但不包括上述Fx2排除的资料部分;(24.3)确认Fx2'和Fy2之间更新之p2,以p2'表示之程式码区段;(24.4)判断p2'是否满足一预定需求r的程式码区段;(24.4.1)若p2'满足r,则从Fx2'延伸出另一片段Fx3,而Fy2也从同方向延伸出一片段Fy3的程式码区段,其中Fx3包括部分的Fx2资料;以及(24.4.2)若p2'不满足r,则得到一对片段Fx和Fy的程式码区段,其中Fx包括Fx1和Fx2',而Fy包括Fy1和Fy2。25.如申请专利范围第24项所述之电脑可读取记录媒体,其中程式码区段(24.4.1)包括:(25.1)确认Fx3和Fy3之样式p3的程式码区段;(25.2)判断p3是否满足一预定条件c3的程式码区段;以及(25.3)若p3满足c3,则得到一对片段Fx和Fy的程式码区段,其中Fx包括Fx1.Fx2'和Fx3,而Fy包括Fy1.Fy2和Fy3。26.一种电脑可读取记录媒体,载有一电脑程式,该电脑程式用以从二生物性序列(X序列和Y序列)搜寻一对片段(Fx和Fy),使Fx和Fy之样式要满足一预定要件,该程式包含:(26.1)选择X序列的第一片段Fx1和Y序列的第一片段Fy1,使Fx1和Fy1之样式p1要满足一预定条件c1的程式码区段;(26.2)从Fx1延伸出另一片段Fx2,而Fy1也从同方向延伸出一片段Fy2的程式码区段;(26.3)确认Fx2和Fy2之样式p2的程式码区段;以及(26.4)基于p2,由一预定程式码区段,而得到一对片段Fx和Fy的程式码区段。27.如申请专利范围第26项所述之电脑可读取记录媒体其中该预定程式码区段包含:(27.1)判断p2是否满足一预定条件c2的程式码区段;(27.1.1)若p2满足条件c2,则从Fx2延伸出另一片段Fx3,而Fy2也从同方向延伸出一片段Fy3的程式码区段;以及(27.1.2)若p2不满足c2,则使Fx2和Fy2进行匹配化。28.如申请专利范围第27项所述之电脑可读取记录媒体,其中该程式码区段(27.1.1)系包含:(28.1)确认Fx3和Fy3之样式p3的程式码区段;(28.2)判断p3是否满足一预定条件c3的程式码区段;以及(28.3)若p3满足c3,则得到一对片段Fx和Fy,其中Fx包括Fx1.Fx2和Fx3,而Fy包括Fy1.Fy2和Fy3。29.如申请专利范围第27项所述之电脑可读取记录媒体,其中使Fx2和Fy2匹配化的程式码区段(27.1.2)系包含:(29.1)在Fx2和Fy2中各自选择一子片段Fx2.1和Fy2.1,使Fx2.1和Fy2.1之子样式p2.1要满足预定子条件c2.1的程式码区段;(29.2)在Fx2.1和Fx1之间的区域内插入间隔,而排除Fx2部分的生物性资料,藉此Fx2成为一更新片段Fx2'的程式码区段,该更新片段Fx2'包括上述间隔,但不包括上述Fx2排除的生物性资料部分;(29.3)确认Fx2'和Fy2之间更新之p2,以p2'表示之程式码区段;(29.4)判断p2'是否满足一预定需求r的程式码区段;(29.4.1)若p2'满足r,则从Fx2'延伸出另一片段Fx3,而Fy2也从同方向延伸出一片段Fy3的程式码区段,其中Fx3包括部分的Fx2资料;以及(29.4.2)若p2'不满足r,则得到一对片段Fx和Fy的程式码区段,其中Fx包括Fx1和Fx2',而Fy包括Fy1和Fy2。30.如申请专利范围第29项所述之电脑可读取记录媒体,其中程式码区段(19.4.1)包括:(30.1)确认Fx3和Fy3之样式p3的程式码区段;(30.2)判断p3是否满足一预定条件c3的程式码区段;以及(30.3)若p3满足c3,则得到一对片段Fx和Fy的程式码区段,其中Fx包括Fx1.Fx2'和xX3,而Fy包括Fy1.Fy2和Fy3。图式简单说明:图1为本发明架构的流程图;图2A为本发明之较佳具体实施例的流程图;图2B为图2A之步骤216的详细说明;图3为包含图3A、图3B、图3C、图3D及图3E之本发明最佳具体实施例的流程图;以及图4为显示每次资料库搜寻结果的伪阳性与灵敏度间的关系图。
地址 新竹县竹东镇中兴路四段一九五号