发明名称 CPSARST-高效能蛋白质环形序列重组搜寻比对工具
摘要
申请公布号 TWI356103 申请公布日期 2012.01.11
申请号 TW097127490 申请日期 2008.07.18
申请人 国立清华大学 发明人 吕平江;罗惟正
分类号 C40B10/00 主分类号 C40B10/00
代理机构 代理人
主权项 一种侦测环形序列重组之方法,其包括下列步骤:(a)执行拉马铨德朗氏转换法得到第一个拉马铨德朗氏码结构字串,其中该字串包含单倍(normal length,NL)的蛋白质结构资讯,其长度约略等同于蛋白质内的胺基酸数量;(b)重复步骤(a)之第一个拉马铨德朗氏码结构字串得到第二个拉马铨德朗氏码结构字串,其中该字串包含双倍(duplicated length,DL)的蛋白质结构资讯,其长度为第一个拉马铨德朗氏码结构字串之两倍;(c)将第一个及第二个拉马铨德朗氏码结构字串分别与一已知字串进行比对,以取得一相似度计分数值及E值数值,其中第一个拉马铨德朗氏码结构字串经比对所得之相似度计分数值为相似度计分NL,E值数值为E值NL,其中第二个拉马铨德朗氏码结构字串经比对所得之相似度计分数值为相似度计分DL,E值数值为E值DL;以及(d)当相似度计分DL/相似度计分NL>1,以及-log10(E值DL/E值NL)>-0.5时,即为环形序列重组情形之产生。如申请专利范围第1项之方法,其中该已知字串为一拉马铨德朗氏码结构字串。如申请专利范围第1项之方法,其中该相似度计分数值及E值数值系透过BLAST转换法进行计算所取得。如申请专利范围第1项之方法,可进一步找出序列重组的位置,其方法包括:(i)当环形序列重组发生时第二个拉马铨德朗氏码结构字串与已知字串比对后出现一最佳区间;以及(ii)重组的位置为q1-s1+1。如申请专利范围第4项之方法,其中最佳区间介于第二个拉马铨德朗氏码结构字串的q1及q2区间。如申请专利范围第4项之方法,其中最佳区间介于已知字串的s1至s2区间。
地址 新竹市光复路2段101号