发明名称 合成基因设计的计算方法
摘要 本发明是针对用于设计对感兴趣的多肽进行编码的合成的核苷酸序列的方法。这些方法涉及将序列的数据库组织为N-长度的寡聚体序列的集合并且汇编了针对每个N-长度序列的概率得分的列表。使用这些概率得分将一个或多个更高得分的序列替换进入该亲本核苷酸序列之中以生成优化的序列。通过去除无意的可读框或不令人希望的短DNA元件之一或两者、和/或取代寡聚体序列以达到特定的G:C含量可以进一步优化所感兴趣的核苷酸序列。这些方法可以在任何生物中、特别是植物中用于优化异源基因的表达。该方法生成了合成序列,其组成类似于目标数据库的组成。例如,这些合成的序列可以用于在生物中、特别是在植物或植物细胞中调节杀虫活性或除草剂耐受性。
申请公布号 CN101821744B 申请公布日期 2013.05.22
申请号 CN200880110786.5 申请日期 2008.10.09
申请人 阿森尼克斯公司 发明人 D·J·汤姆索
分类号 G06F19/22(2011.01)I 主分类号 G06F19/22(2011.01)I
代理机构 北京市中咨律师事务所 11247 代理人 黄革生;林柏楠
主权项 一种为在目标生物体中表达而优化核苷酸序列的方法,包括a)提供一个待优化的核苷酸序列;b)提供由多个核苷酸序列组成的目标数据库,其中该数据库对于目标生物体中的属是特定的;c)汇编给定长度N的所有可能的N长度核苷酸序列(NLS)的列表,其中N小于在该数据库中最短的核苷酸序列的长度,并且其中对于每个NLS而言N是常数;d)对于在步骤(b)中提供的数据库,为在步骤(c)中的每个NLS计算概率得分以生成NLS统计表,其中所述概率得分代表每一NLS相对于在目标数据库中期望发生频率的观测频率;e)将该待优化的核苷酸序列的一个或多个N长度的区域(NLR)确定为相应的一个NLS集合,该NLS集合不改变该待优化的核苷酸序列编码的氨基酸序列,其中不改变由该待优化的核苷酸序列编码的氨基酸序列的NLS被认为是沉默的NLS(SNLS);并且,f)用具有最大delta得分的相应SNLS来取代在该待优化的核苷酸序列中的一个或多个NLR以生成优化的序列,其中delta得分表示待优化的核苷酸序列的NLR初始序列与每一对应SNLS之间概率得分的差异。
地址 美国北卡罗来纳州