发明名称 氯丝菌素的生物合成基因簇及其应用
摘要 本发明涉及一种聚酮类抗生素-氯丝菌素的生物合成基因簇的克隆、分析、功能及其应用。整个基因簇共包含35个基因:1)6个聚酮合成酶基因chlA1,chlA2,chlA3,chlA4,chlA5,chlA6;2)6个2-甲氧基-5-氯-6-甲基-水扬酸合成酶基因chlB1,chlB2,chlB3,chlB4,chlB5,chlB6;3)7个脱氧糖生物合成基因chlC1,chlC2,chlC3,chlC4,chlC5,chlC6,chlC7;4)4个3-碳单位生物合成基因chlD1,chlD2,chlD3,chlD4;5)3个大环骨架后修饰基因chlE1,chlE2,chlE3;6)3个调节和抗性基因chlF1,chlF2,chlG;7)及6个功能不确定的基因chlH,chlI,chlJ,chlK,chlL,chlM。通过对上述生物合成基因的遗传改造可以得到氯丝菌素的结构类似物。本发明所提供的基因及其蛋白也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。
申请公布号 CN1730657A 申请公布日期 2006.02.08
申请号 CN200510027456.8 申请日期 2005.07.01
申请人 中国科学院上海有机化学研究所 发明人 刘文;唐功利;贾新颖
分类号 C12N15/31(2006.01);C12N15/52(2006.01);C12N9/00(2006.01) 主分类号 C12N15/31(2006.01)
代理机构 上海新天专利代理有限公司 代理人 邬震中
主权项 1.一种抗生素—氯丝菌素的生物合成基因簇,其编码氯丝菌素生物合成所涉及的35个基因,具体为:1)聚酮合成酶基因,即chlA1,chlA2,chlA3,chlA4,chlA5,chlA6共6个基因:chlA1位于基因簇核苷酸序列第31481-45580个碱基处,长度为14100个碱基对,编码聚酮合成酶,4699个氨基酸;chlA2位于基因簇核苷酸序列第45580-57447个碱基处,长度为11868个碱基对,编码聚酮合成酶,3955个氨基酸;chlA3位于基因簇核苷酸序列第58888-76044个碱基处,长度为17157个碱基对,编码聚酮合成酶,5718个氨基酸;chlA4位于基因簇核苷酸序列第76074-81635个碱基处,长度为5562个碱基对,编码聚酮合成酶,1853个氨基酸;chlA5位于基因簇核苷酸序列第81667-93477个碱基处,长度为11811个碱基对,编码聚酮合成酶,3936个氨基酸;chlA6位于基因簇核苷酸序列第93554-98302个碱基处,长度为4749个碱基对,编码聚酮合成酶,1582个氨基酸;2)2-甲氧基-5-氯-6-甲基-水扬酸合成酶基因,即chlB1,chlB2,chlB3,chlB4,chlB5,chlB6共6个基因:chlB1位于基因簇核苷酸序列第10470-5200个碱基处,长度为5271个碱基对,编码重复使用的聚酮合成酶,1756个氨基酸;chlB2位于基因簇核苷酸序列第12179-11913个碱基处,长度为267个碱基对,编码独立存在的酰基载体蛋白,88个氨基酸;chlB3位于基因簇核苷酸序列第13289-12246个碱基处,长度为1044个碱基对,编码酮乙酰基-酰基载体蛋白合成酶/缩合酶,347个氨基酸;chlB4位于基因簇核苷酸序列第11893-10544个碱基处,长度为1350个碱基对,编码卤化酶,449个氨基酸;chlB5位于基因簇核苷酸序列第13782-14498个碱基处,长度为717个碱基对,编码氧-甲基转移酶,238个氨基酸;chlB6位于基因簇核苷酸序列第14736-15794个碱基处,长度为1059个碱基对,编码酮乙酰基-酰基载体蛋白合成酶/缩合酶,352个氨基酸;3)氯丝菌素脱氧糖的生物合成基因,即chlC1,chlC2,chlC3,chlC4,chlC5,chlC6,chlC7共7个基因:chlC1位于基因簇核苷酸序列第28145-27078个碱基处,长度为1068个碱基对,编码dNDP-D-葡萄糖合成酶,355个氨基酸;chlC2位于基因簇核苷酸序列第27064-26081个碱基处,长度为984个碱基对,编码dNDP-D-葡萄糖-4,6-脱水酶,327个氨基酸;chlC3位于基因簇核苷酸序列第19014-17698个碱基处,长度为1317个碱基对,编码2,3-脱水酶,438个氨基酸;chlC4位于基因簇核苷酸序列第17666-16671个碱基处,长度为996个碱基对,编码3-酮基还原酶,331个氨基酸;chlC5位于基因簇核苷酸序列第16608-15865个碱基处,长度为744个碱基对,编码4-酮基还原酶,247个氨基酸;chlC6位于基因簇核苷酸序列第29477-28263个碱基处,长度为1215个碱基对,编码糖基转移酶,404个氨基酸;chlC7位于基因簇核苷酸序列第5169-3934个碱基处,长度为1236个碱基对,编码糖基转移酶,411个氨基酸;4)氯丝菌素3-碳单位(3-C)的生物合成基因,即chlD1,chlD2,chlD3,chlD4共4个基因:chlD1位于基因簇核苷酸序列第101743-103698个碱基处,长度为1956个碱基对,编码甲氧基-丙二酰基载体蛋白合成酶,651个氨基酸;chlD2位于基因簇核苷酸序列第103695-103922个碱基处,长度为228个碱基对,编码独立存在的酰基载体蛋白,75个氨基酸;chlD3位于基因簇核苷酸序列第103919-104734个碱基处,长度为816个碱基对,编码丙酮酸/2-氧代戊二酸脱氢酶,271个氨基酸;chlD4位于基因簇核苷酸序列第104713-105801个碱基处,长度为1089个碱基对,编码水解酶/乙酰基转移酶,362个氨基酸。5)氯丝菌素大环骨架的后修饰基因,即chlE1,chlE2,chlE3共3个基因:chlE1位于基因簇核苷酸序列第29807-31357个碱基处,长度为1551个碱基对,编码黄素依赖的氧化酶,516个氨基酸;chlE2位于基因簇核苷酸序列第57522-58718个碱基处,长度为1197个碱基对,编码细胞色素P-450氧化酶,398个氨基酸;chlE3位于基因簇核苷酸序列第98302-99798个碱基处,长度为1497个碱基对,编码黄素依赖的氧化酶,498个氨基酸;6)氯丝菌素的调节和抗性基因,即chlF1,chlF2,chlG共3个基因:chlF1位于基因簇核苷酸序列第21139-21747个碱基处,长度为609个碱基对,编码TetR家族转录调节因子,202个氨基酸;chlF2位于基因簇核苷酸序列第24370-23585个碱基处,长度为786对,编码双组份反馈调节因子,261个氨基酸;chlG位于基因簇核苷酸序列第21904-23370个碱基处,长度为1467个碱基对,编码泵蛋白,488个氨基酸;7)还包括6个功能不明确的基因,即chlH,chlI,chlJ,chlK,chlL,chlM:chlH位于基因簇核苷酸序列第13750-13337个碱基处,长度为414个碱基对,编码未知功能蛋白,137个氨基酸;chlI位于基因簇核苷酸序列第19374-19162个碱基处,长度为213个碱基对,编码羰基转移酶的藕联蛋白,70个氨基酸;chlJ位于基因簇核苷酸序列第21002-19395个碱基处,长度为1608个碱基对,编码羰基转移酶,535个氨基酸;chlK位于基因簇核苷酸序列第25179-24379个碱基处,长度为801个碱基对,编码II型硫酯酶,266个氨基酸;chlL位于基因簇核苷酸序列第10044-99866个碱基处,长度为576个碱基对,编码核糖体蛋白L15P,191个氨基酸;chlM位于基因簇核苷酸序列第100612-101739个碱基处,长度为1128个碱基对,编码3-氧乙酰基载体蛋白合成酶III,375个氨基酸。
地址 200032上海市徐汇区枫林路354号