发明名称 番红霉素的生物合成基因簇
摘要 本发明是四氢异喹啉生物碱家族中一种链霉菌产生的具有抗肿瘤活性的抗生素——番红霉素的生物合成基因簇的克隆、测序、分析、功能研究及其应用。整个基因簇共包含30个基因:3个非核糖体聚肽合成酶基因、4个前体分子3-羟基-5-甲基-O-甲基-酪氨酸合成基因、2个肽骨架环合酶基因、7个番红霉素的修饰基因、5个与S-腺苷化甲硫氨酸合成相关基因、3个调节基因、2个抗性基因和4个功能不确定的基因。通过对上述生物合成基因的遗传操作可阻断番红霉素的合成,可使其产量发生改变;还可得到番红霉素的结构类似物。该基因簇可用于四氢异喹啉生物碱家族化合物的基因工程、蛋白表达、酶催化反应等,也可用于寻找和发现用于医药、工业或农业的化合物或基因。
申请公布号 CN101157929A 申请公布日期 2008.04.09
申请号 CN200710037087.X 申请日期 2007.02.02
申请人 中国科学院上海有机化学研究所 发明人 唐功利;刘文;李磊
分类号 C12N15/31(2006.01);C12N15/52(2006.01);C12N9/00(2006.01);C12P17/18(2006.01) 主分类号 C12N15/31(2006.01)
代理机构 上海新天专利代理有限公司 代理人 邬震中
主权项 1.一种抗肿瘤活性的抗生素-番红霉素(Saframycin)的生物合成基因簇,其特征在于编码番红霉素生物合成所涉及的30个基因,具体为:1)非核糖体聚肽合成酶基因,即sfmA,sfmB,sfmC共3个基因:sfmA位于基因簇核苷酸序列第16971-22481个碱基处,长度为5511个碱基对,编码非核糖体聚肽合成酶,1836个氨基酸;sfmB位于基因簇核苷酸序列第22618-25866个碱基处,长度为3249个碱基对,编码非核糖体聚肽合成酶,1082个氨基酸;sfmC位于基因簇核苷酸序列第25863-30320个碱基处,长度为4458个碱基对,编码非核糖体聚肽合成酶,1485个氨基酸;2)前体分子3-羟基-5-甲基-O-甲基-酪氨酸的生物合成基因,即sfmO5,sfmM2,sfmM3,sfmD共4个基因:sfmO5位于基因簇核苷酸序列第37069-35900个碱基处,长度为1170个碱基对,编码预苯酸脱氢酶,389个氨基酸;sfmM2位于基因簇核苷酸序列第34031-35131个碱基处,长度为1101个碱基对,编码甲基化酶,366个氨基酸;sfmM3位于基因簇核苷酸序列第46245-45241个碱基处,长度为1005个碱基对,编码甲基化酶,334个氨基酸;sfmD位于基因簇核苷酸序列第30317-31414个碱基处,长度为1098个碱基对,编码5-甲基-O-甲基-酪氨酸-3-羟化酶,365个氨基酸;3)肽骨架环合酶基因,即sfmcy1,sfmCy2共2个基因:sfmCy1位于基因簇核苷酸序列第3166-4704个碱基处,长度为1539个碱基对,编码氧化还原环合酶,512个氨基酸;sfmCy2位于基因簇核苷酸序列第15388-13874个碱基处,长度为1515个碱基对,编码氧化还原环合酶,504个氨基酸;4)番红霉素的修饰基因,即sfmM1,sfmO1,sfmO2,sfmO3,sfmK,sfmO4,sfmO6共7个基因:sfmM1位于基因簇核苷酸序列第11059-10460个碱基处,长度为600个碱基对,编码N-甲基化酶,199个氨基酸;sfmO1位于基因簇核苷酸序列第1370-2284个碱基处,长度为915个碱基对,编码氧化还原酶,304个氨基酸;sfmO2位于基因簇核苷酸序列第10384-8819个碱基处,长度为1566个碱基对,编码单氧化酶,521个氨基酸;sfmO3位于基因簇核苷酸序列第12372-13559个碱基处,长度为1188个碱基对,编码细胞色素P-450羟化酶,395个氨基酸;sfmK位于基因簇核苷酸序列第13613-13798个碱基处,长度为186个碱基对,编码铁氧化还原蛋白,61个氨基酸;sfmO4位于基因簇核苷酸序列第16947-15520个碱基处,长度为1428个碱基对,编码细胞色素P-450羟化酶,475个氨基酸;sfmO6位于基因簇核苷酸序列第46553-47683个碱基处,长度为1131个碱基对,编码FAD依赖的氧化酶,376个氨基酸;5)S-腺苷化甲硫氨酸合成相关酶基因,即sfmS1,sfmS2,sfmS3,sfmS4,sfmS5共5个基因:sfmS1位于基因簇核苷酸序列第38550-37096个碱基处,长度为1455个碱基对,编码S-腺苷-L-高半胱氨酸水解酶,484个氨基酸;sfmS2位于基因簇核苷酸序列第39521-38580个碱基处,长度为942个碱基对,编码亚甲基四氢叶酸还原酶,313个氨基酸;sfmS3位于基因簇核苷酸序列第42940-39557个碱基处,长度为3384个碱基对,编码5-甲基四氢叶酸-高半胱氨酸S-甲基转移酶,1127个氨基酸;sfmS4位于基因簇核苷酸序列第44013-43036个碱基处,长度为978个碱基对,编码碳水化合物激酶,325个氨基酸;sfmS5位于基因簇核苷酸序列第45220-44015个碱基处,长度为1206个碱基对,编码S-腺苷甲硫氨酸合成酶,401个氨基酸;6)调节基因,即sfmR1,sfmR2,sfmR3共3个基因:sfmR1位于基因簇核苷酸序列第786-1373个碱基处,长度为588个碱基对,编码TetR家族转录调节因子,195个氨基酸;sfmR2位于基因簇核苷酸序列第2487-2996个碱基处,长度为510个碱基对,编码转录调节因子,169个氨基酸;sfmR3位于基因簇核苷酸序列第35223-35759个碱基处,长度为537个碱基对,编码转录调节因子,178个氨基酸;7)抗性基因,即sfmG,sfmH共2个基因:sfmG位于基因簇核苷酸序列第4738-6177个碱基处,长度为1440个碱基对,编码移位酶,479个氨基酸;sfmH位于基因簇核苷酸序列第8748-6289个碱基处,长度为2460个碱基对,编码紫外修复蛋白,819个氨基酸;8)还包括4个功能不明确的基因,即srmE,sfmF,sfmI,sfmJ:sfmE位于基因簇核苷酸序列第31411-33780个碱基处,长度为2370个碱基对,编码肽酶,789个氨基酸;sfmF位于基因簇核苷酸序列第33777-33998个碱基处,长度为222个碱基对,编码MbtH类似蛋白,73个氨基酸;sfmI位于基因簇核苷酸序列第11694-11212个碱基处,长度为483个碱基对,编码未知功能蛋白,160个氨基酸;sfmJ位于基因簇核苷酸序列第12188-11691个碱基处,长度为498个碱基对,编码吡哆胺-5’-磷酸氧化酶相关蛋白,165个氨基酸。
地址 200032上海市徐汇区枫林路354号