发明名称 诺丝七肽的生物合成基因簇
摘要 本发明涉及诺丝七肽的生物合成基因簇,具体说是一种由链霉菌产生的具有抗革兰氏阳性菌抗生素—诺丝七肽(Nosiheptide)的生物合成基因簇的克隆、测序、分析、功能研究及其应用。整个基因簇共包含16个基因:6个与Nosiheptide大环生物合成相关基因,5个与侧链生物合成相关基因,4个与翻译后修饰相关基因,1个调控基因。通过对上述生物合成基因的遗传操作可阻断诺丝七肽的合成。本发明所提供的基因及其蛋白也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。
申请公布号 CN101586112A 申请公布日期 2009.11.25
申请号 CN200910053427.7 申请日期 2009.06.19
申请人 中国科学院上海有机化学研究所 发明人 刘文;虞沂;段炼;雷春;丁莹;廖日晶
分类号 C12N15/60(2006.01)I;C12N15/55(2006.01)I;C12N15/54(2006.01)I;C12N15/53(2006.01)I;C12N15/52(2006.01)I;C12N15/31(2006.01)I;C12P21/02(2006.01)I;C12P17/12(2006.01)I;C12P17/14(2006.01)I;C12P17/10(2006.01)I;C12R1/465(2006.01)N 主分类号 C12N15/60(2006.01)I
代理机构 上海新天专利代理有限公司 代理人 邬震中
主权项 1.一种抗革兰氏阳性菌活性的抗生素-诺丝七肽的生物合成基因簇,其特征在于编码诺丝七肽生物合成所涉及的16个基因,具体为:1)1个功能未知蛋白基因,即nosA:nosA位于基因簇核苷酸序列第2704-2249个碱基处,长度为456个碱基对,编码一个功能未知蛋白,151个氨基酸;2)细胞色素P450氧化酶基因,即nosB:nosB位于基因簇核苷酸序列第4068-2701个碱基处,长度为1368个碱基对,编码细胞色素P450氧化酶,455个氨基酸;3)类P450氧化酶基因,即nosC:nosC位于基因簇核苷酸序列第5309-4083个碱基处,长度为1227个碱基对,编码P450氧化酶,408个氨基酸;4)脱水酶基因,即nosD:nosD位于基因簇核苷酸序列第个6365-5328碱基处,长度为1038个碱基对,编码脱水酶,345个氨基酸;5)脱水酶基因,即nosE:nosE位于基因簇核苷酸序列第个9114-6352碱基处,长度为2763个碱基对,编码脱水酶,920个氨基酸;6)NADH依赖的脱氢酶基因,即nosF:NosF位于基因簇核苷酸序列第10778-9129个碱基处,长度为1650个碱基对,编码甲基基转移酶,549个氨基酸;7)与Nosiheptide主链生物合成相关但具体功能未知的基因,即nosG:nosG位于基因簇核苷酸序列第12800-10830个碱基处,长度为1971个碱基对,编码一个未知功能蛋白,656个氨基酸;8)与Nosiheptide主链生物合成相关但具体功能未知的基因,即nosH:nosH位于基因簇核苷酸序列第14761-12797个碱基处,长度为654个碱基对,编码一个未知功能蛋白,654个氨基酸;9)乙酰辅酶A合成酶基因,即nosI:nosI位于基因簇核苷酸序列第16097-14763个碱基处,长度为1335个碱基对,编码乙酰辅酶A合成酶,444个氨基酸;10)与Nosiheptide侧链生物合成相关但具体功能未知的基因,即nosJ:nosJ位于基因簇核苷酸序列第16297-16058个碱基处,长度为240个碱基对,编码一个未知功能蛋白,79个氨基酸;11)水解酶基因,即nosK:nosK位于基因簇核苷酸序列第17106-16294个碱基处,长度为813个碱基对,编码水解酶,270个氨基酸;12)与侧链合成相关的SAM自由基蛋白基因,即nosL:nosL位于基因簇核苷酸序列第18316-17114个碱基处,长度为1203个碱基对,编码一个SAM自由基蛋白,400个氨基酸;13)Nosihepide前体肽基因,即nosM:nosM位于基因簇核苷酸序列第18668-18820个碱基处,长度为153个碱基对,编码Nosiheptide前体肽,50个氨基酸;14)SAM依赖的甲基转移酶基因,即nosN:nosN位于基因簇核苷酸序列第18891-20078个碱基处,长度为1188个碱基对,编码SAM依赖的甲基转移酶,395个氨基酸;15)与Nosiheptide后修饰相关具体功能未知基因,即nosO:nosO位于基因簇核苷酸序列第20075-21187个碱基处,长度为1113个碱基对,编码一个具体功能未知的蛋白,370个氨基酸;16)SARP家族调控基因,即nosP:nosP位于基因簇核苷酸序列第21497-22468个碱基处,长度为972个碱基对,编码SARP家族调控基因,323个氨基酸。
地址 200032上海市徐汇区枫林路354号