Discovery and modification of cytochrome P450 for plant natural products biosynthesis
发现与改造细胞色素P450以合成植物天然产品
一篇关于植物CYP450的综述,地表最强,总结的最全面的版本之一,各位看官有推荐请留言评论区~
Discovery and modification of cytochrome P450 for plant natural products biosynthesis
"发现与改造细胞色素P450以合成植物天然产品"
摘要 细胞色素P450在自然界中广泛存在,对于植物天然产品的多样化和功能性改造起着关键作用。随着测序技术、"组学"分析和合成生物学的快速发展,近几年在植物P450鉴定方面取得了显著进展。然而,在晶体结构、异源表达和酶工程方面仍然存在挑战。这里,我们回顾了参与植物天然产品生物合成的P450酶的几个研究热点,包括P450数据库、基因挖掘、异源表达和蛋白工程。
关键词:P450酶、植物天然产品、合成生物学
背景
植物细胞色素(CYP) P450基因家族是植物中最大的基因家族【1】。P450酶(P450s)由于具有广泛的活性,包括羟基化、还原、脱羧、亚砜化、N-和O-去甲基化、环氧化、脱氨和脱卤等,在植物天然产品(PNPs)的生物合成途径中广泛参与【2】。自1958年第一个P450基因向世界亮相以来,到目前为止,已有超过300,000个P450基因被收集到数据库中【3】。遗憾的是,其中只有约0.1%的基因在天然产品的生物合成途径中被功能性地表征。随着PNPs市场需求的增加,微生物细胞工厂在生产PNPs方面变得越来越受欢迎【4】。然而,在异源微生物宿主中P450s的表达水平和催化效率受到限制【5,6】。因此,识别新的催化功能和提高植物P450s的异源活性已成为建立用于复杂PNPs高效、高产微生物生产平台的主要挑战【5】。在这篇综述中,我们总结了P450酶数据库、P450s挖掘、异源表达和酶工程的最新进展(图1)。
图1. 用于PNPs生物合成的细胞色素P450的发现与改造。
P450酶的功能性和结构性数据库
随着现代生物技术的发展,越来越多的P450基因得到了良好的表征,包括它们的催化功能、晶体结构和在次级代谢物生物合成途径中的角色。在不久的将来,P450基因的数量将达到超过一百万。如果没有组织良好的信息,从这么多基因中获得用于科学研究和工业应用的所需P450s是不可能的。因此,构建数据库以收集P450s的序列、结构和功能是必要的。
已知P450s的功能分布
根据Nelson实验室的标准CYP450命名序列,植物P450被命名并分类为CYP71-CYP99和CYP701-CYP999基因家族【3】。通常情况下,当序列相似性超过40%时,P450s被归入一个家族【7】。迄今为止,大约200个植物P450基因,来自55个基因家族,已被识别和表征(图2)。135种次级代谢物,包括86种萜类、11种黄酮、18种生物碱,由这些P450酶修改,植物P450s催化的重要反应在表1中总结。其中,CYP71家族主要参与许多倍半萜的生物合成,包括capsidiol、solavetivone、gossypol、青蒿素、parthenolide、zerumbone、caryophyllene等。CYP76、CYP701、CYP725、CYP720和CYP714家族主要参与二萜的生物合成,包括丹参酮、水稻抗病素、phytocassane、水稻抗病素、赤霉素、紫杉醇、abietate【8】【9】【10】【11】。除了CYP725和CYP720家族,CYP85族的所有家族(CYP716、CYP90、CYP724、CYP87、CYP705、CYP708、CYP85和CYP88)都参与三萜的生物合成,包括甘草素、maslinic acid、人参皂苷、betulinate、zanhic acid、油菜素内酯、diosgenin、葫芦巴碱、罗汉果苷、thalianol等【12】【13】【14】。此外,CYP51、CYP92、CYP710、CYP72家族也在许多三萜皂苷的生物合成中发挥重要作用【12】【15】。然而,单萜生物合成的P450s零星分布在不同的基因家族中,如CYP71D13参与薄荷醇的生物合成,CYP750B1参与绿原醇的生物合成,CYP72A1参与严格素的生物合成【16】【17】【18】【19】。
图2. 具有已知功能的174个植物P450基因的系统发育树。
此外,还识别了与黄酮和生物碱生物合成相关的许多P450基因。CYP73A亚家族(如肉桂酸4-羟化酶)和CYP93家族(黄酮合酶)的P450基因有助于形成黄酮骨架。黄酮在C6、C8、C3′和C5′位置的后修饰通常由P450酶羟基化【20】。例如,CYP75A和CYP75B(C3′和C5′黄酮羟化酶)在花青素生物合成中起关键作用。CYP706X和CYP82D亚家族的P450基因(C6和C8黄酮羟化酶),对黄芩苷、黄芩素、黄芩酚等的生物合成是必需的【4,21】。CYP80、CYP82和CYP719家族的P450酶通常需要用于许多生物碱的生物合成,例如木兰花碱、吗啡、血根碱和诺斯卡品。例如,CYP80B1((S)-N-甲基可可碱3′-羟化酶)在生物合成关键前体(S)-列替啶中起着重要作用【22】;CYP719A1有助于生成异喹啉生物碱的骨架【23】;来自CYP82N、CYP82P、CYP82X和CYP82Y亚家族的P450基因也对生物碱的最终产品的生物合成有很大贡献【23】【24】【25】【26】【27】。
P450基因数据库的构建
1996年,建立了第一个P450数据库,系统命名了现有的481个P450基因【28】。2007年,开发了一个用于搜索和预测P450蛋白家族的工具,CYPED(细胞色素P450工程数据库)【29】。CYPED包括8613个序列和47个蛋白结构,并集成了多个工具,如多序列比对、系统发育树和隐马尔可夫模型(HMM)剖析,可以用来分析序列、结构及其与生化性质的关系。随后,Nelson实验室构建了细胞色素P450主页【30】,手工组织并收集了具有系统命名和序列信息的P450基因。到目前为止,数据库已收集了300,000个P450序列和41,000个命名的P450s【3】。除了P450序列的收集外,还开发了一个CYP-药物相互作用分析数据库(SuperCYP),重点研究P450s与药物的代谢关系【31】。该数据库包含约1170种药物和2785个CYP-药物相互作用。
P450基因数据库已经发展了数十年,并在基因挖掘、注释和功能分析上做出了很大贡献。利用基因组测序技术的优势,越来越多的P450基因从一些模型物种的基因组数据库中被注释出来,如The Arabidopsis Cytochrome P450, cytochrome b5, P450 reductase, β-Glucosidase, and Glycosyltransferase Family 1 Site【32】,TAIR - Home Page【12】和Phytozome v13【33】,以及一些植物基因组测序项目,如一千植物(1 KP)数据库【34】,10 KP项目(Home | 10KP | CNGB),JGI开放绿色基因组计划,PhytoMetaSyn项目(www.phytometasyn.ca)和药用植物基因组项目【35】。根据基因组测序的快速发展,构建更健壮的P450基因数据库是必要的。
P450酶的晶体结构
尽管P450基因发现取得了进展,但只有少数P450成功结晶【36】。细胞色素P450的第一个晶体结构在1985年发布(CYP101A1)【37】。到目前为止,已有963个P450晶体结构(X射线分辨率≤3 Å)被存放在蛋白质数据银行(PDB)。然而,只有五个P450的晶体结构来自植物(RCSB PDB: Homepage)。植物中P450的前两个晶体结构是两个CYP74s【38】【39】。由于它们的非典型机制,不需要分子氧和NADPH还原酶,因此不适合基于这两个结构对其他典型植物P450进行建模。幸运的是,包含抑制剂4-苯基咪唑(4-PI)的CYP76AH1的X射线晶体结构在2.6 Å的分辨率下被确定,这是一种典型的膜相关细胞色素P450酶,在丹参酮生物合成途径中起着关键作用【36】。近年来,参与油菜素内酯生物合成的拟南芥甾醇22-羟化酶CYP90B1和参与叶黄素生物合成的类胡萝卜素环羟化酶CYP97A3(PDB编号:6J94)分别由Shingo Nagano实验室和赵氏实验室结晶【40】。植物P450的晶体结构分析领域还有很长的路要走。
从植物中识别P450基因
识别P450是建立PNPs原始生物合成机制的关键步骤。一般来说,通过基因组或转录组测序从植物中筛选和识别P450。对于一些没有测序数据的植物,也可能从数据库中挖掘出能催化相同生物反应以实现PNPs生物合成的替代同工酶。本节将讨论P450s发现的两种策略。
通过下一代测序发现P450酶
基因组测序不仅提供了P450基因挖掘最全面的遗传信息,保证了含有所需的P450s,还通过比较基因组分析提供了研究PNPs生物合成机制的更多机会。例如,黄瓜(Cucumis sativus)的比较基因组分析揭示了几个参与葫芦素生物合成的P450s,如CYP88L2用于葫芦二烯醇C19羟基化,CYP81Q58用于C25羟基化【41】,CYP87D20用于C20羟基化【42】。毛蕊花(Erigeron breviscapus)的全基因组测序结合进化基因组学和合成生物学策略,发现了参与灯盏花素生物合成的P450酶【4】。通过使用加州罂粟的草图基因组,证实了两个P450基因CYP82P2和CYP82P3作为10-羟化酶参与二氢苯并菲啶生物碱生物合成【23】。雷公藤(Tripterygium wilfordii)的参考级基因组和综合基因组、转录组和代谢组分析结果,识别了CYP728B70,它催化去氢松脂酸甲基三步氧化为酸基团,参与雷公藤甲素生物合成【43】。
通过比较转录组分析也可以通过研究产生和非产生植物种或高产和低产植物品种甚至同一植物不同组织间的表达谱来识别候选P450酶。例如,通过比较鸦片生产和非生产罂粟品种的转录组轮廓,发现了一个涉及诺斯卡品生物合成的10基因簇【44】。对重楼(Paris polyphylla)和胡芦巴(Trigonella foenum–graecum)特定组织的转录组进行de novo组装表明,这两个物种独立使用P450基因催化胆固醇的氧化5,6-螺环化以产生薯蓣皂素【45】。基于在积雪草(Centella asiatica)的转录组中识别独特序列和在酵母细胞中的异源表达,Kim等人发现了一个新的多功能C-23氧化酶,CYP714E19,参与积雪草苷生物合成【46】。
从异源来源识别P450同工酶
尽管下一代测序迅速发展,但到目前为止,只有几百个植物基因组可以在NCBI(国家生物技术信息中心)数据库中获得。NCBI中已存储了超过万个基因组和数百万个来自其他物种的基因。因此,从异源来源识别同工酶或替代酶的另一种策略可能实现一些重要PNPs的生物合成,而无需基因组测序数据。最成功的案例之一是通过结合成功表达来自多个物种的21种酶,在酵母中完整地生物合成鸦片类物质【47】。此外,也可以从其他植物中识别P450同工酶,这些植物中相同的PNPs生物合成途径独立演化。例如,毛蕊花(Erigeron breviscapus)和黄芩(Scutellaria baicalensis Georgi)独立演化了黄酮6-羟化酶,分别从P450亚家族CYP706X和CYP82D催化黄花苷转化为黄芩苷【4,21】。一种单子叶药用植物喜马拉雅重楼和一种双子叶烹饪草本植物胡芦巴独立招募了一对P450s,将胆固醇的氧化5,6-螺环化转化为薯蓣皂素【45】。报道称,山楂(Crataegus pinnatifida)和积雪草(Centella asiatica)都有C-2α羟化酶。有趣的是,积雪草中的C-2α羟化酶在酵母细胞工厂中的产物比山楂中的高233%【48】。
P450基因表达的优化
如今,随着合成生物学的快速发展,研究人员正在努力使用各种生物系统功能性地表达P450基因,并生产具有复杂结构和高价值的植物衍生天然分子。本部分将详细讨论在酵母、大肠杆菌或烟草细胞中进行的P450相关的代谢工程工作。
在酵母中异源表达P450
由于出色的真核特性,各种P450已在酵母中异源表达,用于许多PNPs的生物合成,如青蒿酸【49】,雷公藤甲素【43】,灵芝酸【50】,马斯林酸【48】,各种植物三萜【51】,长春瑞滨【52】,严格素【53】,托品生物碱【54】已在酵母细胞工厂中成功生产。建立了几种优化酵母中P450s表达的方法,包括优化P450酶表达,增强P450s与细胞色素P450还原酶之间的耦合,增加还原力供应,扩展内质网(ER)等。例如,为了克服人参P450酶PPDS(原人参二醇合成酶)与拟南芥细胞色素P450还原酶ATR1之间的耦合不良,构建了跨膜域截断和自给自足的PPDS-ATR1融合体,导致P450催化活性约提高了4.5倍【55】。在另一项研究中,通过筛选三种CPRs(细胞色素还原酶)并优化F3′H−CPR的比例为1:2,橙皮素到山柰酚和税皮素的转化率分别达
到90.5%和56.8%【56】。通过增加前体供应,工程限速途径酶,优化酶表达水平,并引入修饰到内源酵母代谢以增强NADPH供应,酵母中苯乙基异喹啉生物碱的生物合成提高了超过18,000倍【47,57,58】。磷酸酸性磷酸酶(PAH1)的破坏导致ER显著扩展,导致通过共表达三个P450s使药用龙胆酸增加了8倍【59】。此外,过表达关键ER大小调节因子(INO2)也分别将角鲨烯和P450介导的原人参二醇的产量提高了71倍和8倍【60】。
在大肠杆菌中异源表达P450
尽管内在的P450表达系统是默认的,但在大肠杆菌中进行P450酶介导的PNPs生物合成的代谢工程仍有许多成功案例。P450在细菌表达系统中的表达的显著进展,包括N端修饰、伴侣蛋白共表达、降低次级mRNA结构、细菌密码子使用、载体和宿主菌株选择以及改变外部生长条件,已由Zelasko等人全面总结【61】。用于PNPs生物合成的P450酶的N端修饰列在表2中。通过优化P450表达,还原酶伙伴相互作用和N端修饰,大肠杆菌中氧化紫杉烷的最高滴度达到约570 ± 45 mg/L【62】。众所周知,细胞氧化还原平衡和辅因子可用性可以显著影响微生物中代谢物的产量。例如,破坏谷氨酸脱氢酶(gdhA)可以增加10%的NADPH/NADP+比率,也将产物ent-香桐酸提高了约22.5%【63】。表达包含P450基因CYP714A2及其还原酶AtCPR2的拟南芥融合蛋白,提高了批发酵产量中甜叶菊苷的产量至38.4 mg/L【64】。大肠杆菌和酿酒酵母的共培养将是一个很好的策略,充分利用两个物种的优势。例如,在大肠杆菌和酿酒酵母的共培养系统中成功合成了苯基异喹啉生物碱(BIAs)。大肠杆菌被设计用于合成分支点中间体(S)-列替啶,而酿酒酵母被设计用于表达膜结合的P450酶。最终,木兰花碱和鱼藤碱的产量分别达到了7.2 mg/L和8.3 mg/L【65】。类似地,通过集成在大肠杆菌中的紫杉二烯的快速生产和在酿酒酵母中有效表达P450基因来羟基化紫杉二烯,合成联合体生产了最高产量的氧化紫杉烷为33 mg/L【66】。
在烟草中异源表达P450基因
烟草的野生亲缘物种尼科提亚纳·本特哈米亚纳(Nicotiana benthamiana)越来越多地被用作重构PNPs生物合成途径的系统【67,68】。N. benthamiana能够通过农杆菌介导的瞬时表达操作,这使得无需构建多基因构建体就能表达多基因途径或组合生物合成库。此外,许多PNPs生物合成所需的代谢前体在N. benthamiana中往往以充足的量存在【67】【68】【69】。到目前为止,已经在N. benthamiana中成功重构了不同类型天然产物的几条途径,包括萜类【70】、生物碱【68】、依托泊苷无糖体【67】或紫甘蓝素【71】。例如,使用叶绿体隔室化代谢工程策略,Yong Wang的团队将紫杉烷合酶、紫杉烷-5α-羟化酶和一种细胞色素P450还原酶引入烟草,并证明了烟草作为紫杉醇生产的另一种潜在平台的可能性【69】。Jing-Ke Weng的团队揭示了在烟草中瞬时表达P450s足以在N. benthamiana中诱导薯蓣皂素的产生【45】。
P450蛋白工程
尽管P450酶具有强大的催化功能,具有不可替代的区域选择性和立体选择性,但由于活性低、稳定性差和底物范围窄,自然P450酶仍然非常有限,不能满足工业生物技术快速发展的需求。已通过许多方法对自然P450进行了工程改造,例如定向进化、随机突变、理性设计等【72,73】。这里,我们将讨论P450s蛋白工程的两种最有用的方法。
人们在蛋白工程方面投入了大量努力,这不仅提高了P450s的活性和稳定性,还执行了新的反应【73】,这是由诺贝尔奖得主Frances H. Arnold率先提出的【74】【75】【76】。定向进化已被广泛应用于工程化良好表征的P450s,如P450BM3和P450cam【77】。这些定向进化和定点突变的广泛工作已由Whitehouse等【78】和Li等【73】总结。然而,对植物来源的P450s的研究还很少。Brühlmann等人将定向进化技术应用于工程化番石榴来源的13-过氧化物裂解酶(CYP74B)。通过使用L-ShufflingTM的体外DNA重组和使用EvoSightTM的理性随机突变的迭代周期,生成了产量提高15倍的突变体【79】。通过工程化CYP76AH15的SRSs(底物识别位点),该酶负责鼠尾草素途径的第一个假定氧化步骤,观察到变异体A99I的催化活性约提高了6倍【80】。尽管已完成许多成功的P450工程改造示例,但仍受高通量筛选方法的限制。
建立高通量筛选方法对P450酶工程非常重要。为CYP76AD1建立了基于荧光的筛选,该酶基于进一步将产物左旋多巴(l-DOPA)转化为紫黄质的产物,表现出酪氨酸羟化酶活性。然而,具有更高酪氨酸羟化酶活性的CYP76AD1突变体也进行了DOPA氧化酶活性,这可能将代谢通量分支到不希望合成的l-dopa醌【81】。依靠C末端GFP(绿色荧光蛋白)融合,构建了一个高通量筛选平台。识别了几种高表达且性能稳健的细胞色素P450嵌合设计。这些结果为N端标签在微生物细胞工厂设计中的广泛应用提供了框架【81】。
结论和未来展望
细胞色素P450酶是植物天然产物多样性的主要驱动力之一。目前,大多数PNPs生物合成途径中的P450s仍然不清楚。幸运的是,基因组学、生物信息学和合成生物学的进步加速了PNPs生物合成途径的阐明。我们已经看到了基因挖掘、异源表达和蛋白工程方面的显著进展。数据库中P450基因的收集也为P450研究提供了巨大的改进【82】。然而,P450的后修饰仍然是PNPs生物合成的速度限制步骤。目前,定向进化和半理性设计已被应用于提高P450酶的性能。将来,目标PNPs的所需修饰可以通过P450基因的de novo设计实现。