微生物次级代谢产物因具有重要的药理活性被广泛用于健康、医药和农业等。而微生物代谢暗物质的发掘是领域内公认的难题,主要的瓶颈是对隐性基因簇的表达调控机制尚不清楚。近年来,基因调控策略已被有效地设计和实施,使得探索新结构的天然产物成为可能。目前对于真菌次级代谢调控的理解主要包括途径特异性调控,表观遗传调控和全局调控。事实上,真菌次级代谢的各种调控方式交织成了复杂的层级式网络,远远超出了人们当前的理解。因此,深入认识并开发新的次级代谢基因调控策略是新型天然药物挖掘的重要手段。
课题组长期致力于隐性基因簇的表达调控及激活研究。前期从一株次级代谢产物丰富的植物内生真菌Pestalotiopsis fici CGMCC3.15140(P. fici)中发现了一个全局调控因子RsdA介导真菌无性发育和全局次级代谢产物变化,同时在模式真菌Aspergillus nidulans中通过敲除其同源基因laeB挖掘到多种新型聚酮产物。为了探究RsdA在真菌次级代谢产物挖掘中的调控机制,本研究以体外纯化的RsdA作为诱饵,通过pull-down实验从P. fici的总蛋白中特异性地拉出201个潜在的互作蛋白,进一步的结合蛋白质谱得分和RNA-seq数据筛选到10个候选蛋白(图1b-c)。随后对10个候选蛋白的编码基因分别进行敲除。作者发现其中一个基因csdA的缺失显著影响了P. fici的生长和代谢。进一步结合代谢组学数据,共有55%的代谢离子产物受到CsdA的显著调控,而这些结果与rsdA缺失引起的变化是一致的,暗示了两个蛋白在功能上的一致性(图1d-f)。另外,作者通过分析CsdA的结构域组成发现其包含一个RNA识别结构域和两个锌指结构域,暗示该蛋白是一个RNA结合蛋白,在真菌的次级代谢调控中可能有一个独特的转录后调控机制。
通过对包含CsdA和RsdA的真菌基因组数据进行系统挖掘,作者发现在子囊菌中两种蛋白是普遍存在的(图2a)。为了进一步揭示CsdA对真菌发育和代谢的影响,作者观察了突变体的分生孢子形态,结果显示csdA或rsdA的缺失均会导致P. fici的分生孢子形态不再规则(图2c)。在代谢层面上,共有39.8%的代谢离子产物受到CsdA和RsdA的共同调控(图2e,f)。在次级代谢层面上,转录组分析显示CsdA和RsdA分别调控了45(59%)和54(71%)个基因簇核心基因的表达,有24(32%)个被共同调控(图2g),暗示了CsdA/RsdA在真菌次级代谢产物挖掘中的重要应用潜力。
为了阐明CsdA/RsdA调控真菌次级代谢的机制,作者首先在P. fici中对两种蛋白进行了亚细胞定位(图3a),结果显示两个蛋白在细胞核内发挥作用。基于两种蛋白功能的一致性,作者认为它们在细胞核以复合体的形式存在,于是通过体外pull-down和体内双分子荧光互补(BiFC)实验进行了验证(图3b,c),结果证实了两个蛋白在细胞核直接互作形成调控复合体。通过对CsdA/RsdA二聚体结构的预测,作者获得了两个蛋白相互作用的区域,分别是CsdA的N-末端和RsdA的C-末端(图3d)。接下来作者将RsdA蛋白分别与纯化的CsdAΔN-terminal,CsdAΔRRM,CsdAΔZnF蛋白,或者纯化的RsdAΔC-terminal蛋白与CsdA蛋白进行体外pull-down实验,证实了两个蛋白互作的关键区域是CsdA的N-末端和RsdA的C-末端(图3e)。进一步的作者也在P. fici中对两个蛋白互作的氨基酸残基进行了突变(CsdAH26A-Y29A),结果显示这些位点的突变显著影响了P. fici的生长发育和次级代谢,表明CsdA通过与RsdA互作维持P. fici的生长发育和全局代谢。
基于RNA结合蛋白在真核生物可变剪接中的作用,作者假设CsdA通过可变剪接影响真菌的次级代谢。通过对全转录组范围内的可变剪接基因进行分析,发现rsdA的表达受到CsdA显著的正调控,进一步在ΔcsdA突变体中还发现rsdA内含子2的剪接与对照菌株相比被明显的上调。为了确认CsdA是否调控rsdA的剪接,作者测定了rsdA内含子2的剪接率,证实了csdA的缺失促进rsdA内含子2的剪接。接下来作者预测了rsdA pre-mRNA结构并与CsdA蛋白进行分子对接,获得CsdA上的结合残基是R368-F373,rsdA pre-mRNA上的结合位点是5’-GUCGGUAU-3’。通过对CsdA中结合残基的保守性进行分析,发现这些残基在整个真核生物是保守的,并且CsdAR368A-F373A突变体中rsdA内含子2的剪接与ΔcsdA突变体一致,表明该结合位点在CsdA介导的可变剪接中起关键作用。进一步通过凝胶阻滞实验和等温滴定实验,作者证实了CsdA通过与rsdA pre-mRNA上的5’-GUCGGUAU-3’ 结合来发挥可变剪接功能。并且在对次级代谢的调控上,作者发现CsdA并不直接影响其生物合成基因的可变剪接,而是通过对rsdA的可变剪接介导次级代谢的全局变化。
鉴于ZnF结构域在动物和植物可变剪接中的作用,作者假设CsdA中的ZnF在真核生物是保守的。通过与真菌、动物和植物来源的ZnF结构域进行系统发育分析,确认了CsdA中的ZnF属于“CCCC”型ZnF,证实了其在真核生物可变剪接中是保守的。为了确定CsdA/RsdA介导的次级代谢调控模式在子囊真菌是否普遍存在,作者在一株Aspergillus fumigatus中对CsdA和RsdA同源蛋白的编码基因分别进行了敲除,结果显示CsdA和RsdA分别调控了26%和41%的代谢离子产物变化,证实了CsdA/RsdA调控模式的普适性。
基于此作者提出CsdA/RsdA的调控模式:RNA结合蛋白CsdA在真菌的转录后调控中作为rsdA内含子2的剪接抑制因子,有助于维持rsdA的稳定表达。在次级代谢产物的生物合成中,CsdA/RsdA复合体共定位于细胞核,作为一种上游的调控复合体介导多种次级代谢产物的合成,包括聚酮类、非核糖体多肽类和萜烯类等。
综上,本研究从丝状真菌中鉴定到一个全新的调控真菌次级代谢的RNA结合蛋白CsdA,揭示了RNA结合蛋白通过与RsdA形成核内复合体,并在转录后水平调控其pre-mRNA剪接从而协调真菌次级代谢的新模式。这种转录和转录后交叉调控的新模式不仅有助于理解复杂的真菌次级代谢调控网络,还为新天然产物挖掘提供了新策略。本研究得到了国家重点研发计划、国家自然科学基金、中国科学院基础前沿科学研究计划、中国科学院基础前沿科学研究计划从0到1原始创新项目、中国科学院战略生物资源计划等项目的支持。此外,中国科学院微生物研究所刘晓研究员、美国威斯康辛大学麦迪逊分校的Nancy Keller教授和堪萨斯大学的Berl Oakley教授等专家为本研究提供了大力支持。