第一个被发现的核心启动子元件为TATA box,其序列为TATA(A/T)A(A/T)。TATA box是含有TFIID结构域的TATA结合蛋白识别序列,对于起始转录具有关键作用。植物的特异核心启动子元件包含胞嘧啶碱基(TC 或者Y基序),且在转录起始位点上游的特定位置。启动子也包含近端转录因子结合位点,启动子近端转录因子结合位点对基因转录起着重要作用。
在动物研究中,核心启动子元件和启动子近端转录因子结合位点都能够增强启动子强度,然而,是否在植物中也存在这样的规律仍然未知。尽管计算分析显示,许多动物核心启动子元件在植物中也存在,只有TATA box和起始元件(Inr)得到了功能验证。近期,有研究人员通过结合转录因子结合位点合成植物启动子,然而,至今还没有对植物核心启动子元件进行大规模的功能研究。深入了解植物启动子的调控元件如何影响转录水平,有助于作物改良和基因工程中启动子的合理设计。
2021年6月3日,来自美国的研究团队在Nature Plants 发表了题为Synthetic promoter designs enabled by a comprehensive analysis of plant core promoters的研究论文,该研究全面分析了拟南芥、玉米和高粱的核心启动子,研究结果对设计“理想”启动子元件具有重要意义。
该研究利用STARR-seq(self-transcribing active regulatory region sequencing)技术,分别检测烟草叶片和玉米原生质体核心启动子元件的活性。首先,研究人员分别在拟南芥、玉米和高粱中构建了含有GFP标签的核心启动子的文库,其中,每个物种分别含有35S增强子或不含有35S增强子的质粒文库,瞬时转化到烟草叶片和玉米原生质体中,并进行了STARR-seq测序。通过对每个物种核心启动子测序深度的富集分析,发现物种间和不同研究系统间的核心启动子活性存在较大的差异。为了探究两套研究系统中含有35S增强子的启动子的基因功能,进行了基因本体富集分析(GO),发现只有少部分转录调控元件的核心启动子和增强基因表达相关,而增强子和增强基因表达相关性很强。接着,研究人员发现miRNA启动子活性和编码基因启动子活性差异较大,于此同时,还发现了由于没有5’UTR的编码基因没有被完全的注释,该序列不一定是真的启动子序列,因此,含有5’UTR的编码基因的启动子活性比没有5’UTR的编码基因启动子活性强。
研究人员对GC含量是否影响两个研究系统的启动子活性进行了探究,分析了不同物种的核心启动子序列中GC含量的分布,发现单子叶植物比双子叶植物启动子区域GC含量高,也发现了烟草叶片中富含AT的启动子活性比富含GC的启动子活性高出了四倍,但是在玉米原生质体中没有此现象,说明启动子强度和GC含量的关系只能作为对研究系统的描述,并不能作为启动子的本质特征。
为了进一步探究核心启动子元件对启动子强度的影响,研究人员发现TATA-box基序在拟南芥、玉米和高粱的启动子中存在差异。并通过突变启动子区域的TATA-box基序中的一个或者两个T碱基为C碱基,发现转录活性降低。同理,将TATA-box基序插入缺少TATA-box基序的启动子,从而转录活性增强,但是这种插入对TATA-box突变体却没有影响。
研究人员在STARR-seq建库中,瞬时转化后,通过光处理烟草叶片,发现只有2400个启动子至少有四次在光照或者黑暗中具有活性,具有光依赖-启动子的基因主要编码类囊体上的蛋白以及与光合作用相关的叶绿体膜蛋白,这种光依赖-启动子富含AT,也发现了TATA-box没有对启动子强度和增强子响应元件产生显著的影响,且TCP-结合位点、WRKY-结合位点是光依赖-启动子必须的元件。
为了设计具有上述特征的植物启动子,研究人员通过构建了和拟南芥、玉米相似的启动子序列,发现将近有一半富含AT的拟南芥启动子合成失败,在烟草叶片中,具有较少AT含量的拟南芥类似启动子的活性比玉米类似启动子的活性强,和预期结果一致,合成的启动子活性较弱。为了增强启动子活性,分别插入起始元件(Inr)、TATA box、Y 基序,发现插入TATA box的启动子活性比插入Inr的启动子活性强,总而言之,通过选择合适的核酸频率背景和增加核心启动子元件为设计合成启动子成为了可能。与此同时,研究人员还分析了启动子近端转录因子结合位点(TCP、HSF、NAC)对合成启动子的影响,发现TCP结合位点对烟草叶片的启动子有较大影响,而HSF结合位点对玉米原生质体的影响较大,NAC结合位点对两个系统影响不大,研究人员还通过插入一个或者多个转录因子结合位点,增加启动子活性。为了研究这些转录因子结合位点在启动子区域中是否存在位置特异性,研究人员分别在TATA box上下游插入这些转录因子结合位点,发现位于TATA box上游的转录因子结合位点可以增强启动子活性,然而位于TATA box 下游的转录因子结合位点不可以增强启动子活性。
Design and validation of synthetic promoters
研究人员利用了具有35S增强子的启动子文库数据作为输入,启动子强度作为输出,通过卷积神经网络的机器学习的方法(CNN)训练核心启动子强度预测模型,产生了在玉米和烟草系统中都有活性的启动子。这类候选启动子可以在其它组织和物种中广泛使用,并与多种增强子结合,为预测启动子强度和提高启动子强度奠定了研究基础。
综上所述,该研究利用STARR-Seq分析了拟南芥、玉米和高粱的整套全基因组的核心启动子,揭示了启动子的GC含量和转录因子在近端启动子区域结合位点对核心启动子元件TATA box的影响。该研究发现了启动子的GC含量分布和转录因子结合启动子的强度在双子叶植物烟草和单子叶植物玉米中存在差异。利用这些现象,研究人员建立了新型计算模型,预测和病毒35S启动子相当的启动子的活性,为设计具有理想特征的启动子元件奠定了研究基础。
论文链接:
https://www.nature.com/articles/s41477-021-00932-y
来源:BioArt植物
原文链接:http://mp.weixin.qq.com/s?__biz=MzU3ODY3MDM0NA==&mid=2247507121&idx=1&sn=e751d4934bdf5e3f60939a70b9efa14c
版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。
电话:(010)86409582
邮箱:kejie@scimall.org.cn