武汉大学朱玉贤院士与周宇教授课题组完成棉花基因组精细转录注释

BioArt植物  |   2019-10-18 20:16

来源:BioArt植物

原标题:Nature Commun.:亚洲棉基因组转录全景图!武汉大学朱玉贤院士与周宇教授课题组完成棉花基因组精细转录注释

2019年10月17日,Nature Communications 在线发表了武汉大学生命科学学院朱玉贤院士、周宇教授课题组联合完成的题为Multi-strategic RNA-seq analysis reveals a high-resolution transcriptional landscape in cotton的研究论文,报道了该研究团队在解析亚洲棉转录组方面取得的最新研究成果。生命科学学院王坤副研究员和周宇实验室王得和博士研究生为论文共同第一作者,朱玉贤院士和周宇教授为论文的共同通讯作者。

20191018201619_3ec945.jpg

棉花是一种重要的天然纤维作物,也是研究细胞分化、伸长和细胞壁发育调控的重要模式植物,但缺乏全面、高分辨率的基因图谱,棉花转录组的不完整性阻碍了各种生物过程分子机制的研究。亚洲棉(G. aboreum)是现在全世界广泛种植的栽培棉种的祖先基因组供体种之一,其基因组由1.7G碱基对组成。为了系统性的解析亚洲棉基因组转录全景,该研究通过整合运用了四种高通量技术,包括可获取全长转录本序列信息的三代Pacbio Iso-seq测序、高深度定量表达和剪接信息的链特异性RNA-seq以及可准确界定基因转录起始(TSS)和终止位点(TES)的CAGE-seq和PolyA-seq二代测序方法,系统地研究了亚洲棉16个不同组织器官的RNA转录情况。通过编写IGIA软件系统整合包括Pacbio-seq (92.8 Gb),ssRNA-seq (455.1 Gb),CAGE-seq (158.2 Gb) 和PolyA-seq (339.2 Gb) 四种高通量、高深度的测序数据,对亚洲棉基因组的基因结构进行注释分析。研究发现17,101个基因(占表达基因总数的43.3%)具有两个以上的转录异构体。由于IGIA整合了来自与CAGE-seq和PolyA-seq的测序数据,其在基因的末端注释准确性上表现明显优于纯二代或三代注释结果。另外由于利用了三代的长读长测序和高深度二代测序矫正,IGIA注释的转录本在剪接位点(JS)的注释上表现优异,比之前的两个版本的注释质量有很大的提升。通过随机挑选的170多对注释差异位点的RT-PCR验证表明IGIA的准确率达到98%。

20191018201620_42a7d5.jpg

Integrative multi-strategic RNA-seq for the high-resolution RNA landscape in G. arboreum.

从已发表文献看,在相同物种和组织器官的转录分析中,根据三代测序预测的剪接位点会比二代测序预测的剪接位点的数量有非常大的提升。然而本研究通过整合二代和三代测序的结果发现,仅根据三代测序结果预测的基因剪接边界(Splicing Junction)可能会包含大量的空泡错误(Bubble error)和边界错误(Boundary error)。该研究结果揭示由于三代测序技术本身的特点,之前的部分研究报道中基于三代的全长转录本测序而预测的基因异构体数量可能存在高估。

微外显子(micro-exon)是动物中首先报道的一种微小外显子,其长度短至仅3nt,该研究通过系统分析,首次在棉花中鉴定到微外显子的存在,还通过在多个植物物种的比对,发现了一个具有潜在重要作用的45 nt的保守微外显子。它位于转录因子AP2基因结构的中部,令人意外的是,该微外显子的长度在从低等裸子植物-江南卷柏到高等开花植物-拟南芥的演化过程中保持长度不变。通过EMSA实验证实,该微外显子的选择性剪接可能调节其编码蛋白的DNA结合强度。因此,该研究揭示了一种在RNA加工水平调控微外显子选择性剪接而协调转录因子的结合活性的新机制。

研究通过分析来自于22,863个亚洲棉基因的44,728个TSS cluster发现38.4%的基因有两个及以上转录起始位点,14.5%的TSS具有单个碱基分辨率,而70%以上的TSS具有10 bp分辨率。多启动子基因的不同TSS中,远端TSS使用更为频繁。有347个编码基因变为非编码基因,5888个基因的UTR长度变化(这些UTR包含大量的miRNA靶标位点,uORF、U-rich及G四链体等影响转录本翻译、稳定性或亚细胞定位的重要元件),2800多个基因的编码蛋白长度变化。

研究进一步发现了具有胚珠组织或发育阶段特异性的TSS可变基因如NRT1.2、REC1、LRR和PP2C等,这些基因在转录表达量变化不大的情况下,组织和发育时期出现明显的TSS可变调节现象。胚珠发育时期TSS可变的硝酸根转运蛋白(NRT1.2)编码基因TSS可变造成NRT蛋白四个跨膜TM的丢失,产生NRT-L和NRT-S两种长度的蛋白异构体。3D同源模建结果显示,较短的NRT-S的跨膜区明显较为松弛,且膜内结构发生较大改变,进一步实验表明NRT-S的硝酸根转运能力显著下降。

另外,该研究也同样基于PolyA-seq的数据对基因的转录终止位点(TES)区域进行了系统分析。结果表明基因的3’末端同样存在多TES调控的现象,在发育和组织分化过程中,很多基因的转录终止通过可变的TES调节其3’UTR的长度。然而其发生及作用机制等问题有待进一步阐明。

最后,该研究通过分析三代测序的全长转录本,发现约5%的亚洲棉基因存在转录通读现象,形成类似原核生物的多顺反子(Polycistron)转录本。这些基因相互临近,平均距离明显小于其他相邻的独立转录基因之间的距离。

另外通过对这些多顺反子上的基因对的功能分析发现,他们往往倾向于执行相同功能或位于同一个分子作用网络。该结果表明这些基因对的转录水平的共同调控现象可能利于其共同完成某一生物学过程。

该研究通过系统地、全方位地转录分析建立了亚洲棉基因组转录全景图,填补了国际上棉花基因组精细转录注释的空白,获得了迄今为止科学家对亚洲棉基因组的复杂转录全貌所进行的最准确的注释,为进一步的功能基因组研究提供了宝贵的资源。同时该研究也揭示了一些植物RNA转录调控方面的新现象和新机制,为从事植物RNA研究的研究者们提供了新的研究思路。

论文原文链接:

https://www.nature.com/articles/s41467-019-12575-x

来源:bioartplants BioArt植物

原文链接:https://mp.weixin.qq.com/s?__biz=MzU3ODY3MDM0NA==&mid=2247492670&idx=1&sn=93faf057617e0aa7caff9d6b63b8351a&chksm=fd737e59ca04f74f0d34c34f0313b2e1e95340c94fc190d8f6b2bb7e3e4f2fc981553f9d1324&scene=27#wechat_redirect

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn