Nature:表观遗传学进展将遗传学、环境与疾病联系了起来!

中国医学科学院医学信息研究所  |   2019-11-15 20:16

来源:中国医学科学院医学信息研究所

谷 君 说

21世纪,表观遗传学的研究得到了快速发展,同时其产生了让研究人员感兴趣和憧憬的东西,当然了,这其中也存在一些大肆宣传的成分,本文中,我们回顾了表观遗传学在过去几十年里是如何演变的,同时分析了近年来改变科学家们对生物学理解的一些研究进展;我们讨论了表观遗传学和DNA序列改变之间的相互作用,以及表观遗传学对细胞记忆和可塑性的影响,同时我们还考虑了环境以及代际和跨代表观遗传学对生物学、疾病和进化的影响。最终,我们提出了一些对人类健康有意义的表观遗传学研究新领域。

长期以来,生物学家一直在试图理解受精卵是如何形成由数百种特殊细胞类型组成的有机体的,每一种类型的细胞都会表达一组特定的基因,而细胞的身份如今被认为是特殊基因组合表达所产生的结果;表达模式必须被建立和维持,即两种不同但存在联系的过程,原始细胞的多能性及细胞类型的建立在很大程度上依赖于数百种转录因子的协同作用,这些转录因子能与特定DNA序列相结合来激活或抑制细胞谱系基因的转录。这一建立阶段通常与Conrad Waddington对表观遗传学的第一个定义最为接近,即研究在发育背景下基因型产生表型的机制;而维持阶段通常涉及大量非DNA序列特异性染色质辅因子,其能通过细胞分裂并在长时间内建立和维持染色质的状态,当然,有时候会缺少初始转录因子。

20191115201656_8ac1b6.jpg

图片来源:Cavalli, G, et al. Nature doi:10.1038/s41586-019-1411-0.

这一阶段更类似于研究者Nanney对表观遗传学的定义,而研究者Riggs和Holliday随后对其进行了详细阐述,研究者Bird等人则对其进行了进一步修改,即认为在DNA序列并未发生改变的情况下可替换染色质的状态是可以进行遗传的。DNA的甲基化最早被提出是作为表观遗传学信息的载体,而随后的研究工作表明,染色质蛋白和非编码RNAs对于这一过程也非常重要,比如,组蛋白的突变和修饰会直接或间接影响局部染色质的结构,而诸如此类修饰是可以遗传的,且是可逆的,而且能被控制修改,最后,高阶的3D染色质折叠也被认为能够调节基因表达从而促进遗传。

自1942年,“表观遗传学”这个词被提出以来,其被重新定义了多次;在这篇综述中,研究者用表观遗传学来表示对分子和机制的研究,这些分子和机制能在相同的DNA序列中保持替代基因的活性状态,当然了,这种操作性定义拥有多种含义了,首先,其包括跨代遗传和有丝分裂遗传,以及通过长时间存在的基因活性和染色质状态,即使是在细胞不分裂的情况下,比如在诸如成年神经元细胞等长寿的有丝分裂后的细胞中;其次,应该考虑依赖于生物系统的DNA序列,在有丝分裂遗传过程中,首先应该考虑单个细胞的基因组序列,而在跨代遗传过程中则需要考虑整个生物体的DNA,包括微生物群落等(如果这有助于遗传的话)。

最后,该定义(表观遗传学)明确地将“表观遗传”的用法扩展到了调节过程中,这些调节过程涉及参与表观遗传学的分子,即使其本身并未解决表观遗传记忆的功能,研究者认为,这种普遍的做法应该被接受,因为其向非专业人员传到了表观遗传学研究的广泛领域,此外,研究者已经记录了并不涉及染色体组分的多个案例,研究其在人类群体中的广泛传播及人群中是否会发生相似现象非常重要。

在这里,研究人员分析了调节可塑性和稳定的表观遗传之间的相互作用,包括发育期间响应生理学刺激和疾病所发生的细胞命运和重编程事件,他们讨论了非编码RNAs、DNA甲基化、异染色质、多梳蛋白(Polycomb)和三空腔结构蛋白(Trithorax)和其3D结构如何调节表观遗传和基因表达的可塑性,同时研究者还分析了新技术如何使这些现象能够从核苷酸到染色体的多个尺度上、以一种时空方式在少量甚至单个细胞中进行分析。

研究者讨论了一个非常热门的话题的证据,即跨代表观遗传,他们重点以哺乳动物为例子进行分析,因为哺乳动物具有潜在生物医学应用意义;此外,研究者还考虑了两个重要的新研究领域,即环境的潜在影响和表观遗传学改变对基因组完整性的影响,最后研究者强调了表观遗传学研究如何会使人类健康获益。


表观遗传vs可塑性

对不同生物学过程和模式生物进行研究后,研究者发现,染色质作为表观遗传信息的载体,其能在细胞分裂过程中传播活跃和沉默的活动状态,比如,酵母中的异染色质遗传、X染色体的失活、哺乳动物的基因组印记、植物的春化作用、果蝇中的位置效应花斑等;这些研究结果表明,在没有原始信号的情况下,一旦细胞分裂形成的话,差异表达状态就会在细胞分裂过程中进行传递,在诱导多能性和体细胞核转移过程中,对细胞重编程和早期胚胎发生的研究表明,染色质和DNA甲基化扮演着重要的表观遗传障碍的角色,其能有效抑制基因表达和细胞身份的改变。

表观遗传系统包括异染色质(HP1和H3K9me3(组蛋白3赖氨酸9的甲基化))、多梳蛋白(PRC1和PRC2)和三空腔结构蛋白(COMPASS(与SET1相关的蛋白复合体))复合体,这些复合体被认为能通过修饰染色质中的组蛋白并通过结合组蛋白标记来传递稳定的遗传来维持功能反应,的确,核小体会不断进行重组,组蛋白也会被交换,而且到目前为止,所有的DNA和组蛋白标记都是可逆的,尽管在不同基因组域中交换的速率和标记的稳定性会有所不一样。

如果没有紧密的自我强化循环来维持染色质状态的记忆的话,大多数调控信号都会快速丢失,此外,通过细胞分裂所遗传的表观遗传学标记需要其在DNA复制和有丝分裂中存活。

这与组蛋白修饰特别相关,因为核小体并没有基于DNA模板的复制系统,亲本的H3和H4组蛋白积累会发生在其复制前位置的几百个碱基对内,在复制过程中,其会在专用分子复合体的作用下,大致均匀分布在前导链和后随链的DNA分子上。

包括DNMT1–UHRF1, EZH2和HP1在内的染色质成熟因子能利用增殖细胞核抗原(PCNA)或复制起始识别复合体(ORC)蛋白来作为“拘束”的组分;多梳蛋白组分也能利用DNA锚定因子来传播有丝分裂的记忆,缺少靶点DNA序列元件会导致PcG蛋白缺失及果蝇细胞分裂过程中基因的沉默,近些年来,科学家们已经记录了多种有丝分裂保留的调节组分,包括转录因子和某些表观遗传学机器,通过减数分裂至少在一定程度上是可能的,比如母源性H3K27me3的积累控制DNA甲基化依赖性印记的能力;另外一种可能性就是,只有一小部分的标记可以通过减数分裂进行传递,但这可能足以在下一代中重建染色质组织。

由于亲本核小体缺少精确的复制过程,并且其会在有丝分裂和减数分裂过程中丢失多种DNA嘉禾因子和染色体相关的组分,因此单一核小体的遗传或许面临着特殊的挑战。数学模型和生物学证据表明,染色质遗传性需要建立多个甚至数百个千碱基的结构域;实际上,现在已知的基因组时按照一系列3D结构来组装的,从核小体碎片、到染色质环、再到称之为拓扑结构域(TADs)的染色体域,最后到活跃或受抑制的区室和染色体区域。

TADs和区室会稳定功能状态并驱动遗传特性发生,此外,多个表观遗传学机器会共同发挥作用来稳定遗传状态,比如,PRC2能与PRC1合作,DNA甲基化也能通过异染色质蛋白或小型RNA通路来维持。

综上所述,表观遗传会涉及多层,并且通常需要部分重叠信号的配合,最初依赖于DNA序列,每一层都会增加一定程度的稳定性,但每一层都是可逆的,允许在调控线索存在的情况下维持可塑性。在缺乏染色质结构域或没有自我增强机制的情况下,染色质状态的遗传性或许会面临挑战,这或许就需要在DNA复制和有丝分裂标记期间保留转录因子、组蛋白突变体和组蛋白修饰因子。

20191115201656_8caf07.jpg

图片来源:Cavalli, G, et al. Nature doi:10.1038/s41586-019-1411-0.

表观遗传学和DNA序列突变

DNA序列变异和表观遗传学之间有着千丝万缕的关系,染色质的状态会影响转录因子的结合,DNA序列的多态性会影响染色质的状态;染色质和DNA甲基化在人类机体中会表现出广泛的变异,此外,其还能够调节基因组的稳定性和突变性;转座子元件也是表观遗传沉默的常见靶点,其有时会受到环境的影响,从而影响基因表达和基因组完整性。

表观遗传学的基因影响效应

每个个体机体的基因组都经历了自然和环境诱导的突变,虽然大多数突变都是无作用的,但序列多态性则会影响表观基因组蓝图,比如,对来自不同祖先家庭中的父母和儿童的染色质可及性和CCCTC结合因子(CTCF)DNA结合的分析发现,每个祖先的结合位点中有相当大一部分比例都是独特的,差异主要能通过遗传变异来进行解释。

CTCF能够影响3D基因组的架构和基因表达,相关研究结果表明,表观遗传学蓝图的重新布线或会以突变作为结果经常发生,从另一方面来讲,影响组蛋白和DNA甲基转移酶或去甲基化酶(TET酶)、染色质重塑剂和包括组蛋白在内的染色质因子的突变经常会在疾病中出现,其效应效应可能会被治疗干预措施所靶向作用。DNA序列和表观遗传学改变之间通常存在着神秘的关联,这意味着突变常常可能会被忽略或被误认为是表观遗传学变异,从而导致研究者的误解。

突变发生过程中的染色质和DNA甲基化

在基因组的不同部位、生命周期的不同阶段以及癌症等多种疾病中,突变率各不相同,这依赖于细胞来源、环境暴露和癌症类型等;突变率会被DNA甲基化和核小体定位所影响,高阶染色体的折叠也会影响突变率,一项对先天性异常患者机体平衡染色体异常的大规模调查显示,在7.3%的病例中存在与已知综合征相关位点的TADs被破坏的状况。

在多发性骨髓瘤患者中,将Hi-C染色体捕获与全基因组测序相结合后研究者发现,在TAD边界处存在大量拷贝数变异断点,其常常能被CTCF结合;此外,CTCF在人类癌症中会经常发生突变,而且异染色质不活跃的X染色体的超突变也经常会在癌症中被发现,这可能是由于异常增殖细胞中DNA复制压力所致。

重复性基因组的角色

转座子是基因组中的重要组成部分,其能够潜在调节基因的功能,基因组能进化出多种物种特异性的机制来限制转座子的活性,比如通过特殊RNAs或DNA结合因子来靶向作用抑制异染色质机器;在果蝇中,异染色质依赖性的机制能促进特定转座子片段簇的表达从而产生PIWI相互作用的RNAs(piRNAs),进而抑制转座功能;piRNAs是母体所遗传的,其能通过乒乓系统来进行扩增,从而有效帮助机体抵御新的入侵,并且让基因组适应这些入侵。

环境表观遗传学

最近,研究人员开始重点关注环境对机体发育和生理学功能的影响,基因和环境之间的相互作用能帮助阐明具有相同或不同基因型的个体如何对环境变化做出反应,而表观遗传学特性在环境反应中的重要性在植物中已经得到了确认,特别是以多梳蛋白为基础的植物春花作用,但类似的过程似乎也会在一些动物物种中发生。

动物机体中的环境表观遗传学调节机制

在果蝇中,环境所诱导的表型会依赖于表观遗传学调控,其中包括跨越几代的传播,秀丽隐杆线虫也会将多种环境刺激(比如病毒感染、饥饿或温度升高)转化为表观遗传学组分的修饰,饥饿和病毒感染会通过产生小型RNAs来诱导遗传发生,这显然是没有染色质参与的;在没有RNAi的情况下,温度依赖的表观遗传涉及H3K9的甲基化机制(SET-25),这就表明,根据刺激类型的不同,RNAi机器和染色质调节子或会以不同的方式来驱动遗传的发生。

环境影响的例子绝不仅限于有机体模型中,温度就是许多爬行动物性别决定的主要因素,研究者指出,温度会影响多种动物和植物中PRC2因子的功能,这就表明,通过PRC2所介导的温度感应或许在进化上是保守的,尽管这并不是唯一可以稳定修饰染色质的环境效应。

哺乳动物中的代谢和表观遗传特性

DNA和染色质修饰能利用代谢产物,比如S-腺苷甲硫氨酸(SAM)就是DNA和组蛋白甲基化的甲基供体,叶酸和维生素B6、B12能够诱导SAM产生;α-酮戊二酸(αKG)是DNA和组蛋白去甲基化所需要的,丁二酸和延胡索酸能抑制DNA和组蛋白的去甲基化,乙酰辅酶A是组蛋白乙酰化作用的乙酰基供体,β-羟基丁酸盐能抑制1型组蛋白脱乙酰基酶,而且NAD+/NADH的比例能够调节sirtuins(III型组蛋白脱乙酰基酶)的功能。

因此,代谢的改变能够引起表观基因组中整体的干扰,而且突变代谢组分或许也能作为开发新型疗法的潜在靶点。从一方面来讲,代谢改变会影响特殊的位点并诱导持久的表观遗传学修饰,包括两代间的表观遗传学特性,目前研究人员需要通过研究识别出环境改变、代谢改变和表观遗传学组分之间的直接联系,最近有研究发现,组蛋白去甲基化酶KDM5A和KDM6A(也称为UTX)能够感知氧气浓度并调节H3K4me3和H3K27me3的水平。

跨代表观遗传学和哺乳动物中的跨代表观遗传学

现代进化合成理论认为,进化主要是通过自然选择作用于表型,最终影响DNA的序列,诸如亲本、生态、行为和文化信息等非DNA的序列信息可以被遗传,但并不会破坏进化合成的现代框架,的确,我们可以假设,DNA驱动事件的复杂链最终会驱动父母的行为和生态行为,因此,仅DNA序列就能够解释这些复杂的遗传形式,除DNA意外,其它分子也携带着大量的可遗传信息,这就代表着进化生物学中的重要概念变化。

在脊椎动物中,DNA甲基化会在每一代中在全球范围内减少两次,即受精后立刻减少一次,在原始生殖细胞发育过程中减少一次;组蛋白标记和3D基因组的组织结构也能在种系中和受精后进行重新编程。相关研究表明,TEI(transgenerational epigenetic inheritance,跨代表观遗传)在人类机体中是可能的,后期研究者还要深入研究阐明其背后的分子机制,表观基因组的关联性研究也将作为全基因组关联研究的补充,从而评估DNA序列和表观基因组改变的相对贡献。

20191115201657_913ec3.jpg

图片来源:Cavalli, G, et al. Nature doi:10.1038/s41586-019-1411-0.

表观遗传学、健康和和疾病

DNA甲基化水平的改变、组蛋白的修饰和非编码RNA的改变在疾病中很常见,其是表观遗传学组分的突变,在表观遗传学改变中有效区分司机和乘客角色的能力,将能帮助研究者有效识别表观遗传特性如何影响疾病的诊断、预后和疗法;而深入解析表观遗传学组分和其它疾病之间的相互作用或许也能帮助研究人员开发出新型组合性干预疗法。

衰老的表观遗传学特性

机器学习在高通量DNA甲基化数据中的应用已经能够帮助研究者确定年龄或生理年龄的指标,有研究就发现,在353个基因组位点上的CpG甲基化的改变能够产生一个与组织年龄高度相关的分数,对不同年龄分子预测因子的比较表明,表观遗传学时钟与生物年龄的相关性最高;此外,表观遗传学年龄也能被较高的BMI反向影响,在所调查的353CpGs中,许多位于二价基因的稳定启动子或活性启动子附近,这就表明,衰老可能与某些二价基因的表达的可塑性降低有关,这些基因可能会被分解为受抑制或活跃的状态,而活跃的基因则会改变其表达水平。最近研究人员确定了一组CpG基因组位点,其或能更好地帮助预测寿命和人类的健康跨度;建立老化过程和CpG甲基化变异之间的机械关联对于阐明机体老化的原因至关重要。

发展中的表观遗传学和疾病

根据流行病学研究,研究者Barker提出了胎儿或健康和疾病发生的起源假说,研究表明,在宫内胎儿发育或儿童早期的特定敏感时期,暴露于化学物质、药物、压力或感染等环境因素中可能会使得个体在成年后更易患病,而后来的研究结果表明,表观遗传学组分或许也能介导一些效应的产生;影响癌症易感性和生物学特性的标贯基因组的长期变化也会被记录下来,其它需要集中研究的领域则包括肥胖和糖尿病、神经性障碍和年龄相关的疾病,比如帕金森疾病和阿尔兹海默病等;胚胎发育和早期生活是两个主要的易感性窗口,在此期间,表观遗传编程对环境影响非常敏感,比如饮食、温度、环境毒素、母源性行为或童年虐待等,行为分子遗传学研究确定了第三个易感性窗口,即青春期,在此期间,不良的生活经历会影响机体焦虑、抑郁和攻击行为的风险,其与特定基因的甲基化水平或HDAC1水平的改变有关。

此外,记忆的形成、对环境刺激物的行为效应都与选择性位点的组蛋白的改变和DNA的修饰有关;后续研究中,研究人员还需要阐明是否这些修饰改变存在因果关联;更有意思的是,研究者还发现,小鼠低水平的母源性关爱会降低L1启动子中DNMT3a和DNA甲基化的水平,同时还会诱导海马体中L1元件的动员,这就表明,环境因素改变或会引发遗传和表观遗传学特性同时发生改变。

癌症表观遗传学

对特性类型癌症或癌症基因组数据库进行全基因组关联性研究后,研究者鉴别出了编码表观遗传元件的基因的频繁突变,这其中就包括DNA甲基化酶和去甲基化酶的突变等,但诸如IDH1和IDH2等代谢基因往往会影响组蛋白和DNA的甲基化,可能还会干扰3D基因组架构;重复性的DNA元件会引发癌症,比如在霍奇金淋巴瘤中,IRF5转录因子基因的转录是由位于启动子上有的正常休眠的内源性逆转录病毒长末端重复的DNA低甲基化所诱导的,在其它肿瘤中,DNA的去甲基化因子则会带来相反的效应,尽管表观遗传扰动通常伴随着癌症驱动基因的突变,但在小鼠研究中也有零星的病例报道,即便是在没有明显DNA突变的情况下也能够诱发癌症。

对胰腺癌转移的分析中,研究者并未揭开明显的驱动突变,取而代之的是大规模的染色质重编程,在很多染色体结构域中H3K9me3的水平都会发生改变,相关研究结果表明,表观遗传学改变可能在特定情况下会使致癌过程的主要驱动因素。

表观遗传学机制会缓冲环境的改变,同时其还允许对极端环境产生可塑性的反应,从某种意义上来讲,表观遗传学正在回归并扩展到研究者Waddington最初的定义,人们对表观遗传学的一个常见误解就是,其是摆脱DNA编码命运的自由载体。

20世纪下半叶的重大发现使得人们对DNA在进化、生物学和医学中所扮演的角色产生了极大的兴趣,从而使得DNA成为了“生命之书”。机体表型取决于基因组组成、表观遗传学组分和环境输入信息的特定组合,随着基因组学、生物化学和遗传学越来越复杂的方法的出现,最终研究人员就能够阐明表观遗传学机制影响机体生命、遗传和进化的精细化分子机制。

如今研究人员就能够通过研究来分析表观遗传学机制对于生物学过程、衰老后疾病是否重要,而且相比DNA突变而言,表观遗传学改变也变得越来越容易逆转,而且其靶向性也越来越强,这就使得研究人员能从功能上来检测表观遗传学组分在特定疾病中的相关性,并且利用其来作为疗法预后和诊断的标记,同时也能使其成为开发新型疾病疗法靶点,这条研究道路将会深化科学家们的认识,开发造福人类的新型疗法,而今表观遗传学研究领域终于走向了成熟。

参考资料:

Cavalli, G., Heard, E. Advances in epigenetics link genetics to the environment and disease. Nature 571, 489–499 (2019) doi:10.1038/s41586-019-1411-0

https://www.nature.com/articles/s41586-019-1411-0?ADUIN=627251056&ADSESSION=1573284688&ADTAG=CLIENT.QQ.5603_.0&ADPUBNO=26933#userconsent#

来源:IMICAMS 中国医学科学院医学信息研究所

原文链接:http://mp.weixin.qq.com/s?__biz=MzUxNzc5MzUwNw==&mid=2247484985&idx=1&sn=2c19477643890608be4ac3eea9c955f1&chksm=f993f5b5cee47ca366dafce98341f9f62f02531cf1fb34f1ad25fe88ef334e17433eed37158e&scene=27#wechat_redirect

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

相关推荐 换一换

  • 邹蕾
    0
    长期以来,生物学家一直在试图理解受精卵是如何形成由数百种特殊细胞类型组成的有机体的,每一种类型的细胞都会表达一组特定的基因,而细胞的身份如今被认为是特殊基因组合表达所产生的结果。
  • 贾秀兰
    0
    近年来改变科学家们对生物学理解的一些研究进展;我们讨论了表观遗传学和DNA序列改变之间的相互作用,以及表观遗传学对细胞记忆和可塑性的影响,同时我们还考虑了环境以及代际和跨代表观遗传学对生物学、
  • 解福燕
    0
    ,高阶的3D染色质折叠也被认为能够调节基因表达从而促进遗传。
没有更多了