|
本帖最后由 邓文龙 于 2019-11-19 10:13 编辑
Nature创刊150周年—表观遗传学进展将遗传学、环境与疾病联系了起来!
2019-11-11 20:33
21世纪,表观遗传学的研究得到了快速发展,同时其产生了让研究人员感兴趣和憧憬的东西,当然了,这其中也存在一些大肆宣传的成分,本文中,我们回顾了表观遗传学在过去几十年里是如何演变的,同时分析了近年来改变科学家们对生物学理解的一些研究进展;我们讨论了表观遗传学和DNA序列改变之间的相互作用,以及表观遗传学对细胞记忆和可塑性的影响,同时我们还考虑了环境以及代际和跨代表观遗传学对生物学、疾病和进化的影响。最终,我们提出了一些对人类健康有意义的表观遗传学研究新领域。
图片来源:Cavalli, G, et al. Nature doi:10.1038/s41586-019-1411-0.
长期以来,生物学家一直在试图理解受精卵是如何形成由数百种特殊细胞类型组成的有机体的,每一种类型的细胞都会表达一组特定的基因,而细胞的身份如今被认为是特殊基因组合表达所产生的结果;表达模式必须被建立和维持,即两种不同但存在联系的过程,原始细胞的多能性及细胞类型的建立在很大程度上依赖于数百种转录因子的协同作用,这些转录因子能与特定DNA序列相结合来激活或抑制细胞谱系基因的转录。这一建立阶段通常与Conrad Waddington对表观遗传学的第一个定义最为接近,即研究在发育背景下基因型产生表型的机制;而维持阶段通常涉及大量非DNA序列特异性染色质辅因子,其能通过细胞分裂并在长时间内建立和维持染色质的状态,当然,有时候会缺少初始转录因子。这一阶段更类似于研究者Nanney对表观遗传学的定义,而研究者Riggs和Holliday随后对其进行了详细阐述,研究者Bird等人则对其进行了进一步修改,即认为在DNA序列并未发生改变的情况下可替换染色质的状态是可以进行遗传的。DNA的甲基化最早被提出是作为表观遗传学信息的载体,而随后的研究工作表明,染色质蛋白和非编码RNAs对于这一过程也非常重要,比如,组蛋白的突变和修饰会直接或间接影响局部染色质的结构,而诸如此类修饰是可以遗传的,且是可逆的,而且能被控制修改,最后,高阶的3D染色质折叠也被认为能够调节基因表达从而促进遗传。
自1942年,“表观遗传学”这个词被提出以来,其被重新定义了多次;在这篇综述中,研究者用表观遗传学来表示对分子和机制的研究,这些分子和机制能在相同的DNA序列中保持替代基因的活性状态,当然了,这种操作性定义拥有多种含义了,首先,其包括跨代遗传和有丝分裂遗传,以及通过长时间存在的基因活性和染色质状态,即使是在细胞不分裂的情况下,比如在诸如成年神经元细胞等长寿的有丝分裂后的细胞中;其次,应该考虑依赖于生物系统的DNA序列,在有丝分裂遗传过程中,首先应该考虑单个细胞的基因组序列,而在跨代遗传过程中则需要考虑整个生物体的DNA,包括微生物群落等(如果这有助于遗传的话);最后,该定义(表观遗传学)明确地将“表观遗传”的用法扩展到了调节过程中,这些调节过程涉及参与表观遗传学的分子,即使其本身并未解决表观遗传记忆的功能,研究者认为,这种普遍的做法应该被接受,因为其向非专业人员传到了表观遗传学研究的广泛领域,此外,研究者已经记录了并不涉及染色体组分的多个案例,研究其在人类群体中的广泛传播及人群中是否会发生相似现象非常重要。
在这里,研究人员分析了调节可塑性和稳定的表观遗传之间的相互作用,包括发育期间响应生理学刺激和疾病所发生的细胞命运和重编程事件,他们讨论了非编码RNAs、DNA甲基化、异染色质、多梳蛋白(Polycomb)和三空腔结构蛋白(Trithorax)和其3D结构如何调节表观遗传和基因表达的可塑性,同时研究者还分析了新技术如何使这些现象能够从核苷酸到染色体的多个尺度上、以一种时空方式在少量甚至单个细胞中进行分析。研究者讨论了一个非常热门的话题的证据,即跨代表观遗传,他们重点以哺乳动物为例子进行分析,因为哺乳动物具有潜在生物医学应用意义;此外,研究者还考虑了两个重要的新研究领域,即环境的潜在影响和表观遗传学改变对基因组完整性的影响,最后研究者强调了表观遗传学研究如何会使人类健康获益。
表观遗传vs可塑性
对不同生物学过程和模式生物进行研究后,研究者发现,染色质作为表观遗传信息的载体,其能在细胞分裂过程中传播活跃和沉默的活动状态,比如,酵母中的异染色质遗传、X染色体的失活、哺乳动物的基因组印记、植物的春化作用、果蝇中的位置效应花斑等;这些研究结果表明,在没有原始信号的情况下,一旦细胞分裂形成的话,差异表达状态就会在细胞分裂过程中进行传递,在诱导多能性和体细胞核转移过程中,对细胞重编程和早期胚胎发生的研究表明,染色质和DNA甲基化扮演着重要的表观遗传障碍的角色,其能有效抑制基因表达和细胞身份的改变。
表观遗传系统包括异染色质(HP1和H3K9me3(组蛋白3赖氨酸9的甲基化))、多梳蛋白(PRC1和PRC2)和三空腔结构蛋白(COMPASS(与SET1相关的蛋白复合体))复合体,这些复合体被认为能通过修饰染色质中的组蛋白并通过结合组蛋白标记来传递稳定的遗传来维持功能反应,的确,核小体会不断进行重组,组蛋白也会被交换,而且到目前为止,所有的DNA和组蛋白标记都是可逆的,尽管在不同基因组域中交换的速率和标记的稳定性会有所不同;因此,如果没有紧密的自我强化循环来维持染色质状态的记忆的话,大多数调控信号都会快速丢失,此外,通过细胞分裂所遗传的表观遗传学标记需要其在DNA复制和有丝分裂中存活。这与组蛋白修饰特别相关,因为核小体并没有基于DNA模板的复制系统,亲本的H3和H4组蛋白积累会发生在其复制前位置的几百个碱基对内,在复制过程中,其会在专用分子复合体的作用下,大致均匀分布在前导链和后随链的DNA分子上。包括DNMT1–UHRF1, EZH2和HP1在内的染色质成熟因子能利用增殖细胞核抗原(PCNA)或复制起始识别复合体(ORC)蛋白来作为“拘束”的组分;多梳蛋白组分也能利用DNA锚定因子来传播有丝分裂的记忆,缺少靶点DNA序列元件会导致PcG蛋白缺失及果蝇细胞分裂过程中基因的沉默,近些年来,科学家们已经记录了多种有丝分裂保留的调节组分,包括转录因子和某些表观遗传学机器,通过减数分裂至少在一定程度上是可能的,比如母源性H3K27me3的积累控制DNA甲基化依赖性印记的能力;另外一种可能性就是,只有一小部分的标记可以通过减数分裂进行传递,但这可能足以在下一代中重建染色质组织。
由于亲本核小体缺少精确的复制过程,并且其会在有丝分裂和减数分裂过程中丢失多种DNA嘉禾因子和染色体相关的组分,因此单一核小体的遗传或许面临着特殊的挑战。数学模型和生物学证据表明,染色质遗传性需要建立多个甚至数百个千碱基的结构域;实际上,现在已知的基因组时按照一系列3D结构来组装的,从核小体碎片、到染色质环、再到称之为拓扑结构域(TADs)的染色体域,最后到活跃或受抑制的区室和染色体区域。TADs和区室会稳定功能状态并驱动遗传特性发生,此外,多个表观遗传学机器会共同发挥作用来稳定遗传状态,比如,PRC2能与PRC1合作,DNA甲基化也能通过异染色质蛋白或小型RNA通路来维持。综上所述,表观遗传会涉及多层,并且通常需要部分重叠信号的配合,最初依赖于DNA序列,每一层都会增加一定程度的稳定性,但每一层都是可逆的,允许在调控线索存在的情况下维持可塑性。在缺乏染色质结构域或没有自我增强机制的情况下,染色质状态的遗传性或许会面临挑战,这或许就需要在DNA复制和有丝分裂标记期间保留转录因子、组蛋白突变体和组蛋白修饰因子。
图片来源:Cavalli, G, et al. Nature doi:10.1038/s41586-019-1411-0.
表观遗传学和DNA序列突变
DNA序列变异和表观遗传学之间有着千丝万缕的关系,染色质的状态会影响转录因子的结合,DNA序列的多态性会影响染色质的状态;染色质和DNA甲基化在人类机体中会表现出广泛的变异,此外,其还能够调节基因组的稳定性和突变性;转座子元件也是表观遗传沉默的常见靶点,其有时会受到环境的影响,从而影响基因表达和基因组完整性。
表观遗传学的基因影响效应
每个个体机体的基因组都经历了自然和环境诱导的突变,虽然大多数突变都是无作用的,但序列多态性则会影响表观基因组蓝图,比如,对来自不同祖先家庭中的父母和儿童的染色质可及性和CCCTC结合因子(CTCF)DNA结合的分析发现,每个祖先的结合位点中有相当大一部分比例都是独特的,差异主要能通过遗传变异来进行解释。CTCF能够影响3D基因组的架构和基因表达,相关研究结果表明,表观遗传学蓝图的重新布线或会以突变作为结果经常发生,从另一方面来讲,影响组蛋白和DNA甲基转移酶或去甲基化酶(TET酶)、染色质重塑剂和包括组蛋白在内的染色质因子的突变经常会在疾病中出现,其效应效应可能会被治疗干预措施所靶向作用。DNA序列和表观遗传学改变之间通常存在着神秘的关联,这意味着突变常常可能会被忽略或被误认为是表观遗传学变异,从而导致研究者的误解。
突变发生过程中的染色质和DNA甲基化
在基因组的不同部位、生命周期的不同阶段以及癌症等多种疾病中,突变率各不相同,这依赖于细胞来源、环境暴露和癌症类型等;突变率会被DNA甲基化和核小体定位所影响,高阶染色体的折叠也会影响突变率,一项对先天性异常患者机体平衡染色体异常的大规模调查显示,在7.3%的病例中存在与已知综合征相关位点的TADs被破坏的状况;在多发性骨髓瘤患者中,将Hi-C染色体捕获与全基因组测序相结合后研究者发现,在TAD边界处存在大量拷贝数变异断点,其常常能被CTCF结合;此外,CTCF在人类癌症中会经常发生突变,而且异染色质不活跃的X染色体的超突变也经常会在癌症中被发现,这可能是由于异常增殖细胞中DNA复制压力所致。
重复性基因组的角色
转座子是基因组中的重要组成部分,其能够潜在调节基因的功能,基因组能进化出多种物种特异性的机制来限制转座子的活性,比如通过特殊RNAs或DNA结合因子来靶向作用抑制异染色质机器;在果蝇中,异染色质依赖性的机制能促进特定转座子片段簇的表达从而产生PIWI相互作用的RNAs(piRNAs),进而抑制转座功能;piRNAs是母体所遗传的,其能通过乒乓系统来进行扩增,从而有效帮助机体抵御新的入侵,并且让基因组适应这些入侵。
环境表观遗传学
最近,研究人员开始重点关注环境对机体发育和生理学功能的影响,基因和环境之间的相互作用能帮助阐明具有相同或不同基因型的个体如何对环境变化做出反应,而表观遗传学特性在环境反应中的重要性在植物中已经得到了确认,特别是以多梳蛋白为基础的植物春花作用,但类似的过程似乎也会在一些动物物种中发生。
动物机体中的环境表观遗传学调节机制
在果蝇中,环境所诱导的表型会依赖于表观遗传学调控,其中包括跨越几代的传播,秀丽隐杆线虫也会将多种环境刺激(比如病毒感染、饥饿或温度升高)转化为表观遗传学组分的修饰,饥饿和病毒感染会通过产生小型RNAs来诱导遗传发生,这显然是没有染色质参与的;在没有RNAi的情况下,温度依赖的表观遗传涉及H3K9的甲基化机制(SET-25),这就表明,根据刺激类型的不同,RNAi机器和染色质调节子或会以不同的方式来驱动遗传的发生。
环境影响的例子绝不仅限于有机体模型中,温度就是许多爬行动物性别决定的主要因素,研究者指出,温度会影响多种动物和植物中PRC2因子的功能,这就表明,通过PRC2所介导的温度感应或许在进化上是保守的,尽管这并不是唯一可以稳定修饰染色质的环境效应。
|
|