关于人类疾病遗传学简史

BioWorld  |   2020-07-25 15:10

来源:BioWorld

wt_a12302200725201711_71aaa2.jpg

在过去的25年里,随着技术的飞速发展,成熟的基因组数据资源以及不断更新的分析工具的出现,基因型与表型数据的大量挖掘,让人类遗传学的目标:确定影响机体功能的DNA变异序列,特别是与人类疾病相关的变异序列,有望得以实现。遗传学的发展让我们对许多罕见病和常见疾病机制有了更加透彻的认识,并有效推动了疾病的预防和治疗。现代医学将更加致力于精准个体遗传治疗模式的开发。

近日,来自牛津大学的Mark I. McCarthy在Nature上发表了综述文章:A brief history of human disease genetics统回顾了人类疾病遗传学发展的里程碑事件,详细枚举了遗传变异与功能表型关系的全基因组分析方法和未来十年发展的策略和方向,并总结反思人类疾病遗传学领域研究获得的经验教训。
wt_a12302200725201711_74fd71.jpg

01

罕见病与罕见变异

在1980s到1990s期间,遗传学研究致力于研究罕见单基因遗传病。疾病的分析研究是由多重谱系的连锁分析来精确定位的,技术方法则主要使用Sanger测序法对引发疾病的突变的连锁基因进行鉴定。致病基因的评估会对多个患病家庭致病突变基因进行分离,并同时会在健康个体中获得风险基因型的证据。致病基因评估也会利用细胞和动物模型进行功能性研究确认验证人样本中的结果。这种方法效率较低,并且花费较大。到2000年,已经鉴定出了约7000种单基因遗传疾病中约1000种疾病,包括具有亨廷顿氏病和囊性纤维化等。

人类基因组计划的完成降低了致病基因突变研究的困难,推动了罕见单基因遗传病致病基因鉴定数量达四倍的增长。

目前基于微阵列的结构变异检测以及外显子组和全基因组测序对遗传疾病的检测已变得至关重要,这些技术是通过计算机分析从而鉴定致病基因变异情况。对不同种族背景下的人口遗传变异进行分类的数据集成熟度也不断提高,有力地支持了基因变异到表型变化推论的可信度。近几年,高通量测序技术的采用使得鉴定出从单个突变到大型结构重排的因果遗传变异成为可能。这些技术已从基础研究扩展到临床应用,推动了对遗传疾病的更早,更快的诊断。

罕见疾病致病基因的发现使少数具有相似临床表现的个体的基因表征转变为更大的表型多样患者队列的全基因组测序。这种由基因型驱动的方法已经揭示了与临床表现更加可变有关的新疾病。

对于新疾病的表征和潜在因果等位基因的诊断解释,更系统的数据共享方法也在不断发展。 共享那些被认为带有罕见未诊断遗传病的基因和表型数据的价值,已经促进了全球协作网络的设计(如Matchmaker Exchange,DECIPHER和GeneMatcher),旨在匹配具有相似遗传变异和表型的患者 。研究人员与罕见病家庭之间的互动推动了研究的速度。研究人员一旦发现了致病基因突变,便可以从患者队列中收集数据。

这些技术的临床转化受益于一系列信息资源,包括与罕见疾病相关的开放基因数据库(如OMIM ORPHANET),临床相关性突变体解释数据库(如ClinVar和ClinGen)和记录患者数据库(如DECIPHER和MyGene2,https://mygene2.org/MyGene2)。对资源进行分类以获取群体间遗传变异的资源(如ExAC,gnomAD),使人们有信心排除在群体水平数据中常见的遗传变异,而这些遗传变异可能是罕见性早期发病遗传疾病的合理原因,这些分析减少了不能解释疾病原因的变体对数据库的污染,并解决了由于对多重谱系的研究而引起的疾病外显率过高估计。对许多单基因疾病等位基因可变外显率的认识得到了改善,这促使研究将致力于确定引起遗传和环境变化的因素。

尽管在将特定基因与特定疾病相关联方面已取得了巨大进展,但是在这些基因中建立单个突变的因果关系仍然存在问题,许多疑似的罕见遗传疾病仍未得到明确的诊断。即使对于具有确定因果关系的变体,其外显率通常也不一致。解决这些不确定性正是该领域目前的主要挑战。来自大量病例和人群样品的测序数据的综合分析将为可靠解释突变体与外显率之间的关系提供所需的证据。同时进行的体外细胞功能检测可以评估疾病相关基因中突变体的功能效应。使用RNA测序和DNA甲基化测定法对疾病相关的组织进行功能基因组探索,可以识别以前未发现的隐性因果遗传突变,特别是在基因中编码区之外未充分研究的区域。这些领域中的每一个领域的发展都将扩展突变体和遗传的范围,从而可以向患者及其家人提供诊断和预后信息。

02

普遍性的疾病

对于具有较复杂的多因素病因的常见晚发性状,应用多重谱系连锁反应大多是失败的,例如哮喘,糖尿病和抑郁症这些疾病。

在认识到基于谱系关联的研究方法更侧重于检测突变等位基因频率与表型相关的差异后,识别较低外显性的常见等位基因方向则变得具有更大的吸引力,研究学者也将注意力转移到对照样品的分析上。但是,最初针对候选基因内突变体的识别受到技术限制,筛选门槛过于宽松以及对偏见和混淆因素的辨别不足,从而导致研究失败。

最初通过HapMap联盟对表征基因组范围的全基因组模式进行系统性分析后将基因组的等位基因结构被分割为单倍型模块,每个模块均包含相关突变体集。认识到这种模式可以支持全基因组关联调查,从而开发出新技术即基因分型阵列的分析技术。从而使此类研究成为可能。关于急性黄斑变性和炎性肠病的研究成果令人鼓舞。在其他几个方面也取得了进展,包括研究规模的扩大,基因分型排列的密集,用于归因的新颖策略,对偏倚的关注和适当选择的显著性阈值,为各种疾病的研究提供了强有力的支持。早期的全基因组关联研究(GWAS)分析发现的突变体是非常常见的,其影响比研究预期的要小很多。通过对来自多个GWAS研究的数据进行汇总和综合分析发现,常见的突变体会形成一系列特异性的基因和功能富集,大量的基因和功能之间的关联图谱得以确定。最近,通过直接关联分析和归因,增加了对外显子组和全基因组序列数据的分析深度,将发现和分析范围扩展到了GWAS以前无法探究的低频和罕见的等位基因。

自从使用GWAS的十年来,人类也致力于揭示常见疾病的遗传基础。研究发现常见病不单单是孟德尔遗传条件的聚集。对于多数复杂的性状,遗传易感性在上千种变异体中都存在,对个体患病率无明显影响。

对于大多数疾病来说,来自欧洲的样本信息不成比例地推动了大型GWAS综合分析工作。在主要人群中,遗传导致的疾病易感性模式大致相似。在一个人群中发现的许多常见风险等位基因在其他人群中也是可检测的,而等位基因的频率在不同人群中却有很大差异。将GWAS和基因测序研究扩展到不同人群则定会产生大量未发现的风险等位基因。对常见突变体和罕见突变体的研究表明,对于许多性状,特别是具有晚期外显的性状,自然选择所发挥的作用有限。

尽管人类内部广泛的连锁不平衡对于GWAS的发现至关重要,但突变体之间的高度相关性使这些关联的特定突变体的定位受挫。样本数量的增加,对跨民族数据质量的改善以及更具有代表性的参考数据为改善突变体与因果关系的分辨率以及研究其运作的分子机制提供了一条途径。对于编码区内序列的突变造成的后果,功能方面的解释也许是最容易的。然而,大多数常见的疾病相关的突变体往往映射到非编码区序列,并切研究认为突变体通过影响转录调控来影响疾病易感性。对于许多性状,涉及同一疾病的基因之间存在明显的特定信号通路的富集,并且GWAS分析会发现这些突变基因与已知疾病相关的细胞类型中特异性的调控元件中富集。这也验证了即使与疾病相关联基因突变数量激增,这些关联也将在特定信号和细胞过程中汇合,并在发病机理中发挥核心作用。

来源:ibioworld BioWorld

原文链接:https://mp.weixin.qq.com/s?__biz=MzU1MzMxMzcyMg==&mid=2247504851&idx=6&sn=a4ce4f1651d84e854aa185c5d5cec493&chksm=fbf62706cc81ae103dcb2e8dc97dfbe12ad6fd3c91ec9b0860ce92aa0d309cb26d5cf2567ce0#rd

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn

相关推荐 换一换