来源:iNature
经过二十多年的改进,当前的人类参考基因组(GRCh38)是有史以来最准确,最完整的脊椎动物基因组。然而,没有一条染色体首尾相接,数百个未解决的缺口仍然存在。2020年7月14日,美国加州大学圣克鲁斯分校Karen H. Miga团队在Nature 在线发表题为"Telomere-to-telomere assembly of a complete human X chromosome"的研究论文,该研究首次“从头到尾”(从端粒到端粒)确认了人类X染色体的完整序列,其中不存在任何缺口,它的精确度达到了前所未有的水平。这些新的序列将被整合到未来的人类参考基因组版本中。此外,完整的X染色体与超长纳米孔数据相结合,使研究人员首次能够绘制出复杂串联重复序列和卫星阵列的甲基化图谱。该研究结果表明,完成整个人类基因组的工作现在已经触手可及,此处提供的数据将使正在进行的工作,能够完成剩余的人类染色体。完整的端粒对端粒参考组装对于确保发现和研究所有基因组变体是必不可少的。目前,人类基因组的未解析区域是由围绕着着丝粒的区域中的多兆碱基卫星阵列,近端短臂上的rDNA阵列以及富含节段重复的区域,这些区域的长度大于数百千个碱基,且旁系同源大于98%。由于缺乏参考基因组序列,这些重复序列通常被排除在遗传学和基因组学研究之外,从而限制了关联和功能分析的范围。未解析的重复序列还会导致意想不到的后果,例如将旁系同源序列变异错误地称为等位基因变异。预计整个人类基因组的完成将有助于我们对染色体功能,人类疾病和基因组变异的理解,这将改善生物医学中使用短读映射到参考基因组的技术(例如RNA-seq,ChIP-seq,ATACseq)。
从许多相对较短的测序读取中重建基因组的根本挑战(一种称为基因组装配的过程)是将重复序列彼此区分开。解析此类重复序列依赖于足够长以覆盖整个重复序列的测序读码,或基于独特变体足以区分每个重复序列副本的准确度。人类基因组在2001年首次发布后20年仍未完成,这突出了组装问题的难度和过去技术的局限性。美国国家生物技术信息中心(NCBI)发布了第一个人类参考基因组。该基因组高度片段化,一半的基因组包含在500 kbp或更高的连续序列(contig)中(NG50)。Genome Reference Consortium(GRC)的专门整理工作和持续的管理,极大地提高了最新版本GRCh38中NG50重叠群长度,但基因组中最重复的区域仍未解决,并且没有染色体完全代表端粒至端粒。
最近从头组装的超长(> 100 kb)纳米孔测序技术显示了在最困难的区域中有希望的组装连续性,但是这个概念验证项目将基因组测序的覆盖深度仅为5倍,无法组装最大的人类基因组重复序列。先前基于人类基因组中大重复序列的大小和分布的建模预测,如果将30次超长读段组装在一起,将接近人类参考基因组。因此,高覆盖率超长读取纳米孔测序将使人类染色体的第一个完整组装成为可能。
为了避免组装二倍体基因组的两个单倍型的复杂性,该研究选择了有效的单倍体CHM13hTERT细胞系进行测序(简称CHM13)。该细胞系衍生自具有46,XX核型的完整葡萄胎。这样基因组来自单个精子,该单个精子经历了减数分裂后的染色体复制,因此对于一组等位基因是纯合的。CHM13以前曾被用来修补人类基因组参考序列等,并研究人类大规模重复序列片段。CHM13细胞系的核型分析证实了稳定的46,XX核型,没有可观察到的染色体异常。
该研究提出了超越GRCh38连续性的从头人类基因组装配,以及人类染色体的第一个无间隙,端粒到端粒装配。通过完整的葡萄胎CHM13基因组的高覆盖率,超长读取纳米孔测序,以及用于质量改进和验证的补充技术,可以实现这一点。
该研究集中在人类X染色体上,重建了约3.1兆碱基的着丝粒卫星DNA阵列,并消除了当前参考参考序列中所有29个剩余的缺口,包括来自人类假常染色体区域和癌症-睾丸两性基因家族(CT-X和GAGE)。这些新的序列将被整合到未来的人类参考基因组版本中。此外,完整的X染色体与超长纳米孔数据相结合,使研究人员首次能够绘制出复杂串联重复序列和卫星阵列的甲基化图谱。该研究结果表明,完成整个人类基因组的工作现在已经触手可及,此处提供的数据将使正在进行的工作,能够完成剩余的人类染色体。
来源:Plant_ihuman iNature
原文链接:https://mp.weixin.qq.com/s?__biz=MzU3MTE3MjUyOA==&mid=2247512164&idx=6&sn=8de2a7f9d8e314058b65ca355208439d&chksm=fce6c3bbcb914aad5917323b61ec16f21a9022a15d47de7cdbe2ee743ec795cdccd1df8cb206#rd
版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。
电话:(010)86409582
邮箱:kejie@scimall.org.cn