尽管目前的人类参考基因组是迄今为止最准确、最完整的脊椎动物基因组,但即使经过了20年的改进,DNA序列上仍然存在空白。
当地时间7月14日,来自美国加州大学圣克鲁兹基因组学研究所的科学家们在《自然》杂志上发表论文称,他们利用名为CHM13的人类细胞系,首次完成了完整、连续的人类X染色体组装,精确度达到了前所未有的水平。这是基因组学领域的一个里程碑式的成就。
该研究的主要作者、加州大学圣克鲁兹基因组学研究所的Karen Miga说:“新的测序技术,如我们首创的纳米孔测序技术,使读取‘超长reads’成为可能,这是项目成功的关键。”
重复序列在整个基因组中非常常见,给测序带来了很多挑战,因为大多数测序技术产生的都是相对较短的“reads”,需要像拼图一样把它们拼在一起来组装基因组。重复序列会产生许多看起来几乎一模一样的reads,就像拼图中的大片蓝天,人们无法知道它们该怎么组合在一起,也不知道有多少次重复。
“这些重复序列富集的基因组区域曾经被认为是难以处理的,但现在我们在测序技术上取得了飞跃。通过纳米孔测序,我们获得了跨越整个重复区域的数十万碱基对的超长reads,从而绕过了一些挑战。”Miga说。
新研究将2018年发明的纳米孔测序技术与PacBio和Illumina公司的其他测序技术,以及BioNano基因组公司的光学图谱相结合,制作出了一个完整的基因组组合,在连续性、完整性和准确性方面均超过了之前所有的人类基因组组合,甚至在某些指标上超过了当前的人类参考基因组。
除了读取超长reads外,纳米孔测序还可以检测被甲基化修饰的碱基。通过绘制X染色体的甲基化模式,研究人员确认了之前的观察结果,并揭示着丝粒内甲基化模式的一些有意思的趋势。
这项研究填补了人类基因组序列中剩余的空白,开辟了基因组的新区域。研究人员可以在这个区域寻找序列变异与疾病之间的关联,以及有关人类生物学和进化重要问题的相关线索。
Miga说:“在人类基因组参考序列中存在空白的一些区域实际上是变异最丰富的区域之一,因此我们一直缺失了许多可能对理解人类生物学和疾病很重要的信息。”
科界原创
编译:花花
审稿:alone
责编:程建兰
期刊来源:《自然》
期刊编号:0028-0836
原文链接:
https://phys.org/news/2020-07-scientists-human-chromosome.html
版权声明:本文由科界平台原创编译,中文内容仅供参考,一切内容以英文原版为准。转载请注明来源科技工作者之家—科界App。