科研

首页 - 全部文章 - 科研 - 开启基因组学研究新纪元!Nature发布首个人类X染色体完成图,长读长测序尽显优势

开启基因组学研究新纪元!Nature发布首个人类X染色体完成图,长读长测序尽显优势

基因组学研究领域再次迎来了重大进展!

当地时间7月14日,由加州大学圣克鲁兹分校(UCSC)和美国国家人类基因组研究所(NHGRI)研究人员领导的国际端粒到端粒联盟(Telomere-to-Telomere Consortium,T2T)于《自然》(Nature)杂志发表了重磅文章,利用Nanopore ultra-long、PacBio、10X Genomics等多种测序技术,成功组装出首个端粒到端粒(Telomere-to-Telomere)的无缺口人类X染色体完成图。这项研究成果表明如今生成精确且“Gap Free”的人类染色体序列已经成为可能,也为重建完整人类参考基因组序列踏出了关键的一步

以基因组完成图为参考基因组是动植物基因组和医学遗传学研究者们孜孜以求的终极目标之一。而人类基因组完成图则有望帮助我们加深对染色体功能和人类疾病的理解,对基因组变异的全面了解将改善目前使用短读取映射到参考基因组的生物医学中的驱动技术。在人类基因组测序组装发展历程中,科学家们陆陆续续发布一系列参考基因组版本。2001年人类基因组计划公布了首个人类参考基因组,2009年,基因组参考联盟(GRC)发布了人类参考基因组版本GRCh37。2013年人类参考基因组第20个版本——GRCh38发布,被认为是世界上测序最准确、最完整的脊椎动物基因组,不断“修修补补”使用至今。事实上,尽管经过了近二十年的改进,但人类基因组尚未解决的区域还有很多。而这些部分很难被测序,同时可能包括与人类健康和疾病有关的基因和其他功能元件。因此,在人类基因组领域,端粒到端粒的完整组装是实现人基因组完成图的一个关键步骤。

“这项成就开启了基因组学研究的新纪元。” NHGRI主任Eric Green表示,“获得真正完整的染色体序列和基因组序列的能力是一个技术壮举,将有助于我们全面了解基因组功能,并为医学保健中基因组信息的使用提供指导。”据悉,本周发表于《自然》的最新成果是T2T项目的一部分,该项目由美国国立卫生研究院(NIH)下属NHGRI等机构资助,旨在产生人类基因组的完整参考序列。

人类基因组由大约60亿个碱基组成,因此DNA测序仪无法一次读取所有碱基。取而代之的是,研究人员通常将基因组分割成较小的片段,然后分析每个片段,最后将这些较短的DNA序列组装到一起。论文共同通讯作者,来自NHGRI的Adam Phillippy将这个过程比作完成一个拼图:“想象一个要重建某份拼图的游戏。如果你使用的是较小的碎片,则每块碎片都包含了较少的‘上下文’信息来弄清它的来源,特别是在拼图中某些没有独特线索的部分,例如一整片蓝天。对于人类基因组测序也是如此。直到如今,这些碎片还太小,无法将基因组拼图中最困难的部分组装在一起。”

为了迈出人基因组完成图的第一步,T2T研究团队从24条人类染色体(包括X和Y染色体)中,首先选择完成X染色体序列,因为它与许多疾病的发生密切相关,包括血友病、慢性肉芽肿病和杜兴氏肌营养不良症等。众所周知,人类的两套染色体一套来自父亲,一套来自母亲。生物学上人类女性继承了两条X染色体,一条来自其母亲,一条来自其父亲。但是,这两个X染色体并不相同,其DNA序列中存在着许多差异。在这项研究中,研究人员并没有对正常人类细胞的X染色体进行测序。相反,他们使用了一种特殊的细胞类型,具有两套相同的X染色体。该细胞系来自于一个经过减数分裂后染色体复制的精子,每条染色体都有两个完全相同的拷贝,因此没有任何等位基因变异。与仅具有X染色体单拷贝的雄性细胞相比,这种细胞可提供更多的DNA进行测序。此外,它还可以避免分析典型雌性细胞的两个X染色体时遇到的序列差异。

基因组组装中重复的解决依赖于长度足以跨越重复区域的测序read。考虑到这一点,T2T研究团队使用了高覆盖度Nanopore测序、PacBio长读长测序、10X Genomics的linked reads以及Hi-C数据的组合,组装了从端粒到端粒无Gap的X染色体序列版本。在完成组装后,研究人员估计其X染色体de novo组装的准确度超过99.99%,重建了约3.1 Mb的着丝粒周围微卫星区域,并解决了当前X染色体参考基因组中所有29个剩余的区域。由于没有“金标准”可供研究人员严格评估组装这种高度重复的DNA序列的准确性,为了帮助确认所生成序列的有效性,研究团队最后进行了多项验证操作。验证结果最终表明该X染色体的组装具有极高的连续性、完整性和正确性,超过了所有之前公布的人类基因组。

目前,T2T团队正在继续对剩余的人类染色体序列进行处理,并期望能在2020年生成完整的人类基因组序列。但潜在挑战仍然存在。例如,1号和9号染色体的重复DNA片段就比X染色体上出现的重复片段大得多。

“我们还不知道在将来新组装的序列中会发现什么。这是令人兴奋的未知数。我们正在全心全意地拥抱一个完整基因组序列的时代。”Adam Phillippy说。

参考资料:

1. Miga, K.H., Koren, S., Rhie, A. et al. Telomere-to-telomere assembly of a complete human X chromosome. Nature (2020). https://doi.org/10.1038/s41586-020-2547-7

2. NHGRI researchers generate complete human X chromosome sequence

https://www.genome.gov/news/news-release/NHGRI-researchers-generate-complete-human-x-chromosome-sequence

3. Telomere-to-Telomere Team Shares Complete X Chromosome Assembly

https://www.genomeweb.com/sequencing/telomere-telomere-team-shares-complete-x-chromosome-assembly#.Xw_Gy3ot1PY

(0)

本文由 SEQ.CN 作者:陈初夏 发表,转载请注明来源!

热评文章