其它

首页 - 全部文章 - 其它 - Science | 迄今最完整的灵长类动物基因组图谱!中国团队领衔破译灵长类动物演化之谜

Science | 迄今最完整的灵长类动物基因组图谱!中国团队领衔破译灵长类动物演化之谜

导读

作为灵长类中的一员,长期以来人类对灵长类动物的起源和演化过程一直密切关注,也正是这种非常近的亲缘性,使得人们迫切需要更全面地了解灵长类动物的遗传多样性。目前,非人类灵长类动物在生物遗传进化、药理研究等多个生物医学领域中均扮演着重要的角色,其研究结果对于人类来说具有重要参考价值。因此,研究灵长类动物的变异不仅能更好地了解和保护这些野生物种,还能帮助更好地了解人类自己。截至目前,仅有不到10%的非人类灵长类动物的参考基因组被公布和参考使用,该领域仍然有非常大的空白亟需填补。

近日,灵长类基因组计划的第一阶段成果以专刊的形式在Science发表,其中8篇论文发表在Science上,2篇论文发表在同期的Science Advances上,另有一篇研究发表在Nature Ecology & Evolution上,报道了与灵长类演化相关的一系列重要问题。研究团队利用多学科交叉技术手段对全球230多个灵长类动物基因组进行测序,公布了27种灵长类动物基因组数据,揭示了整个灵长目物种的形成模式,以及包括人类在内的灵长类物种的起源、分化过程、社会组织起源和大脑等各种生理特征的演化和遗传基础。

本次发表的系列研究报道了迄今为止最完整的灵长类动物基因组图谱,涵盖约50%地球上所有现存的灵长类物种,包含来自亚洲、美洲、非洲和马达加斯加的灵长类动物。以下为专刊的部分文章解读。

Science专刊封面

01

Science专刊的8篇论文中,旗舰文章“Phylogenomic analyses provide insights into primate evolution”,由浙江大学张国捷教授团队、昆明动物研究所吴东东教授团队、西北大学齐晓光教授团队等联合发表。研究团队对50个灵长类物种进行了长读长测序,涵盖了14个科38属,包括首次报道的27个参考基因组,其中许多来自此前较少被代表的群体。这一数据填补了已有研究数据的不足,有助于更全面地了解灵长类动物的演化历程。
研究团队首先构建了精细的现生灵长类全基因组水平系统发育树,推演出灵长类最近共同祖先出现在距今约64.95-6829百万年前。同时,重构了从灵长类共同祖先到现代人类基因组的染色体结构,发现灵长类祖先和现代人类具有保守的核型特征。但在类人猿下目祖先8号染色体发现一个新的染色体融合事件,这可能对高等灵长类的创新演化具有重要意义。
该研究揭示了跨灵长类谱系的基因组重排和基因进化的异质性。在不同谱系中,成千上万的正选择基因在神经系统、骨骼系统和消化系统中发挥着作用,并可能对灵长类动物的演化和适应性进化做出了贡献。有趣的是,研究发现了此前未被报道的类人猿共同祖先基因组变化率的增加,这可能在类人猿后来的多样化和人类的进化中发挥了作用。

图1. 大尺度灵长类高精度基因组系统发育树的构建和比较基因组学解析。物种名被黄色和蓝色的物种的基因组是该研究新产生的高质量参考基因组数据。物种名被蓝色的物种的基因组被组装成染色体水平。物种名被黑色的物种的基因组数据从公共数据库中获取。

02

在另一研究论文“A global catalog of whole-genome diversity from 233 primate species”中,研究人员展示了233种灵长类动物的高覆盖率基因组数据,代表86%的属和所有16个科的灵长类动物,其结果也为该特刊的其他几项研究奠定了基础。
研究团队使用该数据集,结合其他信息共同创建了核DNA系统发育,并重新评估了灵长类进化分支的进化分化时间。基于该数据集,估算出人类与黑猩猩的差异在9.0到6.9 Ma(Million years)之间。不同物种的突变率不同,这可能受到有效种群大小的影响。该研究还发现了此前被认为是人类特异性的错义突变的广泛存在。

图2.灵长类动物进化树

该团队还探讨了基因组变异与气候和社会性等变量之间的关系,并分析了遗传多样性评估是否与灵长类动物的灭绝风险相关。发现跨家族和地理区域的物种遗传多样性与气候和社会性有关,但与灭绝风险无关。不同物种的突变率不同,这可能受到有效种群大小的影响。此外,研究团队将来自233个物种的809个非人类灵长类动物个体的基因组与人类基因组进行比较,确定了430万个影响氨基酸组成的常见错义突变,这些突变导致了许多人类疾病。

图3. 灵长类动物跨地理区域的遗传多样性

03

亚洲叶猴,已经在地球上存在了大约1000万年,它们的祖先穿过大陆桥,分散在各大洲,适应了在热带、温带和更冷的气候中生活。西北大学齐晓光教授、李保国教授联合昆明动物研究所吴东东教授研究团队发表的题为“Adaptations to a cold climate promoted social evolution in Asian colobine primates”的文章首次系统性地揭示了800万年以来亚洲叶猴复杂社会系统演化的过程、动力和遗传基础。
研究团队分析研究了亚洲叶猴2903个栖息地,对每个栖息地提取的19个环境变量的综合生态因子进行分析,建了迄今为止最全的亚洲叶猴生态数据集。同时,该团队还开创性地建立了“行为-生态-基因组”这一全新的研究范式,完成了亚洲叶猴七个属代表物种的高质量全基因组测序,得到了全球首个染色体级别的非人灵长类基因组,进而构建精确的系统发育关系。
此外,研究还发现了亚洲叶猴的社会、环境和基因进化之间的相似之处,首次揭示了生活在寒冷地区的亚洲叶猴经历了基因变化和古代社会结构的改变,而这可能增强了他们的生存能力。

图4. 寒冷气候中的适应促进了亚洲叶猴社会行为的进化

04

另一篇研究文章“Pervasive incomplete lineage sorting illuminates speciation and selection in primates”,由浙江大学张国捷团队联合丹麦奥胡斯大学Mikkel H. Schierup团队完成。该研究解决了围绕种群间物种形成过程的问题,特别关注灵长类动物中导致基因树和物种演化树冲突的不完全谱系分流现象。
研究团队通过分析灵长类动物的29个主要祖先节点基因组数据,发现了广泛存在的不完整谱系,有些达到了基因组的64%。研究团队提出了一套全新的灵长类分子钟算法,将CoalHMM与机器学习框架相结合,研究人员重建了灵长类动物系统发育的物种形成时间,且不需要化石校准。该算法估计的物种形成时间比分化时间更接近,并且与基于化石的年代估计一致,突破了过去传统的研究模式。
研究人员还检测了在多个节点上具有低或高不完整谱系水平的区域,发现不完全谱系分选比例随着基因组区域重组率的增加而增加。与基因间区域相比,外显子中不完全谱系分类的水平总体下降,相当于局部有效群体大小减少了31%。此外,研究还报道了X染色体上低水平的不完全谱系分类。

图4. 不完全谱系分类阐明灵长类动物的物种形成和选择

05

同时,在题为“The landscape of tolerated genetic variationin humans and primates ”的文章中,西班牙进化生物学研究所联合Illumina人工智能实验室等团队解决了突变注释的一个关键挑战——缺乏足够的标记数据来有效训练大型机器学习模型。利用迄今为止最全面的灵长类动物测序数据图谱,将其与利用3D蛋白质结构的深度学习架构相结合,使人类能够在多个临床基准的变异效应预测方面实现有意义的改进。
该研究通过233种灵长类动物809个个体的全基因组测序数据,对430万个常见错义突变进行了重新分类。研究证实,在ClinVar临床变异数据库中,至少一种非人类灵长类动物中发现的人类错义突变在99%的病例中被注释为良性。总的来说,该研究将超过400万此前未知后果的人类错义突变重新分类为可能良性的,与现有临床数据库相比,注释错义突变的数量增加了50多倍。
此外,为了推断人类基因组中剩余的错义突变的致病性,研究团队利用233种灵长类动物物种测序中的常见突变训练了一种半监督的3D卷积神经网络PrimateAI-3D。通过评估PrimateAI-3D模型以及其他15种已发表的机器学习方法中区分良性和致病性突变的能力,证明了PrimateAI-3D性能优于所有其他分类器。

图:PrimateAI-3D,在数百万灵长类动物良性突变数据上训练的深度学习模型。

06

在研究文章“Rare penetrant mutations confer severerisk of common diseases”中, Illumina人工智能实验室团队及合作者利用PrimateAI-3D评估了454,712名英国生物样本库个体中罕见编码突变的致病性,旨在改善常见疾病和复杂性状的罕见突变关联检测和遗传风险预测。

在英国生物样本库外显子组数据中,研究团队对90个功能良好的临床相关表型进行了罕见突变负荷试验。用PrimateAI-3D对错义突变进行分层大大改善了基因发现。PrimateAI-3D揭示了73%更显著的基因-表型关联(错误发现率<0.05)。该研究方法鉴定的基因-表型对获得来自GWAS和相关孟德尔疾病基因的正交遗传证据的更好支持。此外,在预测罕见突变对连续临床表型的定量影响方面,PrimateAI-3D评分在现有变异解释算法中显示出最强的相关性。

图4.罕见基因突变对复杂人类特征的多基因作用,以血清胆固醇为代表。

07

杂交被认为是动物中产生物种和表型多样性的重要进化力量。但在没有多倍体化的情况下,杂交在产生物种和谱系表型多样性中的作用未被充分认识,特别是在非同源哺乳动物中。云南大学于黎研究员团队联合四川大学生命科学学院刘健全团队发表了文章“Hybrid origin of a primate, the gray snub-nosed monkey”,探索了一组濒危灵长类动物——黔金丝猴的基因组序列,重点研究了其在哺乳动物进化中的杂交,前期这种杂交在哺乳动物进化中的作用很少被研究。

金丝猴属金丝猴包括五个不同的物种,为了分析这些物种的物种形成历史,研究团队为滇金丝猴生成了染色体水平的高质量参考基因组组装,并分析了所有五个物种的106个重测序的个体基因组。通过多群体基因组分析了这些物种的基因组混合情况。
研究发现,黔金丝猴可能是由滇金丝猴/怒江金丝猴的祖先与川金丝猴在约180万年前的杂交起源的新物种。此外,在黔金丝猴灰色的扁鼻子上看到的不寻常的毛色也正是由于这种杂交混合而形成的。

图5. 黔金丝猴嵌合毛色的杂交起源及遗传基础

08

Science Advances上的一篇研究也关注了灵长类动物的杂交,由浙江大学张国捷团队、昆明动物研究所吴东东教授、郑永唐教授联合发表,题为“Comparative genomics reveals the hybrid origin of a macaque group”。研究团队比较了12个猕猴物种的参考基因组,涵盖了所有已知的猕猴种群,以确定猕猴属的物种系统发育,评估种间杂交在物种形成中的作用,并探索猕猴属混合表型的遗传基础。
研究团队分别使用纳米孔的长读长测序策略和长片段读取技术(stLFR,10X Genomics)生成了高质量的猕猴基因组,分析显示,fascicularis类群起源于345万~ 356万年前两个古老亲本谱系(原sinica和原silenus)的杂交。研究发现了许多与繁殖相关的基因,这些基因可能促成了fascicularis的混合性表型特征。该研究为猕猴的进化提供了新见解,并揭示了在灵长类动物中很少发生的杂交物种形成事件。此外,该研究提供了一种策略和一种基因组分析流程来识别杂交物种形成,为未来进一步识别和探索此类事件奠定了基础。

图6. 猕猴分布图与系统发育的不一致性

据悉,灵长类基因组计划由中国科学院昆明动物研究所牵头,中国、美国、德国、英国等多个国家超过50个科研机构及学校院所,100多位科学家共同参与,包括昆明动物所吴东东研究员团队、浙江大学张国捷教授团队、西北大学齐晓光教授团队、云南大学于黎研究员团队、西北大学李保国教授团队、四川大学刘健全团队等。科学家们希望用10年的时间,分三期完成地球上已知520多种灵长类动物的基因测序工作,绘制灵长类基因组图谱,破译这些人类“近亲”的遗传信息。

这是首个灵长类动物基因组的大规模表征研究项目。考虑到灵长类动物在整个系统发育中的位置,对数百种非人类灵长类动物基因组的研究对人类进化研究非常有价值,可以更好地了解人类基因组及独特性的基础,包括人类疾病的基础,以及未来用于保护人类健康。

参考文献:

1.https://www.science.org/doi/10.1126/science.abn6919

2.https://www.science.org/doi/10.1126/science.abn7829

3.https://www.science.org/doi/10.1126/science.abl8621

4.https://www.science.org/doi/10.1126/science.abn4409

5.https://www.science.org/doi/10.1126/science.abn8197

6.https://www.science.org/doi/10.1126/science.abo1131

7.https://www.science.org/doi/10.1126/science.abl4997

8.https://www.science.org/doi/10.1126/sciadv.add3580
(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

热评文章