科研

首页 - 全部文章 - 科研 - 里程碑!Nature重磅发布迄今最全面的癌症全基因组图谱,涉及38种癌症类型

里程碑!Nature重磅发布迄今最全面的癌症全基因组图谱,涉及38种癌症类型

当地时间2020年2月5日,迄今为止最全面的癌症基因组图谱研究-全基因组泛癌分析研究项目(Pan-Cancer Analysis of Whole Genomes Project,Pan-Cancer Project, PCAWG )在线发表了21篇研究成果论文。Nature以封面专题形式发布了相关文章的合集,包括描述PCAWG项目的核心分析成果,以及3篇新闻观点、评论和社论文章,凸显了该研究项目及其成果的重要性。其中,Nature发表了6篇,Nature Genetics发表5篇,Nature Communications发表8篇,Nature Biotechnology发表1篇,Communications Biology发表1篇。
据悉,该项目涉及来自37个国家/地区744个组织的1300名研究人员,对38种不同肿瘤类型中的2658份原发癌及其匹配的正常组织样本进行了全基因组测序和整合分析。该大型研究揭示了大规模结构突变在癌症中所发挥的广泛作用,在基因调控区域发现了此前未知的癌症相关突变,并推断了多种癌症类型的肿瘤进化,阐明了体细胞突变与转录组之间的相互作用,同时研究了生殖系遗传变异在调节突变过程中的作用。
从获取样本、保护患者隐私、获取测序数据、分析测序数据等方面来看,该研究的工作量极为庞大。该研究项目不仅绘制了与癌症相关的突变图谱,还追溯了这些突变在癌症患者体内的发生。例如,Francis Crick研究所的科学家开发了一种新方法来揭示个体中肿瘤细胞携带的哪些突变发生于何时,包括鉴定那些在癌症显现前几年发生的突变。
下面我们先系统了解一下发表在Nature的6篇文章。
一、癌症驱动突变

第一篇文章题为“Pan-cancer analysis of whole genomes”。该研究整体描述了通过使用计算云进行国际数据共享来促进PCAWG基因组资源的生成。研究团队分析了来自38种肿瘤类型的2658个肿瘤全基因组,展示了PCAWG项目相关数据的广度与深度。结合编码和非编码基因组元件分析,平均每个癌症基因组携带有4~5个驱动突变,然而大约5%的案例中没有发现任何驱动突变,表明目前对于驱动突变的了解或者发现并不完全。此外,许多肿瘤的簇状结构变异都出现在染色体上,这通常是肿瘤进化的早期事件。文章描述了非编码突变、识别了导致碱基替换、小片段插入和缺失以及结构变异的突变过程的新特征;分析了肿瘤演化的时机和模式;描述了体细胞突变对剪接、表达水平、融合基因和启动子活性的多种转录结果;并评估了癌症基因组的一系列特征。
二、结构变异

第二篇文章题为“Patterns of somatic structural variation in human cancer genomes”。癌症中的关键突变过程是结构变异,其基因组片段范围可从千碱基到整个染色体大小。该研究分析了2658个肿瘤基因组的体细胞结构变异。研究人员开发了对体细胞结构变异进行分组、分类和描述的方法,共发现了16种结构变化的特征。例如,片段缺失在各种肿瘤类型和患者中分布不均,在后期复制区域富集并与倒位相关。基于复制的重排机制可生成具有低拷贝数增益和频繁倒排重排的各种染色体结构。癌症中存在各种各样的重排过程,这些重排过程会产生复杂的基因组构型。
三、突变特征

第三篇文章题为“The repertoire of mutational signatures in human cancer”。体细胞突变可由多种原因造成,包括外源因素和内源因素。为分析这些突变的特征,研究人员从4645个全基因组测序和19184个外显子测序获得的84,729,690个体细胞突变中分析得到了81个突变特征:49个单碱基替换特征、11个双碱基替换特征、4个群碱基替换特征和17小插入/缺失特征。这些突变特征包含了已报道的和新发现的突变特征。尽管许多突变特征的原因不明,通过估计每个突变特征对单个癌症基因组突变的影响,该研究揭示了突变特征与外源或内源性暴露以及有缺陷的DNA维持过程的关联,为了解人类癌症发展的突变过程提供了系统性的分析观点。
四、肿瘤进化

第四篇文章题为“The evolutionary history of 2,658 cancers”。癌症是通过体细胞进化的过程而发展的,该研究通过对2658种癌症的全基因组测序分析,重建了38种癌症的突变过程和驱动突变序列的克隆和进化。研究发现,早期肿瘤发生与某些驱动基因突变以及特定的拷贝数增加有关。在整个肿瘤演化过程中,有40%的样本突变谱发生了显著变化。驱动基因近4倍的多样化和基因组不稳定性增加是晚期的特征。分析表明,驱动突变通常要比诊断早很多年,甚至几十年。这些变化共同决定了癌症的发展轨迹,并突出了早期癌症检测的重要性。
五、RNA改变

第五篇文章题为“Genomic basis for RNA alterations in cancer”,北京大学张泽民教授团队参与了该研究。RNA改变通常是由癌症基因组的体细胞变化引起的,RNA改变包括过表达、异常剪接、基因融合等。该研究报告了迄今为止最全面的癌症相关基因改变的目录。研究团队将将几类RNA改变与生殖系和体细胞DNA变异相关联,并确定了可能的遗传机制。通过结合全基因组数据和转录组数据,研究人员发现了649个影响基因表达的单核苷酸突变,其中68.4%涉及与该基因侧翼非编码区的关联;1900个与突变相关的异常剪接;82%的基因融合与结构变异有关。这些转录组改变在不同癌症类型中有不同的特征,是不同的,并且与DNA突变特征的变化相关。在基因组背景下,这种RNA改变为鉴定与癌症相关的功能基因和机制提供了丰富的资源。
六、非编码区域改变

第六篇文章题为“Analyses of non-coding somatic drivers in 2,658 cancer whole genomes”。通常,癌症驱动突变多在编码区域发现,但编码序列仅占全基因组的1%。该研究分析了2658个肿瘤基因组中非编码区域的驱动突变和结构变异。鉴于非编码区域的复杂性,研究人员开发了不同的算法系统鉴别上述变异,并发现了新的驱动突变。例如,TP53基因非编码区的一个复发突变,TRET非编码区的一个突变与该酶过表达有关等。虽然驱动癌症的点突变和结构变异在非编码基因和调控序列中的频率比在蛋白质编码基因中的频率低,但随着更多癌症基因组的出现,将发现这些驱动因素的其他例子。
另外,发表在Nature Genetics的文章,涉及内容包括线粒体、拓扑相关结构域、LINE-1逆转录转座子、病毒感染、染色体碎裂与癌症的关系。发表在Nature Communications的文章内容为多元组学数据的整合分析、癌症基因组的途径和网络分析、深度学习系统癌症分类、全基因组调控分析、癌症中端粒维持机制等。Nature Biotechnology主要报道了该研究项目中云计算与癌症基因组数据分析成果。Communications Biology的文章内容为癌症LncRNA。

Nature观点与专家评论

Nature发布的评论文章Global cancer genomics project comes to fruition中,专家指出:“这六篇文章与相关文章的发布是癌症研究和云计算的一个里程碑。该研究与世界共享了超过800TB的基因组数据,以继续探索有关癌症内部机制的新线索。这些发现的分享是无与伦比的,是长达十年的合作的成果。该研究提供了至今最完整的癌症致病突变图谱,扩展了我们对癌症测序数据的理解,丰富了我们对癌症发生发展的认识。但需要注意的是,这些研究也有一定的不确定性和局限性,例如缺少临床信息的支撑,包括治疗方法、临床收益等。”
此外,Nature还同时发表了社论,文中提到,该项目在范围和复杂性上都非常出色,它在每个步骤都面临挑战,包括获取样本、保护患者隐私、将TB级数据交付研究人员等。由于有了这些努力以及相对全面的全基因组序列,科学家们现在对导致癌症的遗传变化有了空前的认识,并且对知识缺口的存在有了更清晰的认知。癌症基因组测序已发展了超过十年时间。现在,研究人员必须应对下一个挑战,就是改善癌症患者的生活。研究人员使用测序项目积累的大量数据来寻找新的药物靶标,并产生新的生物标志物,以寻找与患者最匹配的治疗方法
在数据共享的同时,参与Pan-Cancer项目的研究人员对捐赠样本的患者的隐私保持谨慎态度。其中8名研究人员在Nature发表的评论文章中表示:“目前,基因组数据的国际行为准则至关重要。”
加州大学圣克鲁斯分校Josh Stuart参与了该项目,他表示:“这项研究提供了迄今为止基因组所有部位中致癌突变的最完整图谱。这是一项涉及全球研究人员的大规模团队科学工作。”
桑格研究所的Fierce Biotech表示:“对于我来说,其中最引人注目的发现是,了解一个人的癌症基因组与另一个人的癌症基因组有多大的不同。我们看到成千上万种不同的癌症基因突变组合,以及产生癌症突变的80多个不同的潜在过程。”
PCAWG登录页面(http://docs.icgc.org/pcawg)提供了指向多个数据资源的链接,用于交互式在线浏览,分析和下载PCAWG数据和结果。

参考资料:

1. Nature专题:Pan-Cancer Analysis of Whole Genomes

https://www.nature.com/collections/afdejfafdb/

2.Global genomics project unravels cancer’s complexity at unprecedented scale

https://www.nature.com/articles/d41586-020-00213-2

3.Genomics: data sharing needs an international code of conduct

https://www.nature.com/articles/d41586-020-00082-9

4. The era of massive cancer sequencing projects has reached a turning point

https://www.nature.com/articles/d41586-020-00308-w

5.Most Comprehensive Analysis of Cancer Genomes to Date

https://www.the-scientist.com/news-opinion/most-comprehensive-analysis-of-cancer-genomes-to-date-67067

(0)

本文由 SEQ.CN 作者:戴胜 发表,转载请注明来源!

热评文章