人物

首页 - 全部文章 - 人物 - 普瑞基准梁晗:大数据挖掘助力免疫治疗研究新发现 | 第五届精准医疗与基因测序大会主题报告

普瑞基准梁晗:大数据挖掘助力免疫治疗研究新发现 | 第五届精准医疗与基因测序大会主题报告

2019年6月29日,“第五届精准医疗与基因测序大会”在北京协和学术会堂隆重召开。过去五年间,在精准医疗理念的指引下,新的实验技术不断涌现,数据总量急速增长,数据维度不断扩展;与此同时,生物信息学和大数据技术的蓬勃发展,赋予我们理解和应用数据的能力,使得人类对于个体与疾病的认识更加深刻、全面。作为生物信息和肿瘤多组学领域的顶尖科学家,MD安德森癌症中心生物信息学与计算生物学系副系主任、普瑞基准联合创始人梁晗教授向大会听众分享了他的独到见解。在题为《大规模癌症组学数据的深度挖掘助力免疫治疗研究的新发现》的精彩演讲中,梁晗教授深入阐述了多组学数据的深度挖掘是如何为免疫治疗研究提供新思路、新方法,并催生出新发现的。

生物信息,从支持到主导

The Cancer Genome Atlas(TCGA)是一个里程碑式的肿瘤多组学研究项目,通过对涵盖33种癌症超过11000名病人的全方位信息采集和全景式组学描述,使人类对于肿瘤的认识迈上了新的台阶。在这个过程中,生物信息不再仅仅扮演着辅助支持的角色,而是成为了主导性的力量。梁晗教授认为,生物信息工作者的主要任务有两个:一是为生物学数据的分析、挖掘提供高效易用的工具,如梁晗教授团队在过去几年间开发的蛋白组学数据分析工具TCPA,聚焦于病人生存数据分析的SurvNet,长链非编码RNA研究工具TANRIC以及细胞系比较研究工具MCLP等;二是跳出单一癌症的范畴,实现对泛癌种的系统化地描述,从而更为深入地了解癌症的分子机制为了做到这一点,我们往往需要打破前人的框架,摆脱惯性思维的束缚,在跨癌种的数据中找出隐含的规律。

图:梁晗教授介绍TCGA研究项目

革命性疗法中的创新性思维

梁晗教授指出,免疫疗法是近年来得到迅速发展的针对癌症的革命性疗法。这种“革命性”首先体现为理念的创新,即通过增强免疫系统的能力,借助T细胞去杀灭癌细胞。然而目前的肿瘤免疫治疗仍然面临一些挑战。首先,平均只有20%~30%的患者能够对免疫治疗产生应答;其次是接受免疫治疗的患者常常出现副作用;另外该怎样找到真正能够让免疫疗法起作用的新生抗原(neoantigen)也是一个挑战。针对上述问题,梁晗教授结合团队近年来研究成果,提出了三个重要观点:

一、抗体阻断不是检查点抑制的唯一方式

增强子(enhancer)是基因调控的重要方式,DNA的三维结构使得增强子可以靠近启动子(promoter)从而启动转录和表达。那么到底哪些增强子调控了哪些基因?为了回答这个问题,我们不能仅仅关注共表达关系,而应该进一步关注这些共表达的增强子-基因的配对中,哪些增强子上的SNP产生了eQTL信号,从而确定其调控因果关系。进一步地,通过Hi-C技术检测这些增强子和基因的物理位置关系,可以更好地构建起增强子的调控网络。

正是利用上述方法,梁晗教授团队鉴定出9号染色体上的Enhancer-9很可能调控着PD-L1的表达。在细胞系中利用CRISPR-Cas9系统“剪掉”Enhancer-9之后可以观察到PD-L1表达水平的急剧下降,提示我们可以通过基于RNA层面的干预技术调控PD-L1的表达,进而为免疫治疗提供了新的思路。

二、体细胞变异不是突变的唯一来源

肿瘤突变负荷(TMB)是目前常用的预测免疫治疗效果的检测指标,通常认为TMB水平越高,患者就有更大的可能性产生新生抗原,从而对免疫疗法产生更好的响应。梁晗教授指出,RNA编辑(RNA-editing)和体细胞变异一样,都可以产生氨基酸的变化。那么肿瘤组织中,到底有多少氨基酸改变来自于体细胞变异,有多少来自于RNA编辑呢?TCGA中的大规模多组学数据成为了解开这个谜题的钥匙。研究发现,样本通过全外显子组测序鉴定出的3860个体细胞变异,经过一系列的质控过滤后有56个变异被认为导致了氨基酸的改变(受限于蛋白质谱的检测深度)。同样地,3741个RNA编辑事件中有34个导致了氨基酸变化。后续实验发现经过RNA编辑的CCNI肽链可以作为肿瘤新抗原激发免疫反应,因此RNA编辑也是肿瘤新生抗原的重要来源,应该作为免疫治疗中的一个重要因素或线索被我们重视。

三、基因标志物不是唯一选择

传统的寻找预测标志物的方法是利用大规模的组学测序采集足够多的数据,再借助统计学或机器学习的方法找出与生存、预后等临床指标相关的预测模型。这个方法的问题在于,机器学习的过程对于医生而言是一个“黑盒子”,很难让我们对于肿瘤的生物学本质有更好的理解。另一方面,模型对于其他癌种,其他药物的预测能力可能会大打折扣。

人类历史上的诸多伟大成就,其表现形式和思维内核往往是简单而直抵本质的。基于这样的认识,梁晗教授提出,我们可以从能量的角度去观察肿瘤形成的过程。细胞能量中有相当部分被用于氨基酸的合成,那么我们可不可以提出一个指标去描述氨基酸合成的能量效率呢?每一个氨基酸分子合成所消耗的能量是不同的。不仅如此,氨基酸被使用的次数和合成他所消耗的能量呈现出强烈的负相关性。不难想到,对于每一个基因,我们都可以算出该基因的平均氨基酸能耗ECPA(公式见下图),再加上表达量数据,还可以算出细胞的平均氨基酸能耗ECPAcell。

图:基因平均的氨基酸能耗ECPA

令人备受鼓舞的是,大规模数据分析发现ECPAcell指标对于患者生存有着极佳的预测作用,ECPAcell指标越低,患者生存期越短。如何理解这个现象呢?肿瘤在其生长的过程中,越来越倾向于使用那些较为“廉价”的氨基酸,从高耗能状态慢慢转变为低耗能状态。结合PD-L1免疫治疗的临床研究数据进行分析,可以发现ECPAcell指标可以作为一个独立的预测因子,与TMB等指标结合在一起更可以进一步提升预测能力ECPA的例子充分表明,肿瘤作为一种生物学现象,其发生发展与能量息息相关。氨基酸生物学合成的能量效率可能是肿瘤进化中的一个驱动因素。

图:梁晗教授作大会主题报告

    结  语    

梁晗教授的演讲激发了现场嘉宾、听众的灵感与热情,演讲结束后,大家纷纷举手提问。学术上的充实和严谨不足以形容本次报告的特别之处,贯穿整个演讲过程的创新思维更加引人深思。正如一味地堆砌数据量称不上大数据,倘若脱离了临床问题,缺失了创新精神,研究工作难免成为空中楼阁。梁晗教授用自己的实际经历,向听众展示了计算科学是怎样为生命科学研究插上翅膀。我们有理由相信,在大数据和人工智能的加持下,中国的医疗事业的前路必将更加光明!

(2)

本文由 SEQ.CN 作者:戴胜 发表,转载请注明来源!

热评文章