结直肠癌(CRC)是胃肠道中常见的恶性肿瘤,也是全世界第三常见癌症,约占所有癌症病例的10%。CRC早期症状不明显,80%以上的患者在确诊时已为中晚期,40%以上的患者发现时已发生肝肺转移。通过实施初级预防或早期检测、靶向抗癌治疗等,可以显著降低CRC发病率并提高患者生存率。因此,目前迫切需要进一步寻找非侵入式CRC早期诊断生物标志物以及开发新的CRC治疗靶点。
蛋白质为人们了解自身健康状态提供了一个窗口,其通过细胞渗漏或活性分泌出现在血液循环中,是生物标志物和药物靶点的主要来源。已有研究发现几种循环蛋白与CRC风险相关,但这些研究大多存在蛋白质数量少、观察设计或样本量较小等局限,限制了科研人员探究蛋白质标志物在CRC风险中的因果作用。
近期,来自浙江大学、英国爱丁堡大学等机构的研究人员合作,在Genome Medicine上发表了题为“Identification of novel protein biomarkers and drug targets for colorectal cancer by integrating human plasma proteome with genome”文章。通过将人血浆蛋白质组与基因组数据相结合,研究团队进行蛋白质组范围的孟德尔随机化(MR)分析,以系统地识别与CRC风险相关的循环蛋白生物标志物。研究团队对4,853种血浆蛋白与CRC风险之间的因果关联进行了全面研究;采用单细胞类型表达分析来检测结肠肿瘤组织中富集的细胞类型,并进行成药性评估,以探索其作为CRC治疗靶点的潜力。
文章发表在Genome Medicine
总研究设计如图1所示。研究团队采用了来自7项大规模血浆蛋白质组研究的蛋白质数量性状位点(pQTL)数据,并提取4,853个循环蛋白质标志物的汇总数据;在大规模GWAS荟萃分析、FinnGen队列和UK Biobank队列中,使用两个阶段(发现和复制)蛋白质组范围的MR框架检测其与CRC的遗传关联。利用贝叶斯共定位、基于汇总数据的MR(SMR)和HEIDI测试来验证候选蛋白质生物标志物与CRC之间的因果关系。进一步通过单细胞类型表达分析、蛋白质-蛋白质相互作用(PPI)和成药性评估,优选潜在的治疗靶点。
图1. 研究设计流程图。
全蛋白质组MR分析鉴定出13种与CRC相关的循环蛋白
依据上述研究流程,研究团队使用Wald ratio或IVW方法对4,853种血浆蛋白进行了分析,经Bonferroni校正后,发现共有13种蛋白质与CRC风险显著相关(图2)。基因预测显示,较高水平的GREM1和CHRDL2与CRC风险增加相关;其他11种蛋白(CLSTN3、POLR2F、ADPGK、CSF2RA、CSAG1、STXBP6、CD86、CXADR、FUT3、MMP2和TIMP2)则与CRC风险增加呈负相关。其中,4种蛋白(GREM1、CLSTN3、CSF2RA、CD86)可被优先考虑。
在肿瘤部位分层分析结果显示,13种蛋白中(STXBP6、CSAG1、CD86、POLR2F、CLSTN3、ADPGK、CSF2RA、CHRDL2)有8种与结肠癌风险相关;2种(CHRDL2、CD86)与直肠癌风险相关。其中,CHRDL2和CD86与结肠癌、直肠癌均具有相关显著相关性。敏感性分析(仅顺式MR)显示,13个蛋白质中有4个具有顺式pQTL,其中3个(GREM1、CHRDL2、FUT3)与CRC风险显著相关。
图2. 火山图显示全蛋白质组的MR分析结果。
由于POLR2F、CXADR缺乏完整汇总数据,研究团队对上述11种潜在因果蛋白进行共定位分析。结果显示,GREM1、FUT3(带顺式 pQTL)、CLSTN3、CSF2RA、CD86和ADPGK(带反式pQTL)等蛋白质水平与CRC风险之间很可能存在共同的因果关系。此外,CSF2RA、CD86及其反式pQTLs定位基因(SH2B3)参与了相同的生物学途径。
为进一步验证,研究团队对11种蛋白质进行了SMR和HEIDI检测,并提供了完整的汇总数据。结果显示,11个蛋白全部通过SMR检验,其中7个通过HEIDI检验。
结合上述结果,研究团队将这些蛋白质分为三级,4种蛋白(GREM1、CLSTN3、CSF2RA、CD86)通过了所有检测被归类为第1级(tier 1);5种蛋白质(CHRDL2、POLR2F、ADPGK、CXADR、FUT3)未通过共定位分析/HEIDI检测试失败或因缺乏数据而无法检测,被归类为第2级(tier 2);4种蛋白质(CSAG1、STXBP6、MMP2、TIMP2)在SMR和荟萃分析中失败或在共定位分析和HEIDI测试中均失败,被归类为第3级(tier 3)。
为探究13种循环蛋白的编码基因在结肠肿瘤组织中是否具有细胞类型特异性富集,研究团队使用来自GEO的单细胞RNA-seq数据进行单细胞类型表达分析(图3)。细胞聚类为11个簇,并进一步分为6种细胞类型(上皮细胞、B细胞、单核细胞、组织干细胞、T细胞、内皮细胞)。
在结肠肿瘤组织中,13个蛋白编码基因中有12个有表达数据,CSF2RA表达未被检测到。其中,6个蛋白编码基因出现细胞类型特异性富集:GREM1、MMP2和TIMP2主要富集于组织干细胞、FUT3和CXADR富集于上皮细胞、CD86富集于单核细胞。在正常结肠组织中,13个蛋白编码基因中有10个有表达数据,有5个蛋白编码基因发生细胞类型特异性富集。
图3. 通过全蛋白质组孟德尔随机化鉴定的蛋白质编码基因在结肠肿瘤组织中的单细胞类型表达。
基于PPI分析,研究团队识别到GREM1与CHRDL2以及MMP2与TIMP2之间存在相互作用,其分别参与破骨细胞分化和肿瘤发生途径。在成药性评估中,研究团队发现有4种蛋白(POLR2F、CSF2RA、CD86、MMP2)已成为药物开发的目标,并有可能被重新用作CRC的治疗靶点。
例如,靶向POLR2F的药物(TAS-106)可抑制小鼠结直肠和胃肿瘤的生长;一些针对CSF2RA的药物已被开发用于治疗自身免疫性疾病(沙格司亭,KB002)、糖尿病足溃疡以及加速伤口闭合和愈合;一些靶向CD86的药物已被批准用于治疗类风湿性关节炎和急性移植物抗宿主病;靶向MMP2的药物已被用于治疗癌症(marimastat)、肾血管性高血压和充血性心力衰竭(captopril)或在临床试验中用于治疗肺癌(夹心桃素)。
综上所述,研究团队进行了一项蛋白质组范围的孟德尔随机化(MR)研究,共发现了13种蛋白质标志物与CRC易感性相关,其中2种蛋白质呈正相关、11种蛋白质呈负相关。此外,该研究还将上述蛋白质分为3个不同级别,其中6个(CLSTN3、POLR2F、ADPGK、CSAG1、STXBP6、FUT3)是与CRC相关的新型血浆蛋白标志物。总之,该研究为CRC的病因学提供了新的见解,并为CRC筛查生物标志物和治疗药物的开发提供了有前景的靶点,但目前仍需进一步的实验和临床研究来评估这些候选药物的实用性和功效。
参考文献:
Sun, J., Zhao, J., Jiang, F., Wang, L., Xiao, Q., Han, F., ... & Li, X. (2023). Identification of novel protein biomarkers and drug targets for colorectal cancer by integrating human plasma proteome with genome.Genome Medicine, 15(1), 1-13.
https://genomemedicine.biomedcentral.com/articles/10.1186/s13073-023-01229-9
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!