科研

首页 - 全部文章 - 科研 - Nat. Commun | 基于机器学习模型的全基因组cfDNA片段分析方法可精准诊断肺癌患者

Nat. Commun | 基于机器学习模型的全基因组cfDNA片段分析方法可精准诊断肺癌患者

肺癌是对人群健康和生命威胁最大的恶性肿瘤之一。近年来,肺癌的发病率和死亡率均明显增高。由于多数患者诊断时已是晚期,治疗效果往往不佳。肺癌筛查通常是对高危人群进行胸部低剂量计算机断层扫描(LDCT)筛查,但这种方法的假阳性率高,同时会对人体造成辐射危害。因此,迫切需要开发一种非侵入性的筛查方法。 

液体活检技术为癌症的无创检测提供了新途径。外周血循环无细胞DNA(cfDNA)中的突变或甲基化信息可以在早期肺癌患者中直接检测到,但该方法可能会遗漏许多癌症患者,并且可能还需要对白细胞进行测序以消除克隆造血引起的变化。

近日,来自霍普金斯大学医学院研究团队开发了一种具有高敏感性和高特异性的肺癌无创检测方法,可基于cfDNA片段的全基因组分析来检测肿瘤衍生的cfDNA,并在Nature Communications杂志上发表了题为“Detection and characterization of lung cancer using cell-free DNA fragmentomes”的研究文章。研究团队利用改良的全基因组cfDNA片段分析方法DELFI,检测了365名患者的血液样本,通过机器学习模型将DELFI与临床危险因素、癌胚抗原和胸部CT数据相结合,检测到94%的跨时期和亚型肺癌患者(包括91%的I/II期和96% 的III/IV期),特异性为80%,并以高精度(AUC=0.98)区分小细胞肺癌患者和非小细胞肺癌患者。这种改良的DELFI分析有望应用于肺癌的非侵入性筛查。

文章发表在Nature Communications

研究人员先前开发了一种全基因组方法来分析cfDNA片段化谱,称为DELFI。DELFI技术基于血液检测,通过分析基因组不同区域的cfDNA的片段大小和数量,间接检测DNA在细胞核内的包装方式。健康细胞与癌细胞细胞核的DNA分布有着显著的差别。当癌细胞死亡时,会以混乱的方式将DNA释放到血液中。DELFI利用机器学习帮助识别癌症的存在,且只需要对基因组进行低覆盖率测序,因此该技术非常经济。

利用DELFI技术,研究人员分析了来自丹麦哥本哈根Bispebjerg医院(LUCAS研究)的365名个体(发现队列)的cfDNA,该队列包括患有恶性和良性肺结节的患者以及非癌症个体(图1b)。

图1.研究方法示意图。来源:Nature Communications

研究发现,cfDNA片段化谱在非癌症个体中非常一致,包括具有非恶性肺结节的个体。相比之下,癌症患者表现出广泛的全基因组变异(图2b)。因此研究人员采用机器学习模型来检查cfDNA谱是否具有肺癌或非肺癌个体的特征。

图2.肺癌患者和非癌症个体的cfDNA片段化谱。来源:Nature Communications

研究队列中的每名个体都获得了了一个DELFI分数,其中癌症患者的DELFI评分中位数较非癌症患者明显增加(图 3a)。DELFI方法在发现队列中识别癌症患者或具有肺癌高风险个体的敏感性和特异性AUC分别为0.90和0.94(图 3b)。癌症分期中,I 期肺癌虽然更难识别,但II、III和IV期肺癌具有相似的高识别率。基于组织学检测,小细胞(SCLC)和鳞状细胞(SCC)肺癌比肺腺癌更容易检测到(图 3b)。

随后,研究人员使用LUCAS研究中的非癌症个体和基线肺癌患者开发了基于DELFI的机器学习模型,并利用验证队列计算DELFI分数,该队列由没有癌症(n  = 385)或主要是早期癌症(n =46)的个体组成。结果显示,该模型在验证队列中的敏感性和特异性与在发现队列中观察到的相似(图 3c)。总体而言,DELFI方法可推广到不同的肺癌队列,包括不同的癌症分期和组织学亚型。 图片

图3.DELFI对肺癌患者和非癌症个体的分析性能。来源:Nature Communications

结果显示,在LUCAS队列中,9个小于2厘米的肿瘤(T1a)中有8个的DELFI评分高于非癌症个体(图4a)。DELFI评分从T1到T4分期逐步增加。此外,与淋巴结转移的患者相比,无淋巴结转移的肺癌患者(N0)的DELFI评分显著降低(图4a)。研究发现,较高的DELFI评分(>0.5)与降低的总生存率相关(图4c)。以上结果表明,异常cfDNA片段分布与肿瘤负荷或侵袭性之间的关系,并可能提供对长期肺癌预后的临床见解

图4. 肺癌的大小和侵袭性与DELFI评分的关系。来源:Nature Communications

研究人员利用来自TCGA数据库的RNA-seq数据来鉴定了SCLC(n = 79)和 NSCLC(n =1046)或白细胞(WBC,n =755)样本之间差异表达最高的转录因子,确定了ASCL1为差异表达最高的基因(图 5a)。

ASCL1是神经内分泌细胞(SCLC的祖细胞类型)中的转录因子,并在大多数SCLC中高表达。正如预期的那样,该研究发现具有ASCL1结合位点的基因子集在SCLC和NSCLC之间差异表达(图5b)。基于ASCL1结合区域中的cfDNA片段信息,研究人员创建了一个分类器,可用于准确检测SCLC,灵敏度为91%,特异性> 99%(图5d)。此外,在考虑DELFI阳性病例(DELFI评分> 0.34,对应于80%的特异性)时,研究人员将SCLC患者与其他无SCLC的DELFI阳性病例相比,发现准确性较高,其敏感性为100%,特异性为95%,图5e,f)。以上结果表明,DELFI可作为一种非侵入性方法来区分具有不同组织学亚型的肺癌

图5.全基因组片段化图谱可以区分SCLC和NSCLC。来源:Nature Communications

LUCAS队列中单独LDCT的性能分析显示出高灵敏性(>95%)和低特异性 (58%)。使用DELFI评分对患者进行预筛选并仅通过LDCT进一步评估阳性患者的模型中,DELFI/LDCT联合方法的敏感性为94%,特异性为80%,并减少了52%的不必要的筛查程序(图6b)。以上结果表明,DELFI/LDCT联合方法不仅可以显著提高肺癌的检出率,而且有望提高检测的准确性,减少不必要的筛查程序

图6.单独DELFI或DELFI后进行LDCT对肺癌检测的敏感性。来源:Nature Communications

综上所述,研究团队开发的DELFI分析方法可用于检测肺癌的全基因组cfDNA片段分析。研究结果表明,DELFI分析经济且高效,可用于预筛选肺癌的高危人群,增加肺癌的检出性,并减少不必要的后续成像检查和侵入性活检。

参考资料:
Mathios, D., Johansen, J.S., Cristiano, S. et al. Detection and characterization of lung cancer using cell-free DNA fragmentomes. Nat Commun 12, 5060 (2021). https://doi.org/10.1038/s41467-021-24994-w
(1)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

热评文章