其它

首页 - 全部文章 - 其它 - Nat Commun|基于长读长测序进行癌症和免疫单细胞的综合基因分型

Nat Commun|基于长读长测序进行癌症和免疫单细胞的综合基因分型

单细胞转录组学可用于细胞类型分类和细胞状态鉴定,揭示细胞的显著异质性,并纵向追踪细胞状态,从而了解治疗干预措施如何重塑基因表达谱。但由于长的或低表达的转录本捕获不完全,而且不能明确检测许多遗传和转录组突变,目前的短读长单细胞测序数据不能提供足够的分辨率来解决许多重要的生物学问题。这些问题可以通过恶性与非恶性单细胞的差异基因表达分析来揭示,但这些方法通常需要繁琐的引物组和早期的靶标投入。

哈佛大学研究团队及合作者在Nature communications发表了题为“Integrative genotyping of cancer and immune phenotypes by long-read sequencing”的文章。研究团队设计了一个灵活的长读长测序工作流程和分析管线,称为nanoranger,该方法从中间单细胞cDNA文库开始,检测细胞谱系定义特征,包括单核苷酸变体、融合基因、异构体、嵌合抗原和TCR序列。通过对这些天然“条形码”的系统分析,研究人员定义了nanoranger的最佳靶点,即靠近高表达基因5'端、转录长度短于4kB的基因位点。作为概念证明,研究人员将nanoranger应用于急性髓系白血病(AML)亚克隆的纵向追踪,并描述了数千个骨髓浸润免疫细胞的异质性亚型特征。总之,使用nanoranger可以增强细胞基因分型,改善对单细胞肿瘤和免疫细胞共同进化的追踪。

文章发表在Nature Communications

主要研究内容

研究人员首先开发了一种多功能的工作流程,能够基于Oxford Nanopore平台对目标靶标进行扩增、长读长测序和处理,从而可以检测到广泛的天然条形码,包括体细胞和线粒体DNA(mtDNA)突变、融合基因和异构体(图1a)。这个流程中包含用于靶向扩增的三步PCR方案,旨在使用一组流线型引物捕获目标分子特征(图1b)。
为了将单细胞基因表达谱与目标基因分型特征相结合,研究人员设计了nanoranger,它可从Oxford Nanopore测序数据中提取细胞条形码和转录本信息,并为检测目标分子特征提供基因组比对。Oxford Nanopore会产生包含多个转录本的自然多聚体reads,nanoranger经过调整可以使这些多聚体去连接,包括具有相反方向的转录本(图1c)。总之,该分析工作流程的性能优越,可以最大限度地从Oxford Nanopore单细胞测序数据中提取转录本。

图1. nanoranger处理用Oxford Nanopore平台测序的10x cDNA扩增子。

为了评估从长读长测序数据和短读长测序数据中提取分子特征的效率,研究人员比较了从Oxford Nanopore和Illumina测序中获得的高多态性T细胞受体(TCR)序列。分析结果显示,单细胞TCR克隆型与短读长和长读长测序的结果高度相关,表明基于Oxford Nanopore的工作流程用于检测天然遗传条形码的准确性是足够的。随后,研究人员对两种具有不同点突变和基因融合的白血病细胞系进行了混合研究,评估了此方案鉴定肿瘤细胞复发性体细胞突变的特异性和敏感性。

图2. nanoranger提供准确的细胞条形码和基因分型信息。

研究人员通过处理一例AML病例的骨髓样本,比较了基于Illumina突变检测的nanoranger性能。该病例在异基因造血干细胞移植(HSCT)后复发时携带三个体细胞突变(图3a)。除了已发表的方案中描述的Illumina测序外,研究人员还在Oxford Nanopore平台上对未分段的GoT库进行了测序,使用nanoranger分析管线处理了原始数据。总体而言,靶向的三个突变中有两个突变用Illumina测序时nanoranger和GoT实现了相似的scRNA-seq图谱基因分型率(nanoranger为4.8-19.2%;GoT为5.5-19.1%)(图3b、c)。对于所有三个靶标,当用Oxford Nanopore测序并用nanoranger处理时,GoT的性能又提高了1%-7%。在所有的三种实验条件下,99%鉴定到SF3B1K700E突变的细胞是受体来源的,证明了此方法的特异性(图3d)。

图3. nanoranger与GoT的比较。

AML相关的体细胞突变先前已在髓系分化轨迹中进行了描述,即6个AML基因表达簇(HSC、祖细胞、GMP、Pro-mono、mono和cDC),研究人员经过重新分析证实了这些AML基因表达簇。接下来,研究人员使用nanoranger对两个队列中9名患者的AML/MDS细胞进行了基因分型,靶向11个复发突变的AML/MDS相关基因。从18,097个基因型谱来看,大多数AML相关突变可在髓系祖细胞、单核细胞和树突状细胞群体中检测到(图4b右)。

对复发性体细胞突变、供体嵌合和单细胞分辨率拷贝数变化的综合分析不仅揭示了骨髓细胞区室中存在的单个AML克隆的明确定义,而且揭示了在复发/难治性继发性AML的情况下,它们分化为红系和巨核细胞谱系。这些发现提供了白血病鉴别特征,可以更准确地分析AML的bulk RNA测序图谱。

图4. AML相关的体细胞突变可在髓系、红系和巨核细胞祖细胞群体中检测到。

mtDNA突变可以标记克隆细胞群体,被认为是天然条形码,它能够在异基因造血干细胞移植后以单细胞分辨率跟踪白血病细胞亚群,甚至供体和受体群体(图5a)。但目前尚不清楚mtDNA和体细胞突变是否为白血病克隆提供了类似的定义。研究人员开发了一个含20个引物的组合,用于靶向扩增和随后的长读长测序。mtDNA突变能够高精度区分供体和受体来源的细胞,可以作为AML的替代疾病标志物,并解决亚克隆异质性。

图5. 利用线粒体DNA突变鉴定和追踪白血病细胞群。

结语 

综上所述,研究人员设计的nanoranger可以从长读长测序的单细胞cDNA文库中靶向检测遗传和转录组条形码,克服了许多限制,例如采用简化工作流程解决了scRNA-seq基因分型分析使用大型引物集的挑战。其次,通过将具有足够分析覆盖率的细胞数量增加2-3个数量级,富集目标基因增强了长读长测序检测结构转录组变体(包括选择性剪接事件)的能力。最后,长读长测序提供了对5′10x基因组学scRNA-seq cDNA文库结构的深入了解。虽然长读长测序可以提高分子特征的检测,但任何基因分型方法的上限目前都是由许多转录本的低水平和不完整表征(包括缺乏较长的突变)决定的,不能仅仅通过优化扩增子生成或更深的测序来克服。因此,建议未来的研究需要集中于开发提供真正全长cDNA的高通量单细胞化学,扩展单细胞RNA测序中的可及区域。
论文原文:
Penter, L., Borji, M., Nagler, A. et al. Integrative genotyping of cancer and immune phenotypes by long-read sequencing. Nat Commun 15, 32 (2024). https://doi.org/10.1038/s41467-023-44137-7
(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

关键词:

热评文章