科研

测序周报·科研篇:关注三种大规模单细胞分析方法

关注三种大规模单细胞分析方法

导读:近日,美国加州大学圣地亚哥分校张鹍教授在《Nature Methods》发表了评论性文章“Stratifying tissue heterogeneity with scalable single-cell assays”,就全球最新的单细胞分析方法做了点评。这三种方法能够显著提高单细胞基因组测序和结构分析的规模,允许研究者们对组织内的不同种类的细胞群进行分区(hierarchical partitioning)。

在“大数据”和“深度学习”成为热门词汇的这个时代,生物学家们也毫不例外地需要数据。研究者面对单细胞检测中的噪音和不完全覆盖时尤其如此:他们想要尽可能多细胞的信息,以便分析细胞之间的异质性,并得出可信的和有普遍代表性的结论。

基于液滴的单细胞转录组测序方法提供了一个良好的示例:即使测序覆盖度相对较低,通过检测更多的细胞也能有很大的收获。然而,目前除RNA之外其他类型数据分析的进展较慢。最近发表的三篇论文[1-3]有望将规模的优势带到基因组序列和染色体结构的研究中(见图1)。

1. 直接文库制备(DLP)方法

在癌症或脑等组织中,基因组变异是功能异质性的重要来源。Zahn 等人[1]和Vitak等人[2]采用两种不同的方法来分析异质性,在数百到数千单细胞中分析拷贝数变异(CNV)。

从概念上讲,Zahn等人[1]的直接文库制备(direct library preparation,DLP)方法类似于Quake等人[4]开发的方法。Quake等人的方法已经被商业化,开发成了Fluidigm C1单细胞自动制备系统,该系统可以将单细胞限制在单个微流体反应器中来进行一系列酶反应。然而,DLP方法产生的序列更加均匀,后续CNV识别的灵敏度更佳,对较小的基因组间隔(genomic intervals)或拷贝数变化更是如此。

为了实现这一点,Zahn等人[1]在测序文库制备之前去除了全基因组扩增步骤,该步骤是造成技术相关变异性的主要来源。这允许他们通过折叠(collapsing)测序reads(在随后的文库制备期间通过扩增产生),来计数具有独特末端序列的许多随机基因组间隔中的拷贝数。

Tagmentation方法,使用Tn5转座酶插入adaptor序列,使该无需扩增的文库制备方法成为可能。

之前已有研究[5]证明Tagmentation方法适于单细胞水平的纯化DNA,但要使用在单细胞上Zahn等人[1]还需克服DNA可接近性(DNA accessibility)的关键障碍:他们需要不使用纯化或缓冲液交换的步骤,去除辅助蛋白(accessory proteins),以在微反应器中完全暴露DNA分子。他们通过将热敏蛋白酶与单步Tagmentation反应相结合,使用精心设计的反应体积比,使用充气室来灵活地控制容量,解决了这个问题。

他们还使用索引引物组合来标记单细胞文库,并允许从设备上提取(pooled extraction)大量测序文库混合起来一次测序。具有192个独立功能微反应器的芯片的设计并不简单,但是一旦完成,就可以从数百个细胞中,以非常低的成本(因为反应体积小)产生一致和高质量的数据。

2. 基于组合索引策略的方法

为了扩大单细胞CNV分析的规模,Vitak等人[2]采用了基于组合索引策略(combinatorial indexing strategy)的方法。

该方法由Illumina公司的Frank Steemers和Sasan Amini以及华盛顿大学的Jay Shendure合作研究而成[6,7]。在组合索引中,大型DNA分子的亚单倍体库用独特组合的DNA条形码来标记,这种DNA条形码可用于从头构建MB级别的单倍型或基因组支架(genome scaffolds)。每个反应包含多于一个细胞中含量的遗传物质,但经过多轮分裂和汇集(splitting and pooling)产生了由DNA条形码组合确定的多个“虚拟区室”(virtual compartments)。

该概念被Shendure等人扩展用于在单细胞内独特地标记遗传物质,实现了高度多重单细胞DNA可接近性的测定(single-cell indexed assay for transposase-accessible chromatin,sciATAC-seq)[8]。

为了将组合索引应用于单细胞CNV分析,Vitak等人[2]还必须除去DNA结合蛋白,以使所有DNA区域可接近,但是他们还需在分裂和汇集(splitting and pooling)期间保持细胞核完整。

他们开发的两种方法,锂辅助核小体耗竭(lithium-assisted nucleosome depletion,LAND)和与SDS交联(cross-linking with SDS,xSDS),可从10,000多个单细胞中产生可用数据,比DLP方法高出一个数量级。不使用微流体使这些方法能够相对简单地实施。

然而,LAND和xSDS方法都不像蛋白酶消化那样有效地去除DNA结合蛋白,导致基因组表达和不确定的CNV识别存在偏倚,特别是在CNV更加微妙的非癌细胞中,相比之下,DLP方法中的识别更可信。扩大微反应器的数量并不简单,然而DLP方法具有作为可完全自动化的封闭系统的优点,这对临床应用很有吸引力。

3.  单细胞indexed Hi-C(sciHi-C)

Ramani等人[3]使用Shendure团队的组合细胞标记(combinatorial cellular indexing)方法来分析染色体构象。他们的单细胞indexed Hi-C(sciHi-C)工作流程通过固定、限制酶消化、连接和富集(junction enrichment)来捕获染色体结构,同时可保持细胞核完整,并且核内的DNA在整个split-pool过程中与酶及adaptors可接触。他们的结果数据既清晰又丰富,Ramani等人[3]报告了857个数据集,每个数据集包含超过10,000 个contacts,并且与第一项单细胞HiC研究中相同密度的10个数据集相比,揭示了多个层面的异质性。

4. 单细胞分析将成为新的常规

总的来说,这三项研究比以前的研究分析了更多的细胞。他们的数据集众多且相对稀疏,使得它们适合用于聚类(clustering)和分区(partitioning)(Ramani等人的研究中称为virtual sorting),以及每个子集内的单细胞数据的聚合分析。

与批量分析(bulk analysis)不同,此方法可以分析样本内的异质性,同时比单个细胞方法能更可信和更全面地进行识别。Zahn等人[1]使用DLP方法,通过从乳腺癌异种移植模型中鉴定三个主要亚群,并从每个克隆中获得高质量的共有基因组,完成单核苷酸变异(SNV)识别,验证了他们的策略。Vitak等人[2]对胰腺导管腺癌样品使用了类似的策略,并在原发性肿瘤组织中鉴定了四个亚克隆。Ramani等人[3]使用sciHi-C方法,不仅观察到单个HeLa细胞和HAP1细胞之间的清晰分离,而且能在细胞分裂间期和分裂期中区分HeLa细胞。分区(partitioning)的策略可以用于任何单细胞数据类型,并且揭示了一个新的思路:只要产生高度多重测序文库的成本不过多,单细胞分析可以替代大多数应用中的批量分析(bulk analysis)。

这三项研究无疑将激发大规模从单细胞中获得分子标签这类新方法的开发。他们为扩大这类分析的规模提供了几条原则:高度并行地限制细胞内的各种分子,简化反应步骤,尽量避免纯化步骤,使用条形码,创造性地分析大而稀疏的矩阵。在开发新方法时考虑这些原则,用于表观遗传修饰、蛋白质丰度及DNA、RNA和蛋白质互作分析的单细胞分析方法都将在可预见的未来出现。单细胞分析将成为新的常规

参考文献:

1. Zahn, H. et al. Nat. Methods 14, 167–173(2017).

2. Vitak, S.A. et al. Nat. Methods 14,302–308 (2017).

3. Ramani, V. et al. Nat. Methods 14, 263–266(2017).

4. Marcy, Y. et al. PLoS Genet. 3, e155(2007).

5. Adey, A. et al. Genome Biol. 11, R119(2010).

6. Amini, S. et al. Nat. Genet. 46, 1343–1349(2014).

7. Adey, A. et al. Genome Res. 24, 2041–2049(2014).

8. Cusanovich, D.A. et al. Science 348,910–914 (2015).

9. Nagano, T. et al. Nature 502, 59–64(2013).

张鹍教授 

● 现任美国加州大家圣地亚哥分校生物工程系教授;鹍远基因联合创始人兼科学顾问。

● 德克萨斯大学金力教授遗传学博士,哈佛大学George Church教授博士后。

● 2006年第一个实现单细胞全基因组测序,相关文章发表在《Nature Biotechnology》。

● 2009年与高远教授共同开发了第一个大规模DNA甲基化靶向测序技术,成为Nature Biotechnology封面文章。

● 2011年在Nature 上发表的关于诱导干细胞(iPSC)中存在基因组不稳定性的文章,成为当年全世界发表所有文章中引用数目前十位的文章

● 2016 Nature Biotechnology 刊登全球甲基化测序多中心比较文章,张鹍教授甲基化测序技术综合排名第一。

● 2016年领导完成美国脑基因组测序计划,最新单细胞测序成果最新发表于Science。

 来源:测序中国

本周科研进展

  1. 由于肿瘤巨大的遗传多样性,开发癌症疫苗往往是一个令人望而生畏的课题。为了调查通用型癌症疫苗的可行性,罗氏制药的研究团队分析了63,000多个肿瘤的基因组谱,发现在最佳方案的分析中,通用型癌症疫苗的方法是可行的,但只有小于1%的癌症患者群体能受益。这项研究于2月24日在线发表在《Genome Medicine》期刊上。
  2. 英国科学家通过“基因编辑”技术培育出一种“超级猪”,可抵御对猪来说致命的“蓝耳病”病毒。该研究发表在《PLoS Pathogens》期刊上。“蓝耳病”是猪繁殖与呼吸障碍综合症(PPRRS)的俗称,是由一种名为PRRS的病毒引发的。研究者通过基因编辑技术CRISPR-Cas9敲除了CD163基因的一个外显因子,使得PRRS病毒无法与其结合,进而使猪对PRRS病毒起到免疫的效果。
  3. NCI-MATCH在最近一期的《Journal of Molecular Diagnostics》公布了一项经过了FDA审查的NGS试验流程。开发人员使用这项试验流程保证了来自于数以百计收集点的组织样本最终在四个不同测序实验室的分析结果具有可重复性。这项流程将为基础的临床试验和验证提供NGS模板,保证了标准实验室之间的可重复性,加强临床实验室间的合作,特别是在共享基准样品的基准性能指标。
  4. 哈佛大学波士顿儿童医院、复旦大学吴柏林研究组与中科院神经科学研究所仇子龙研究组合作完成的一项研究揭示了自闭症致病的分子机理。相关研究成果日前在线发表于《分子精神病学》。这项研究首次对DYRK1A这一重要自闭症候选基因的相关突变进行神经发育相关的功能研究,为深入研究DYRK1A基因功能及探索自闭症的致病分子细胞机理提供了重要基础。
  5. 近日,一项新研究显示,单纯性疱疹病毒Ⅱ型(HSV-2)感染可能导致自闭症。科学家发现,怀孕初期感染活动性HSV-2的女性生下出现自闭症谱系障碍(ASD)的男性婴儿的几率为未感染女性的两倍。该研究结果刊登在《mSphere》上。
  6. 耶鲁大学研究人员对5000余人展开基因测评,发现一批基因在多数情况下能增进脑力,但有时也可能提高自闭症发病风险。研究人员进一步用计算机模型模拟自然选择对基因变异的影响,发现这些基因是人类进化史上经自然选择保留下来的,原因可能在于它们有助于“提高人的认知功能,但代价就是提高自闭症患病风险”。该研究成果发表在《科学公共图书馆·遗传学》上。
  7. 中国科学院昆明动物研究所孔庆鹏课题组通过分析来自TCGA (The Cancer Genome Atlas)数据库的12种肿瘤的转录组数据发现:ERCC6L基因在12种肿瘤中都非常一致地显著高表达。该基因是一个新近发现的DNA解旋酶,与胚胎发育息息相关,然而与肿瘤的关系却从未见报道。进一步的研究提示ERCC6L是肿瘤预后的良好标记物,同时也是肿瘤治疗和药物开发的一个潜在靶点。该研究成果近期发表于《Oncotarget》杂志。

新发表文章

【动物】

1. Analysis of large versus small dogs reveals three genes on the canine X chromosome associated with body weight, muscling and back fat thickness. Plassais J et al. PLoS Genet. 2017 Mar 3

2. Gut-specific Delivery of T-helper 17 Cells Reduces Obesity and Insulin Resistance in Mice. Hong CP et al. Gastroenterology. 2017 Feb 25.

【植物】

1. Response of Gene Expression and Alternative Splicing to Distinct Growth Environments in Tomato. Wang G et al. Int J Mol Sci. 2017 Mar 2

【微生物】

1. Microbiome dynamic modulation through functional diets based on pre- and probiotics (mannan-oligosaccharides and Saccharomyces cerevisiae) in juvenile rainbow trout (Oncorhynchus mykiss). Gonçalves AT et al. J Appl Microbiol. 2017 Mar 3.

2. Early exposure to agricultural soil accelerates the maturation of the early-life pig gut microbiota. Nguyen V et al. Anaerobe. 2017 Feb 26.

3. Molecular typing of Mycobacterium tuberculosis complex isolated from pulmonary tuberculosis patients in central Ethiopia. Bedewi Z et al. BMC Infect Dis. 2017 Mar 1.

【肿瘤】

1. Gene promoter-associated CpG island hypermethylation in squamous cell carcinoma of the tongue. Bhat S et al. Virchows Arch. 2017 Mar 2.

2. Genetic and epigenetic patterns in patients with the head-and-neck paragangliomas associate with differential clinical characteristics.Chen H et al. J Cancer Res Clin Oncol. 2017 Mar 3.

3. Transcriptomic comparison of primary bovine horn core carcinoma culture and parental tissue at early stage. Shil S et al. Vet World. 2017 Jan

4. Identification of frequent somatic mutations in inflammatory breast cancer. Matsuda N et al. Breast Cancer Res Treat. 2017 Feb 27.

【其他】

1. Genome-wide analysis of differential RNA editing in epilepsy.Srivastava PK et al. Genome Res. 2017 Mar.

2. The Use of Next-Generation Sequencing for Research and Diagnostics for Intellectual Disability. Harripaul R et al. Cold Spring Harb Perspect Med. 2017 Mar 1.

3. Bioinformatics for Novel Long Intergenic Noncoding RNA (lincRNA) Identification in Skeletal Muscle Cells. Peng X et al. Methods Mol Biol.2017.

(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

热评文章