科研

首页 - 全部文章 - 科研 - 数据质量旗鼓相当!两项独立研究共同证明:华大智造和Illumina测序平台单细胞RNA测序性能具有高度可比性

数据质量旗鼓相当!两项独立研究共同证明:华大智造和Illumina测序平台单细胞RNA测序性能具有高度可比性

基因测序仪是整个基因测序产业的上游核心和关键,也是基因测序产业链上壁垒最高的部分。以华大智造为代表的国内基因测序企业在国产测序仪研发、生产方面作出了不懈努力。2015年至2018年,华大智造相继推出了拥有完全自主知识产权、具有国际先进水平的桌面型测序仪BGISEQ-500和BGISEQ-50、MGISEQ-2000、MGISEQ-200以及目前全球日生产能力最强的基因测序仪MGISEQ-T7,实现了我国基因科技布局产业上游的突破。

目前,单细胞RNA测序已成为分析细胞异质性、研究细胞状态以及识别不同细胞类型亚群的既定方法,在细胞图谱构建、脑神经科学、胚胎发育、微生物、肿瘤以及药物开发等领域都有重要应用。大规模单细胞RNA测序除了高通量、灵敏度和准确度的要求,还要考虑成本问题。此外,大多数单细胞RNA测序方法要求绝大多数cDNA扩增与文库构建与Illumina测序平台兼容。

近期,两项独立研究成果表明,MGI测序平台与Illumina测序平台产生的单细胞RNA数据质量相当,且从目前已知的价格来看,华大智造测序平台的测序成本则更具优势。

其中,一项研究由澳大利亚加文医学研究所(Garvan Institute of Medical Research)与华大研究人员合作完成。研究团队利用10x Genomics平台处理单细胞,并在MGISEQ-2000和NextSeq 500、NovaSeq 6000平台进行RNA测序,比较了测序平台在细胞类型识别、基因检测和特异性分子标签等方面的性能。相关研究成果已发表在BioRxiv

另外一项发表在Genome Biology期刊的研究文章由世界著名基因组测序研究中心英国桑格研究所(Wellcome Sanger Institute)与华大研究人员合作完成。研究团队在BGISEQ-500和HiSeq 2500、HiSeq 4000测序平台上测试了两种单细胞RNA测序方法,评估了BGI测序平台对单细胞RNA测序的适用性,并利用匹配的单细胞RNA数据与Illumina测序平台进行性能比较。

一、MGISEQ-2000可以与NovaSeq相媲美

在这项发表在BioRxiv的研究论文中,澳大利亚加文医学研究所的研究人员比较了MGISEQ-2000和NextSeq 500、NovaSeq 6000的单细胞RNA测序性能,并得到了类似的结论:MGISEQ-2000的性能与NovaSeq 6000平台具有高度可比性;同时,与NextSeq 500相比,MGISEQ-2000平台的表现更好。

加文医学研究所的单细胞和计算基因组学负责人Joseph Powell表示,其团队进行了相当全面的分析。在该研究中,研究人员分析了7万多个单细胞,并制备了文库来比较MGISEQ-2000和NovaSeq 6000、NexSeq 500测序平台。

图1. 实验设计图

研究结果显示,MGISEQ-2000在测序质量、细胞识别、特异分子标签和基因检测方面和NovaSeq 6000具有高度可比性。在相同的测序深度下,MGISEQ-2000比NextSeq 500平台表现更好,可识别更多细胞类型、基因和特异分子标签(图2)。研究人员能够从MGI平台产生的序列数据中识别(calling)额外的1,065,659个SNPs,对额外14%的细胞进行正确的分型。

图2. 两种平台检测到的细胞条形码和特异分子标签比较。A:两个平台共同检测到的细胞条形码高度一致;B:与细胞条形码相关的总特异分子标签分布显示,一个平台检测到的细胞条形码的平均特异分子标签数很低。C:在每个样本中,两个平台都检测到相似的基因数量;D:测序平台进行基因检测的偏差仅限于低表达基因

此外,据加文医学研究所估计,MGISEQ-2000测序100万reads的成本为1.82美元,NextSeq为8.66美元,NovaSeq 6000约在3~3.8美元之间。

Powell教授认为,到目前为止他们只评估了MGI测序仪的单细胞RNA测序数据,并且是在BGI的实验室进行测序,今后可能还需要在外部对MGISEQ-2000平台进行测试。另外,在市场上推出另一种替代技术也是件好事。虽然Powell的实验室目前还未配备MGI测序仪,但他正在考虑购买。

二、BGISEQ-500与HiSeq平台旗鼓相当

图3. HiSeq平台和BGISEQ-500平台文库制备和测序示意图

发表于Genome Biology期刊的研究结果显示,在单细胞RNA测序中,BGISEQ-500和HiSeq两种测序平台的敏感性和准确性等性能指标旗鼓相当。此外,BGISEQ-500每Gb测序成本是 HiSeq 4000 的40%~60%。

该项目利用SMARTer和Smart-seq2两种方法针对小鼠胚胎干细胞和人K562细胞构建了文库。为确保样本制备方法和测序技术之间的任何变化不是由实验地点的不同引起,BGI和桑格研究所人员对匹配样本进行了相同的样本制备工作。随后桑格团队将其制备的样本寄给了BGI,并在BGISEQ-500测序平台上进行测序。在HiSeq 2500、HiSeq 4000测序平台上测序的样本由桑格研究所和BGI研究人员各自构建文库,并进行了匹配样本的测序。论文通讯作者、南丹麦大学助理教授Kedar Natarajan表示:“总体来说,我们没有发现任何大的变化是由细胞处理或文库制备过程的差异导致的。”

在测序过程中,研究人员对来自468个单细胞的1297对cDNA样本进行了分析。同时,他们加入了已知浓度的外源RNA标准品(spike-in samples)验证真实测序数据,用来比较和评估BGISEQ-500与HiSeq平台的准确性、敏感性和鲁棒性。

在HiSeq2500和BGISEQ-500的比较中,研究人员发现,两种测序平台在片段大小分布、基因覆盖率、遗漏率和表达变异检测方面都很相似(图4)。利用标准品检测测序平台的精确度和灵敏度,发现无论使用哪种单细胞测序方法,两个测序平台的指标都很相似(图5)。

图4. HiSeq2500和BGISEQ-500在单细胞SMARTer和Smart-seq2方法检测的不同基因表达指标

图5. 在两个测序平台上,小鼠胚胎干细胞(576个样本)单细胞在SMARTer和Smart-seq2测序中的准确度(A)和灵敏度(B)

鉴于灵敏度可能与测序深度有关,研究团队比较了单细胞reads片段的分布。BGISEQ-500平台对单个细胞进行更深度的测序,可使灵敏度略有提高(图6左)。与HiSeq2500相比,BGISEQ-500检测到的基因数更多(图6右)。

图6. 左:每个单细胞的测序读数。右:每个单细胞检测到的基因,每个点对应一个细胞

HiSeq2500和BGISEQ-500测序平台的检测范围为21~47个RNA分子,其中BGISEQ-500平台的范围略低,因为其样本进行了更高深度的测序。在相似测序深度下,两种测序平台的单细胞RNA测序检测范围没有差异,并且灵敏度和准确性都非常相似(图5)。其中灵敏度约在280万reads达到饱和(红色虚线;图7b),准确性约在250万reads达到饱和(红色虚线;图7c)。研究团队通过RNA总表达(Genes +标准品)和RNA标准品评估了两个测序平台,发现两个平台检测到的基因表达模式类似。

图7. B:小鼠胚胎干细胞的单细胞检测限(灵敏度),下调两个数量级。C:mESC细胞的单细胞精确度也下调了两个数量级

在BGISEQ-500和HiSeq 4000的比较中,研究团队使用Smart-seq2方法在82个小鼠胚胎干细胞和98个人K562细胞的子集上,生成了600个BGISEQ-500测序文库和121个HiSeq 4000配对末端测序文库(共721个测序文库)。数据分析表明,BGISEQ-500和HiSeq 4000平台的单细胞RNA测序性能指标相似且稳健。

综合以上研究结果,HiSeq平台和BGISEQ-500平台的文库制备和测序过程中引入的错误很小,并且两种平台的性能指标不相上下,包括RNA检测的敏感性和准确性。此外,BGISEQ-500和Illumina平台之间的关键区别之一是测序成本。据桑格研究所团队估算,利用BGISEQ-500进行PE100 reads的测序成本约为每Gb 20美元,HiSeq 4000的 PE100 reads测序成本约为每Gb 44美元。在单细胞RNA测序中,每个细胞都需要大量的多重测序和较大的测序深度。BGISEQ-500为进行高通量、高性能单细胞研究提供了一种成本效益较高的选择。

   三、结语  

单细胞基因组学的迅速发展正在改变我们对生物系统的理解,通过捕捉潜在的基因表达变异性来识别细胞类型、状态和跨细胞群体的转变。以上两项研究利用 MGI测序平台进行单细胞测序,证明其在灵敏度、准确性和重现性等方面与Illumina测序平台具有很高的可比性,且具有更高的成本效益。

目前,大多单细胞RNA测序方法和技术都要求与Illumina短读长测序平台相兼容。虽然以上研究结论还需要进一步证明,同时也需要更多MGI以外的研究机构对MGI测序仪进行评估。但已有单细胞RNA测序方法可以很容易地扩展、兼容到MGI测序平台,这为广大的科研人员提供另一种可能的选择,将有助于推动大规模单细胞测序研究的深入。

参考资料:

1. Comparative analysis of sequencing technologies for single-cell transcriptomics

https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1676-5

2. Comparative performance of the BGI and Illumina sequencing technology for single-cell RNA-sequencing

https://www.biorxiv.org/content/10.1101/552588v2

3. Sanger, Garvan Teams Find BGI Tech Comparable With Illumina for Single-Cell RNA Sequencing

https://www.genomeweb.com/sequencing/sanger-garvan-teams-find-bgi-tech-comparable-illumina-single-cell-rna-sequencing

(0)

本文由 SEQ.CN 作者:戴胜 发表,转载请注明来源!

热评文章