产业

Sentieon与华大智造合作推出高通量测序数据分析一体机

近日,MGI与Sentieon合作正式推出高通量测序数据分析一体机Zieon。双方团队详细讨论并测试了华大智造MegaBOLT和Sentieon软件模块的性能,采用合适的模块组合推出了Zieon数据分析一体机。数据显示,Zieon在准确率提升的同时可加速46倍左右。

合作介绍

Zieon是一套高性能的重测序分析系统,整合了华大智造MegaBOLT以及Sentieon软件这两套加速方案。该方案包含胚系突变(Germline)与体细胞突变(Somatic)的全基因组(WGS)、全外显子组(WES)及Panel靶向测序数据分析,完成从测序序列文件fq.gz输入至变异检测结果vcf.gz输出的计算以及各项QC流程。通过硬件加速卡,软件优化模块及多任务调度系统进行计算加速,与开源常规流程相比,Zieon在准确率提升的同时可加速46倍左右。

Zieon可提供包括工作站与机架式在内的两种模式,分别对应中小型用户与大型用户的不同使用场景。同时,Zieon提供网页交互式操作界面和分析报告,操作简单,适用于广大非生物信息分析背景的用户。

华大智造与Sentieon合作多年,早在2019年发表的DNBSEQ-T7的性能描述文章中就有展示Sentieon专门为DNBseq开发的分析流程(doi: https://doi.org/10.1101/2019.12.20.885517),在同年的ASHG会议上双方又展示了合作开发的stFLR分析流程。2020年底Sentieon与MegaBOLT团队接触并合作,经过半年多的研发与探索,正式发布了整合了双方技术产品的加速方案——Zieon数据分析一体机。

原理介绍

当前包括CPU、GPU以及FPGA在内,有多种计算构架被应用在了高通量测序数据分析的流程中,这些不同架构硬件对流程中不同类型的处理模块也是效率各异。例如,FPGA硬件内部采用多流水线计算结构,在“比对”等逻辑步骤简单但是并发数据较大的步骤上效率较高,而CPU硬件则对变异检测等需要大量逻辑判断的步骤更为合适。

效率上的差异也是本次合作的主要技术思路,将上游比对工作交给FPGA硬件完成,下游工作交给CPU处理,同时开发一个任务调度系统以平衡不同硬件之间的任务负载。在本次合作中,双方团队详细讨论并测试了MegaBOLT和Sentieon模块的性能,采用合适的模块组合推出了适合于胚系变异以及肿瘤变异的分析流程供用户使用。同时,该方案在核心处理流程以外,提供了完善的质控数据以及基于互动页面的分析报告。

速度展示

以胚系变异检测流程为例,研究团队采用MegaBOLT-Scheduler连续投递30x全基因组下机数据,使用Zieon工作站硬件环境,分别统计开源GATK方案、MegaBOLT方案、Sentieon方案以及Zieon方案的用时,以每24小时的处理通量来展示。

图片

可以看出,在不改变硬件环境的情况下,Zieon方案仅需要52分钟即可完成一个全基因组的数据分析,相对于开源GATK方案提速46倍,相比MegaBOLT或者Sentieon也提速2倍左右,显示了整合方案对于硬件的高效应用。

Zieon工作站单日处理通量高达2.5T,基本可以匹配T7的测序通量,配合MGI任务调度系统,达到当日下机,当日分析,当日完成的目的。Zieon还提供机架式部署以针对更高通量的分析需求,比工作站的通量提升3倍以上。

分析精度

Zieon的胚系变异流程整合了Sentieon DNAscope模块,以及专门适配DNBseq数据的机器学习模型,在分析准确度上远超开源GATK流程,SNP的准确度超过99.9%,Indel超过99.5%。通过下图PCR-free 30x的全基因组测试数据可以看出,这套基于机器学习原理的分析流程可以更好的识别DNBseq测序数据的特定错误范式,将测序错误与真实的突变精准的区分开来。

此外,这套分析流程允许将全基因组的测序深度降低到20x,通过软件纠错的方式,达到或超过30x测序深度GATK分析流程的准确度。

深圳华大智造科技股份有限公司CIO 单日强表示:

过去十余年里,测序技术快速发展。以基因测序仪为基础工具和平台,基因组学研究和应用基本实现了海量数据的产出。Zieon基因分析加速平台,成功结合华大智造及Sentieon双方的分析优化及加速技术,加速生命时代的到来。

Sentieon CEO 叶军表示:

华大智造为基因测序提供了一个优质选项,测序平台的多元化有利于整个产业的发展。Sentieon很高兴与华大智造的数据分析产品有机结合,联合推出Zieon在运算效率和准确度都达到最优效果。我们期待未来持续深入的合作,不断为业界提供优质的解决方案。

关于Sentieon

Sentieon致力于解决生物信息数据分析中的速度与准确度瓶颈,通过算法的深度优化和企业级的软件工程,大幅度提升NGS数据处理的效率,准确度,和可靠性。总部位于美国硅谷的Sentieon公司成立于2014年7月,团队成员具有多年的高性能计算,大数据挖掘,和人工智能的经验。自成立以来,Sentieon多次赢得precisionFDA国际生物信息挑战赛的第一名,包括三次临床多组学联合分析AI建模大赛冠军,展现了业内顶级的研发实力。Sentieon为来自于分子诊断,药物研发,临床医疗等多个领域的合作伙伴和科研机构提供软件解决方案,共同推动基因技术的发展,实现“成就精准数据,服务精准医疗“的愿景。

关于华大智造

深圳华大智造科技股份有限公司(简称华大智造)秉承“创新智造引领生命科技”的理念,致力于成为生命科技核心工具缔造者,专注于生命科学与生物技术领域,以仪器设备、试剂耗材等相关产品的研发、生产和销售为主要业务,为精准医疗、精准农业和精准健康等行业提供实时、全景、全生命周期的生命数字化设备和系统。

(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

热评文章