资讯

首页 - 全部文章 - 资讯 - 如何搭建完整的“基因测序数据分析平台”?剖析23GENEBANK公司GIAS平台四大特性

如何搭建完整的“基因测序数据分析平台”?剖析23GENEBANK公司GIAS平台四大特性

毋庸置疑,随着下一代测序(NGS)技术的迅猛发展,其在癌症、遗传病基因检测等领域的应用不断拓展与普及,基因测序数据正在以前所未有的速度在增长!面对与日俱增的海量基因数据,对其进行分析与解读是摆在当前的一项巨大挑战。

一个完整的基因检测过程,主要涉及以下步骤:

 1 DNA提取、建库测序;

2 初级生物信息分析获取变异信息、高级信息生物分析获取关联数据;

3 最终生成客户能够简明易了的检测报告。

其中,步骤1有大量的实验供应商可以找寻;但是技术含量更高的步骤2和步骤3,一站式的解决方案提供商,相对较为稀缺,也是介入基因检测行业后,能否取得很好的市场口碑形成良好市场效应的关键。

无论是国内,还是国外,都还没有统一的生物数据分析平台,基因数据分析仍是基因检测的核心关键,是NGS的一个重要组成部分。从原始测序结果中找到致病突变,SNP、Indels、融合、扩增等,是完成疾病的预测、诊断以及治疗策略制定的重要依据。

先前市场上所提供的数据分析工具,功能比较单一,适用范围较窄。一个工具可能被用于校准比对(alignment),另一个工具可能被用于变异注释,比如不同的注释软件有Annovar、SnpEff、VEP、Oncotator、选择合适的软件注释variants对于下游分析很关键。所以,针对复杂的基因数据分析服务,不具备专业生物信息分析技术团队的公司或实验室,都难以开展完整的基因检测业务,这导致很多机构把这部分流程外包出去。

接下来,我们以23GENEBANK公司所开发的专用于测序数据分析的GIAS(GeneBank Genomics dataIntegrated Analysis System)平台为例,剖析该平台的特性及应用。GIAS平台包含了该公司在基因检测方面多年开发成果,实现从原始测序数据分析到PDF报告的简易流程化操作,可大大降低人员培训的时间和资金成本。

23GENEBANK 负责人蔡女士介绍,和市售同类产品相比,GIAS有着众多优势,包括:高可移植性、多重技术平台支持、一键式生成报告、临床/零售双场景等,其中临床/零售双场景是GIAS独有优势,融合了公司的健康线和临床线产品内容。GIAS平台不仅拥有市场领先的消费类基因检测项目,可分析健康类项目接近7000项,同时也能进行临床肿瘤治疗中化疗用药、靶向用药、免疫药物的分析。因此,想要进军基因检测市场的企业可以根据自身市场定位和应用场景,提出不同的需求,23GENEBANK会根据具体需求提供定制化模块,最终呈现一套完整E2E产品开发方案。

此外,根据GIAS平台工程师Victor Wang的介绍,开发团队采用了Docker容器,帮助解决了很多用户的实际问题,无论是选择GIAS一体机,还是使用已有的服务器、各类云平台,都可以部署分析流程。

相比于2017年7月在"第三届精准医疗与基因测序"大会上推出的初代版本,开发团队遵照Standards and Guidelines for Validating Next-Generation Sequencing Bioinformatics Pipelines(NGS生物信息流程验证标准和指南),将GIAS平台进行了升级优化,利用4个技术优势,实现平台的高效使用,尤其是分析时间大幅缩减至原有的1/10。

1.整合生信工具,关联大型KDB数据库

GIAS平台综合利用各大数据库的注释信息,可对海量变异进行自动化筛选,并定期更新。涉及数据库包括NCBI dbSNP、1000Genomes、OMIM、PharmGKB、Cosmic 等各大权威数据库。该平台整合了疾病、药物、特质、变异位点、结构变异等海量多维度信息,对存储信息进行了校正、去冗余、升级和规范化处理,并按照ACMG标准进行权重分级,为变异解读提供了有临床意义注释信息

2.ALL in one

Union file system:将不同层整合成一个文件系统,并为其提供了统一视角,在优化多层存在的同时,使用户角度仅存在一个文件系统。在GIAS数据流系统里,一个作业会被分解成一系列互相依赖的任务,Centralized scheduler负责监控整个作业的进度以及整个系统资源的使用状况,方便部署集群计算机网络,提高了复用率和最大可移植性。

3.多线程任务优化

GIAS充分利用硬件系统的计算性能,在多个主要数据分析算法中应用了多线程并行计算(multithreading),在计算量和数据量多方面分化并行处理,从而实现对CPU和RAM的充分自适应利用,加速分析时间,只需原有分析时间的1/10

4.图形界面,操作简便

GIAS平台采用AIO全图形界面操作,一体式的基因检测分析系统,能够满足客户的硬件配置和软件安装需求,实现开机即用。该平台的基本开发配置是基于CentOS 7服务器系统,采用了Intel Xeon平台、ECC自纠错内存、RAID 独立冗余磁盘阵列存储系统。目前只需要一个运营操作人员,即可顺利操作该系统,傻瓜式操作,是23GENEBANK系统开发团队倾心倾力的结果。

在基因检测这个细分领域,数据分析是重中之重。首先,从功能层面上来说,平台产品需要满足“可定制、可视化操作、全自动报告生成”的基本需求;其次,从知识库建库来说,无论是临床、科学研究,还是消费级基因检测,如何从海量的变异信息中抽丝剥茧,寻找真正有意义的致病突变是一个难题,因此完整的知识库是平台建设的基础。再者,从数据库更新来说,科研要抓取前沿研究,用户选择的平台需要是一个长期且需要不断维护的数据分析平台。

基于以上三点,23GENEBANK推出的GIAS平台能够很好的满足医院、科研以及相关企业的基因测序数据分析需求,进而省却重新组建生物信息分析团队以及进行基础研发所需的时间和成本。

关于23GENEBANK

23GENEBANK(中国)是国家高新技术企业,是国内科研级基因检测服务领域的引领者。公司致力于运用基因数据解读改善人类健康,为国内各地的研究人员、临床医生、健康机构以及个人消费者等提供全面的精准健康整体解决方案,在自主知识产权、科技研发、成果转化、科研人员占比、企业经营状况、成长指标等环节都展现了过硬实力。

• 23GENEBANK(中国)已成为全球基因组学和健康学会(Global Alliance For Genomics and Health)成员,也是首批中国基因测序技术与产业联盟(Chinese Gene Sequencing Technology and Industry Alliance,CSTIA)成员。与全球375家医疗保健、科研、疾病宣传、生命科学和信息科学等领域中的领先机构共同合作,致力于建立行业技术标准,推动科学和医学进展。

• 23GENEBANK产品研发的团队成员来自于全球一流学府的优秀科研人员,团队成员在国际一流期刊累计发表过50余篇科研成果,被同行引用500余次,涵盖Nature、Science、Cell等顶级期刊。构建了遗传学、生物学、计算机、生物信息、数学、大数据等交叉背景的卓越团队,旨在将全球前沿的技术,融合国际通行的产业化标准,服务于中国人群。

更多GIAS平台信息,请访问www.23genebank.com

(0)

本文由 SEQ.CN 作者:陈初夏 发表,转载请注明来源!

热评文章