资讯

首页 - 全部文章 - 资讯 - 质量参差不齐的基因大数据是“垃圾场”还是“宝藏”?一份有质量保证的临床实验室列表所引发的思考

质量参差不齐的基因大数据是“垃圾场”还是“宝藏”?一份有质量保证的临床实验室列表所引发的思考

编者按:精准医学概念的催化下,基因大数据已然成为当前医学健康领域的“时髦”词汇。各方机构、各类数据库都在想法设法收集到更多的来自个体基因层面的数据。然而,由于各方数据生成的过程、采用的方法不尽相同,所得到的基因变异信息真假难辨!正所谓输入的是“垃圾”,输出的也一定是“垃圾”。如果数据质量参差不齐,那么基于这些数据所得到的结果很难使我们真正获益。针对这一问题,日前,ClinGen数据库发布了一个满足特定质量要求的实验室列表,以此向外界保证公共数据库中提交的数据质量。

谈起ClinGen,或许很多人会感到陌生,但若提起其“兄弟数据库”ClinVar,可能基因检测行业的都十分熟悉。ClinGen同样是由NIH资助的数据库资源,旨在定义基因及变异在精准医学和相关研究中的临床相关性。值得关注的是,两个数据库的并非完全独立,而是有着千丝万缕的联系。

ClinGen及ClinVar的合作关系,图片来源:ClinGen

实际上,ClinGen最新公布列表的另一个目的,是为ClinVar数据库的用户提供针对临床实验室提交的不同分类数据的质量保证。作为另一个由NIH资助的数据库,相比于ClinGen,ClinVar可谓名声在外,它为公众提供了一个公共、免费的遗传变异—临床表型数据库。作为著名的核心数据库,ClinVar整合了十多个不同类型的数据库,并通过标准的命名法来描述疾病,同时支持科研人员将数据下载到本地。

目前,ClinGen的研究人员正与NCBI密切合作,就ClinVar的开发工作及功能进行改进,并支持多个来源的数据积累。ClinGen也表示,将通过他们的管理工作不断对ClinVar进行改进。

图片来源:ClinGen

让人头疼的数据质量问题

自NIH在2013年推出ClinVar数据库以来,尽管数据的提交量不断增加,但ClinVar实际上也是面临着内忧外患。基因检测领域的从业者批评道,ClinVar吸纳了来自低质量实验室的错误数据。其他人也担心,当医护人员在ClinVar查找其病人相关的基因变异时,他们很可能采纳了不准确或过时的信息,从而走入了错误的诊断路线。

Heidi Rehm为ClinGen的首席研究员,她希望这个名为“满足数据共享最低要求以保证质量的临床实验室(Clinical Laboratories Meeting Minimum Requirements for Data Sharing to Support Quality Assurance)”列表,能有助于减少业内人士对ClinVar的担忧,并鼓励实验室投入更多必要的资源,在数据库中负责地提交并分享其数据。

此外,该列表还拿出了另一个吸引实验室的“杀手锏”:作为一个激励因素,保险公司和医疗服务提供方目前有兴趣以该列表作为一种方式来决定对哪些实验室进行补偿并订购检测。

实际上,进入这一列表可并不容易。为了列入名单,首先,实验室必须从ClinVar中获得“一颗星”,表明他们对提交给数据库的信息达到了标准。此外,实验室还必须每年向ClinVar至少提交一次新的变异信息并更新重新分类的变异;并提交他们返还给患者的所有类型的基因变异(致病性、可能的致病性、未知意义的变异等);并证明在过去一年中,提交了至少100种变异信息且至少达到其所有信息的75%;实验室还要具有CLIA认证或达到其他国家的相应标准。

最后,为了被ClinGen命名为在ClinVar内共享高质量数据的实验室,这些实验室还必须在基因检测注册表(GTR)中进行注册并获得最新的列表。GTR为NIH的另一个数据库,该数据库可供公众参考关于市场检测的临床证据的信息,包括检测的目的、方法、有效性、检测的有用性的证据等。

数据共享和数据解读质量:正相关!

多年来,Partners Healthcare Personalized Medicine分子医学实验室(LMM)主任Rehm一直在努力,使基因组变异的数据共享成为实验室的实践标准。她坚持认为,遗传变异信息解读的公开透明度,是确保公众在健康或疾病的背景下,遗传检测结果是否为合理的保障。Partners Healthcare Personalized Medicine为隶属于Partners HealthCare的一个部门。位于美国波士顿的Partners HealthCare是一个非盈利性的保健系统,致力于为本地和全球的社区提供病人护理、科学研究以及教学等服务。

为了推进这一事业,Rehm不仅成功促使相关实验室向ClinVar提交了信息,而且在获得同行评议的期刊中发表了要求数据共享的文章;并使FDA考虑将数据提交作为实验室注册审批的条件;并呼吁提供商从实现数据共享的实验室订购检测;并美国大型保险公司如Aetna交涉,使得数据提交成为BRCA基因检测的覆盖条件。

根据Rehm的说法,ClinGen正在推进新的临床实验室列表,其他几家大型国家保险公司也已经同意使用这一列表来确定医疗保险是否涵盖某些实验室所提供的遗传检测。在最近发表于Genetics in Medicine的一篇文章中,Rehm指出,基因检测实验室之间的数据共享已经有所增加,而这一活动实际上正在改善其解读基因变异和能力。

她还谈道:“我还发现,信息解读的质量与实验室是否向ClinVar提交了信息之间有很强的相关性。在ClinVar进行了积极的数据共享之后,我也亲眼目睹了这些实验室的解读方法得到了显著改善。”

到目前为止,已经有10个实验室已经满足了ClinGen的入选标准,包括Ambry、ARUP、孟德尔基因组学中心、卢布尔雅那大学医学中心、Counsyl、EGL Genetics (Emory)、GeneDx、Illumina、Invitae、LLM以及芝加哥大学。

ClinGen的“徽章”系统,图片来源:ClinGen

此外,ClinGen推出了些新鲜的鼓励机制。如果实验室超出基本要求,还可以得到额外的“徽章”。例如,向ClinVar提交大部分变异分类的证据;确保75%的变异信息过去的五年里进行提交;与其他实验室一起努力解决数据存储库中的分类差异;并为患者提供一种方式,使其同意共享个人层面的数据。

目前,所有的实验室都取得了与该领域其他实验室解决分类差异的徽章。其中一些实验室在向ClinVar提交数据后,已经致力于解决分类差异,并能够为大多数具有相互冲突解释的变异实现一致的分类。据悉,对于实验室中的佼佼者,Invitae、GeneDx和LMM 三家实验室目前已经拥有了四个徽章。

根据Rehm的说法,许多实验室可能还没有承诺优先为ClinVar提交数据。但是,通过制定这个列表并以赢得徽章作为鼓励机制,那么许多实验室就需要开始新的工作了。

目前,一个基本标准是实验室在过去一年中提交了至少75%的基因变异报告,但是实验室没有被强制要求分享他们较旧的解读信息,因为某些实验室仍在制定系统以分享他们的数据。

理想情况下,Rehm希望实验室的共享数据可追溯到五年前。她估计,众多实验室都是在这个时间段开始积累良好的、关于遗传变异种群频率的公开数据。她在GIM的评论中指出,最近几年更新的《美国医学遗传学和基因组学学会指南》建立了分类命名法,ClinGen和ClinVar的建立也使得分类工作更加一致。

“垃圾场”还是“宝藏”

但许多实验室还尚未向ClinVar提交数据,他们认为,这样的数据库只不过是易出错且不一致的遗传变异数据的“垃圾场”,而且它的使用可能会对公共卫生领域带来损害。一个经常被引用的数据显示,由多个实验室提交给ClinVar的17%的遗传变异数据,在其分类中并不一致。然而,Rehm和Invitae等商业实验室已将数据资源提交给ClinVar,并与行业的其他参与者合作以解决差异。他们认为,ClinVar是必要的,通过ClinVar可以暴露分类差异的问题,并提高信息解读的质量。

ClinVar数据提交方及其提交数量,图片来源:NCBI

“虽然我本人作为一名ClinGen数据库的研究员,在看法上可能存在偏见……但我仍认为ClinVar的快速增长和其统计数据的使用没有任何文献记载的危害。以客观的观点上来说,这一数据库已经成为一种宝贵的财富。”Rehm在GIM的评论中写道。

但诚然,这一领域还有很大的改进空间。例如,ClinVar目前根据所提交的基因变异数量列出实验室,但在数据库中,用户无法完全辨别提交的不同版本的数据。Rehm说:“对于一个新成立的实验室,他们可能提交了所有的数据。但作为一个大型且成熟的实验室,他们可能也是提交了相同数量的数据,这就存在问题了。例如,他们可能只提交了BRCA1/2基因突变的数据,因为Aetna等保险公司需要对该检测进行报销。”

在ClinVar中,不同的提交方式是由一个“星级系统”来区分的,尽管这个系统并没有指出这些信息是否准确。在这个系统中,如果提供了解释标准,实验室可以获得一个或者零颗星,当提交的内容没有任何不一致的时候,他们会得到两颗星。当ClinGen批准的专家小组审查了提交内容时,它会获得三颗星,这样可以超越个别实验室的解读;当一个实践指南机构审查了一份提交内容时,他们将获得四颗星。

Rehm在GIM的评论中指出,目前在ClinVar中,更容易理解三星或四星级与零颗星及一、二星之间的差异。然而,有零颗星和一颗星的提交数据之间的区别并没有那么清楚。

根据Rehm的说法,为了向公众更清晰地提供不同数据的可信度,ClinGen将会单独整理出自己的ClinVar数据,在那里ClinGen将删除不正确的解读数据。

虽然公众可用的数据质量将继续改善,但在她看来,医疗保健领域的其他利益相关者应更多地鼓励数据共享。特别是,Rehm呼吁美国病理学学会对大多数遗传学实验室进行认证,并向ClinVar提交一份保证实验室质量的要求。

至于临床实验室和研究人员,Rehm写道:“现在是提交数据的时候了!”

大部分实验室,包括美国两个最大的参考实验室Quest Diagnostics和美国实验室控股公司(LabCorp),目前还没有纳入ClinGen提供的数据共享质量保证列表中。“但这些实验室已经给我回应,他们正在努力达到标准,并计划将所有内容提交给ClinVar,”Rehm谈道,“我很高兴获得这份列表取得了积极影响。”

参考资料:

ClinGen Lists Labs Meeting Requirements for Quality Data Sharing on Genetic Variants

A new era in the interpretation of human genomic variation

https://www.ncbi.nlm.nih.gov/clinvar/docs/submitter_list/%20

https://www.clinicalgenome.org/

https://www.clinicalgenome.org/lablist/

(0)

本文由 测序中国 作者:王迪 发表,转载请注明来源!

关键词:,

热评文章