科研

首页 - 全部文章 - 科研 - AJHG | 基因分型阵列和插补的准确性可通过阵列、panel以及样本选择提高,进而接近深度WGS准确性

AJHG | 基因分型阵列和插补的准确性可通过阵列、panel以及样本选择提高,进而接近深度WGS准确性

了解人类疾病和性状的遗传基础依赖于对遗传变异的识别和准确的基因分型。深度全基因组测序(WGS)可准确捕获最小等位基因频率(MAF)谱中的大多数单核苷酸变异(SNV),也是单核苷酸多态性(SNP)和小片段插入/缺失(InDel)鉴定和基因分型的金标准技术。随着测序技术的进步及测序成本的降低,使得更大规模的人类测序研究成为可能。但对于大型研究来说,深度WGS仍然非常昂贵,并且计算密集。
与WGS相比,基因型阵列可分析数十万到数百万的变异,成本更低,但低频变异(0.5% < MAF≤5%)和罕见变异(MAF≤0.5%)出现的频率较低,panel有可能会遗漏,使其插补不准确。因此,一直以来,人们大多认为使用基因型阵列和插补代替深层WGS,会导致罕见遗传变异的覆盖率较低和基因分型的准确性较低。有没有办法能够解决这一难题呢?
近日,来自意大利吕贝克大学生物医学研究所的研究团队发现,基因分型阵列和基因型插补的准确性可通过panel、基因分型阵列、样本祖先的选择得以提高,进而接近深度WGS的准确性,但不能完全替代深层WGS该研究结果已发表The American Journal of Human Genetics上,文章题为“Extent to which array genotyping and imputation with large reference panels approximate deep whole-genome sequencing”。

文章发表在AJHG

研究团队分析了来自非洲、西班牙裔/拉丁裔、欧洲和芬兰血统研究的深度WGS数据,使用Illumina Core、OmniExpress、MEGA和Omni 2.5M阵列上的遗传变异和1000G、HRC和TOPMed imputation panel进行基因型插补,以量化基因分型阵列和插补的准确性可以在多大程度上接近WGS。结果显示,在所有参考组和MAF组合中,Omni 2.5M可以很好地插补出≥90%的双等位基因SNV (r2 > 0.8)(图1)。与HRC或1000G panel相比,基于TOPMed的插补准确性接近于低MAF变体的WGS。基于TOPMed的panel插补结果显示,非洲和西班牙裔/拉丁裔的MAF阈值低于欧洲或芬兰裔(0.35%和0.85%)。

图1:通过panel、样本祖先和基因分型阵列分析得到的双等位SNV比例(r2 > 0.8)。

为了衡量个体水平的插补质量,研究团队计算了每个个体中特异性罕见、低频和常见双等位SNV的杂合子测序结果和基因型插补之间的一致性。结果显示,罕见变异的一致性率在个体间的差异大于低频和常见变异(图2)。在TOPMed小组中,与欧洲和芬兰血统的个体相比,非洲和西班牙/拉丁裔个体罕见变异的平均杂合子一致性更高,其中西班牙裔/拉丁裔个体中一致性率变化最大。该结果表明,在上述人群中采用TOPMed panel的研究人员可选择更便宜、信息损失小的OmniExpress阵列。

图2:TOPMed插补中由祖先划分的罕见变异杂合基因型一致性率。

随后,研究团队对4个队列的基因型插补质量进行分析,发现较高的重组率、较低的GC含量、基因型阵列变异体较大的距离、更多的SV以及片段重复的存在都与较低的插补质量相关(图3)。

图3:基因特征与双等位基因SNV的TOPMed遗传归因质量相关。

为了量化与群体水平相比的个体基因型插补质量,研究团队计算了双等位基因SNV与基因型插补的最佳预测基因型之间的杂合子一致性,发现非洲、西班牙裔/拉丁裔和欧洲血统中的罕见和低频率变异一致性率差异较大,并与更细尺度的祖先相关。由于这种变异性,以及大量罕见变异无法用现有的panel进行准确插补,研究团队认为,目前在使用基因分型阵列和使用该研究的panel进行插补的临床环境中,尚无法使其低频变异的检测准确性可靠的替代WGS,但可以根据基因型阵列、panel以及样本祖先的选择进行提高,使其接近WGS的准确性和覆盖率。

综上所述,研究团队量化了在美国、非洲裔、西班牙裔/拉丁裔和欧洲裔以及芬兰裔人群中利用阵列完成基因分型后,进行基因型插补可以近似WGS准确性的程度。虽然阵列基因分型和插补不能完全替代深层WGS,但可以根据基因型阵列、panel以及样本祖先的选择将准确性提高,使其接近WGS。
参考资料:
Extent to which array genotyping and imputation with large reference panels approximate deep whole-genome sequencing. Sarah C. Hanks, Lukas Forer, Sebastian Schönherr, et al. AJHG, 2022.DOI:https://doi.org/10.1016/j.ajhg.2022.07.012
https://www.cell.com/ajhg/fulltext/S0002-9297(22)00316-0
(0)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

热评文章