线粒体参与多种生物学过程,包括细胞凋亡、寿命调节、胞质钙缓冲、固有免疫和细胞周期。像千人基因组计划1KGP和gnomAD这样的大规模mtDNA研究主要集中于欧洲人群,来自东亚人群,特别是中国人群的数据仍然有限。

近日,中国科学院生物物理研究所团队在《Genomics, Proteomics & Bioinformatics》杂志发表了题为“Mitochondrial Genome Variants and Nuclear Mitochondrial DNA Segments in 7331 Individuals from NyuWa and 1KGP”的文章。该研究以“女娲”基因组资源为核心,整合千人基因组1KGP,对7331个个体的线粒体变异和核线粒体片段(NUMTs)进行分析。该研究共鉴定出7216个高质量的mtDNA变异,将其划分为22个宏单倍群;同时检测到1466个unique NUMTs,其中88个mtDNA变异和642个NUMTs为NyuWa特有。全基因组关联分析表明,有12个mtDNA变异与199个核基因组变异显著相关。该研究首次系统描绘了中国人群NUMTs的全景图,建立了迄今最全面的中国人群mtDNA变异与NUMTs资源,为线粒体相关疾病的遗传学研究提供了重要参考。
该研究基于7331份全基因组测序数据(NyuWa与1KGP队列),在质量控制后获得7266个用于mtDNA变异分析的样本和7324个用于NUMTs分析的样本。检测到约12万个非参考NUMTs事件,平均每人16.44个,整合后识别出1466个独立NUMTs(长度5–16,568 bp,平均881.7 bp),其中短插入(<500 bp)占89.15%。按群体频率划分,NUMTs以极罕见型为主(84.79%),仅少部分为常见或罕见型。
共检测到268,746个mtDNA变异,经去重后,共获得7216个高置信度mtDNA变异。大多数变异在NyuWa和1KPG人群中的频率较低(图1F)。在3,343个样本(46%)中检测到异质性变异(图1G),超过80%的样本携带一至两个异质性变异。变异分布分析显示,NyuWa和1KGP人群中分别有1409个(19.53%)为仅异质性变异,4639个(64.29%)为仅同质性变异(图1H)。异质性变异的群体频率普遍较低,而同质性变异的频率分布范围较广(图1I)。图1J展示了两个人群中所有mtDNA变异的整体分布,包括群体频率及变异密度。

图1 mtDNA变异和NUMTs的特征
通过对比NyuWa队列与其他数据库,系统分析了mtDNA变异与NUMTs的分布特征。新发现88个NyuWa特异性变异,多为低频单例(图2A,2F)。在6名个体中观察到的NyuWa特异性变异m.8273CCCCTCT>C的位置与m.8273_8281del重叠,后者据报道与中国母系遗传性原发性高血压(MIEH)相关。在NUMTs分析中,NyuWa共鉴定821个NUMTs,其中85.87%为超罕见变异,并识别出642个中国特有NUMTs(图2G-H)。

图2NyuWa人群线粒体DNA变异与其他资源的比较
在3945个无亲缘样本的全基因组关联分析中,发现12个mtDNA变异与199个nDNA变异显著相关(FDR_BH < 0.05/93 = 5.4 ×10−4),其中9个位于蛋白编码基因且均为单倍群标记。m.4769A>G(位于MT-ND2基因)表现出最强关联信号(图3A),已被报道与抽动障碍(TDs)相关。与m.9950T>C显著相关的核变异rs76843687在东亚人中的发生频率高于欧洲人(图3B)。更严格阈值下(P=5.0 × 10-8/93 = 5.4 × 10-10),确定8个mtDNA变异与59个nDNA变异之间存在显著关联。

图3 线粒体DNA变异m.4769A>G与核基因变异的关联,以及rs76843687和m.9950T>C的跨人群频率分析
该研究查看了NUMTs断裂位点在mtDNA上主要富集区域,其中常见NUMTs断裂点多集中于mtDNA中部(图4B)。在核基因组中,NUMTs广泛分布于所有染色体(图4C),且不同类型NUMTs具有不同基因组偏好性;常见NUMTs倾向位于基因组重复区、简单重复序列及miRNA/snoRNA区域,而罕见NUMT则显著富集于LINEs元件(NyuWa队列中尤为显著,P = 0.004)(图4D)。

图4 NUMTs插入特征
全文详见:
https://academic.oup.com/gpb/advance-article/doi/10.1093/gpbjnl/qzaf098/8315149?login=true
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!