文章发表在Genome Biology
图1. 解码性状相关组织和细胞类型的分析框架。
图2. scGWAS方法概述。
研究团队通过18个单细胞panel(single-cell panel)将scGWAS应用在40个GWAS数据集中,共报告了437种组织细胞类型,最终确定了2,533个性状-细胞类型的关联。结果显示,在18个panel中,小胶质细胞、两个兴奋性神经元(Ex2和Ex8)和星形细胞等四个大脑panel显示的关联数量最多。在所有性状中,冠心病静息心率(CAD_RHR)的关联数量最多,其次是抑郁症状(DS)、阿尔茨海默病(ALZ)、冠心病(CAD)、1型糖尿病(T1D)。身高、心力衰竭、肺功能和内化问题等四个性状的关联数量最少。
图3. scGWAS结果图示。
接下来,研究团队进行了一系列富集分析以评估由scGWAS识别的模块基因,使用基于ExAC数据集中带有pLI注释的基因、ClinVar数据集和OMIM基因对其进行验证。结果显示,与多数GWAS促进的基因和表达促进的基因相比,scGWAS鉴定出的模块基因在大多数组织和三个重要功能基因组中的表现更优异。
图4. 独立验证scGWAS结果。
研究团队选择了由多个panel报告的细胞类型来进行性状-细胞关联的panel评估,其主要是来自大脑、胰腺和免疫系统的细胞。跨panel比较表明,scGWAS发现的关联是可靠且可复制的。
图5. 基于模块基因的性状间相关性研究。
考虑到多个性状或疾病可能与相同的细胞类型有关,研究团队分析了研究性状中的共享基因。首先收集了每种细胞类型的相关性状,并根据模块基因计算了Jaccard指数(JI),确定了三个主要性状组:免疫(哮喘,T1D,T1D_C,MS和RA),脂质(TG,HDL,LIP_HDL和TC)和脑部疾病(GNEU,DS,NEU,ALS等)。通过检查高度重叠基因的性状对,发现同一组中的性状通常比与非相关组的性状具有更多的共享基因。上述结果表明,共享遗传成分的性状在同一细胞类型中往往具有更多的模块基因。
图6. 利用肺panel进行特征细胞类型关联。
综上所述,研究团队开发了一种新方法——scGWAS,并将其应用于40个涵盖了各种复杂人类特征的GWAS数据集中。分析了许多已被充分研究的性状组织-细胞类型关联,并进一步揭示了先前未报道的新关联,为未解决的特征组织关联提供了见解。总而言之,该研究表明scGWAS是利用scRNA-seq数据在细胞类型水平上探索复杂疾病的有力工具。
参考文献:
Jia P, Hu R, Yan F. et al. scGWAS: landscape of trait-cell type associations by integrating single-cell transcriptomics-wide and genome-wide association studies. Genome Biol 23, 220 (2022). https://doi.org/10.1186/s13059-022-02785-w
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!