人类的免疫系统是抵御病毒、细菌等病原体的天然防线,而人类白细胞抗原(HLA)基因正是这场防御战的核心角色。HLA基因不仅决定了我们是否容易感染某些疾病,还深刻影响着人类种群的遗传多样性和进化方向。HLA基因区域是人类基因组中多态性最高的区域之一,全球已发现超过3万种HLA等位基因变体。这种多样性并非偶然,而是长期病原体压力下的自然选择结果,例如HLA-B*53在疟疾高发的非洲地区高频出现,因为它能增强对疟原虫的免疫力;而HLA-A*02:01和HLA-B*08:01在欧洲人群中常见,因为它们对流感病毒的清除效率更高。然而,HLA的适应性并非绝对有益。某些等位基因在抗感染的同时,可能增加自身免疫疾病风险,例如HLA-B*27携带者对某些细菌(如克雷伯菌)的清除能力更强,但高达80%的强直性脊柱炎患者也携带该基因;HLA-DRB1*04能识别多种病毒抗原,但与类风湿性关节炎的发病密切相关。这种“利弊权衡”体现了自然选择的复杂性——在病原体肆虐的时代,生存优势远大于疾病风险,而在病原体压力显著降低的现代环境中,这些基因的自身免疫风险可能被放大。
近日,中国科学院生物物理研究所团队在《Genomics, Proteomics & Bioinformatics》杂志发表了题为“The Pathogen Adaptation of HLA Alleles and the Correlation with Autoimmune Diseases in the Han Chinese”的文章。该研究以“女娲”基因组资源为核心,结合先进的HLA基因分型工具针对世界范围内8278个个体的31个HLA基因进行了分辨率高达6-digit的基因分型,在氨基酸序列水平实现了94%~97%的准确率。该HLA基因数据资源(http://bigdata.ibp.ac.cn/HLAtyping),为世界人群尤其是中国汉族人群的HLA基因多样性提供了参考(图1)。基于HLA数据资源,该研究系统探索了中国汉族人群中HLA基因的病原适应性与自身免疫疾病易感性之间的遗传关联,为解读疾病的起源和发展提供了演化医学的视角。
图1 HLA数据资源概览及在HLA基因演化中的应用
基于大规模人群全基因组测序数据,“女娲”基因组项目此前已经发布和解析了人类基因组SNP/InDel变异图谱(Cell Reports, 2021),移动元件变异图谱(MEI,Nucleic Acids Research, 2022),微卫星变异图谱(STR, Nature Communications, 2023)和小卫星变异图谱(VNTR, Cell Genomics, 2024),并综合多个层面的变异注释信息构建了变异解析数据库TOAnnoPriDB,用于突变遗传变异的潜在功能影响和疾病关联(Science Bulletin, 2025),同时还基于基因组中的近期正选择(Science Bulletin, 2023)及非编码调控元件适应性选择(Molecular Biology and Evolution, 2024),探讨了其对人类表型和疾病演化的影响。
每种病原体(如病毒、细菌、寄生虫)产生的抗原肽具有独特的序列特征,而不同HLA由于其序列和结构差异也会对抗原肽有着不同的结合能力。从演化医学角度出发,在长期进化过程中,携带特定HLA等位基因的个体因能更有效地清除某些病原体而被自然选择保留。不同HLA等位基因逐渐特化以结合特定病原体的抗原肽,形成“病原体-HLA等位基因”匹配关系。该研究基于HLA分子呈递抗原的性质,利用NetMHCpan-4.1和NetMHCpanII-4.0工具预测了样本人群中所有HLA基因类型对常见的31种病原体抗原短肽的结合亲和力得分。结果发现,HLA-DRB1基因相比于其它HLA基因,对常见病原体抗原具有更强的结合能力。其中,HLA-DRB1*07:01(人群频率AF=8.1%)展现出对白喉杆菌强的结合能力,HLA-DRB1*08:03(AF = 6.2%)展现出对破伤风梭菌和炭疽杆菌强的结合能力,HLA-DRB1*14:54(AF = 2.7%)展现出对炭疽杆菌强的结合能力。除此之外,HLA-DQB1*03:01(AF = 22%)展现出对结核分枝杆菌强的结合能力,HLA-DQB1*06:01(AF = 10%)展现出对百日咳杆菌强的结合能力(图2)。
图2 HLA基因的病原抗原结合图谱
由于基因多效性和HLA区域的连锁不平衡,HLA基因在帮助群体抵御外源病原体的同时,也会影响群体中自身免疫疾病易感性的演化轨迹。该研究通过进一步分析病原适应的HLA基因与自身免疫疾病相关的HLA基因之间的遗传关联,发现许多病原适应HLA基因会增加自身免疫疾病的风险。例如,对常见病原体尤其是白喉杆菌具有适应能力的HLA-DRB1*07:01基因,会造成炎症性肠炎、乳糜泻和银屑病的风险增加;对常见病原体尤其是白破伤风梭菌和炭疽杆菌具有适应能力的HLA-DRB1*08:03基因,会造成类风湿性关节炎和多发性硬化症的风险增加;对百日咳杆菌具有较强适应能力的HLA-DQB1*06:01基因,会造成多发性硬化症的风险增加;而对结核分枝杆菌具有较强适应能力的HLA-DQB1*03:01基因,反而会减小多发性硬化症的风险(图1和图3)。
图3 病原适应HLA与自身免疫疾病关联图谱
综上所述,“女娲”HLA基因数据资源通过提供覆盖大规模人群、涵盖世界范围多种族的高精度HLA基因数据,展示了人群HLA基因信息的多样性和差异性,也将长期为人群HLA基因研究提供参考。基于该HLA数据资源在病原适应与自身免疫疾病的演化研究中的应用,揭示了人群在病原微生物环境中的长期演化与自身免疫疾病发生发展之间的紧密关联。这体现了人类群体演化过程中,基因的演化会受到多种因素的制约。在现有一套“不完美”的基因库基础上,以种群延续为核心原则,对各种表型采取“利弊权衡”策略,实现群体演化的优势最大化。通过从群体演化的视角看疾病在人群中的演化规律,不仅为深入理解疾病的起源与人群演化提供了新思路,也为未来优化医学实践、应对现代健康危机提供重要支持。
中国科学院生物物理研究所徐涛院士、何顺民研究员为该文的共同通讯作者。生物物理研究所刘帅、李燕燕、宋廷瑞为该文的共同第一作者。何顺民研究组的张晶晶、张鹏、罗华夏、张斯佳、牛仪伟等人也参与了该项研究工作。该研究得到了国家重点研发计划、国家自然科学基金、中国科学院战略性先导科技专项(B类)等经费的支持。
全文详见:
https://academic.oup.com/gpb/advance-article/doi/10.1093/gpbjnl/qzaf038/8121947
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!