科研

一文盘点 | 人早期胚胎单细胞DNA甲基化研究

1、表观遗传与DNA甲基化

基因组DNA序列由A、T、C、G四种碱基组成,承载了重要的遗传信息。人体由近4万亿个细胞组成[1],都从同一个受精卵细胞发育而来,几乎所有的细胞都包含相同的DNA序列。但是,为什么同一个受精卵发育而来的细胞会形成不同的组织和器官?表观遗传起了决定性的作用。

表观遗传是指基因组DNA序列以外可遗传的信息,包括DNA甲基化、组蛋白修饰、染色质的重塑和三维空间构象等。尽管不同细胞都拥有相同的DNA序列,但如果表观层面的信息发生了变化,细胞的命运也会随之改变。

DNA甲基化是研究得较多的一类表观遗传信息。在哺乳动物基因组上,胞嘧啶(C)在DNA甲基化酶的作用下(如DNMT1、DNMT3A、DNMT3B,DNMT3L),会在第5位碳上加上一个甲基(-CH3),我们称之为DNA甲基化(5mC)。研究显示DNA甲基化主要发生在基因组上CpG二连体的C上,这种回文序列在一定程度保证了DNA甲基化信息的可遗传性。在细胞复制时,维持DNA甲基化的酶(DNMT1)会促进新合成的DNA链继承模板链的甲基化状态。

近年来的研究显示,DNA甲基化在许多生物过程中都起着关键的调控作用,例如基因表达的调控、转座子的活性、X染色体失活以及基因组印记维持等[2]。基因组DNA甲基化存在组织特异性,且与发育、衰老密切相关,异常的DNA甲基化通常发生在许多疾病甚至癌症细胞的基因组中。

2、单细胞全基因组DNA甲基化检测

早在2009年,汤富酬教授等人开发了第一个单细胞转录组测序技术[3]。随后,2011年Nicholas等人开发了单细胞基因组测序技术[4]。但是对于DNA甲基化,却没有一个单细胞水平全基因组范围检测的方法被开发出来。

汤富酬教授一直致力于研究人早期胚胎发育过程的组学重编程和重要的调控网络。为了从表观层面进行系统研究,汤富酬课题组于2013年开发出了第一个实现单细胞全基因组DNA甲基化检测的方法(scRRBS)[5,6],如图1。

图1 单细胞DNA甲基化测序方法scRRBS实验流程示意图(Guo et al., 2015)。

技术特点:多步反应体系都在一个试管中进行,减少模板DNA损失,实现单细胞水平检测。

由于人的胚胎样本非常珍贵且难以获得,单细胞DNA甲基化检测方法的开发无疑大力推进了人早期胚胎DNA甲基化重编程的研究。

3、人早期胚胎DNA甲基化重编程研究

2014年,Nature同一期背靠背发表了2篇文章,同时报道了人早期胚胎发育过程中DNA甲基化的动态变化特征,并对不同发育阶段的胚胎进行了深入的比较分析,其中1篇就来自汤富酬课题组[7,8]。

研究显示,人的精子细胞全基因组范围呈现高甲基化水平,卵细胞相对较低,一旦受精之后,DNA甲基化水平迅速降低,到囊胚阶段降到最低,而在胚胎着床之后全基因组又呈现非常高的DNA甲基化水平,如图2。

在汤富酬课题组发表的文章中,研究者们还深入分析了DNA甲基化和基因表达、组蛋白修饰以及转座子活性之间的关系。研究发现,基因启动子区域的DNA甲基化程度和基因表达呈现负相关,且这种负相关强度随着胚胎的发育逐渐增强,预示着早期胚胎合子基因组激活之后,胚胎基因组逐渐弱化对母亲转录组的依赖,主导自身基因表达的调控。

图2 人早期胚胎发育不同阶段DNA甲基化动态变化(Guo et al., 2014)。

(a)基因区域不同发育阶段胚胎的DNA甲基化变化。(b)基因组范围不同发育阶段胚胎的DNA甲基化变化。

紧接着,2015年,Cell发表了汤富酬课题组对人原始生殖细胞(PGC)DNA甲基化和转录组动态变化的研究[9]。

PGC中的DNA甲基化动态变化相当于早期胚胎发育过程中的第二轮DNA甲基化重编程,发生在胚胎着床之后,主要表现为PGC全基因组范围内发生大规模DNA去甲基化。换言之,受精之后,胚胎通过两轮大规模的去甲基化,PGC形成特异的低甲基化状态,如图3。

图3 类生殖细胞系(精子、卵细胞及原始生殖细胞)、囊胚以及着床后胚胎体细胞的DNA甲基化水平示意图。(http://biopic.pku.edu.cn/content.aspx?id=370)

这些研究结果第一次展示了人早期胚胎发育过程中过山车似的DNA甲基化动态变化,为进一步研究DNA甲基化在人早期胚胎发育过程中的关键调控作用提供了重要线索。

4、人早期胚胎单细胞DNA甲基化研究

随着DNA甲基化研究技术方法的开发和改进,DNA甲基化的相关研究越来越多。

虽然我们已在人的早期胚胎中对DNA甲基化重编程进行了深入分析,要理解DNA甲基化在早期胚胎发育中发挥的重要作用和参与机制还需要更多的系统性研究。

已有数据显示,有相当一部分早期胚胎会发生染色体拷贝数异常[10,11],这些含有异常染色体拷贝的胚胎或细胞中DNA甲基化是否异常?另外,同一个胚胎中的不同单细胞之间是否存在DNA甲基化异质性?父亲和母亲遗传的DNA甲基化信息是否一致?

虽然单细胞甲基化检测方法已较为成熟,但此前针对人的早期胚胎DNA甲基化的研究却并非基于单细胞,且已产生的全基因组甲基化数据存在两个问题:研究的发育阶段不全[12]或全基因组的甲基化信息较少[7,8]。

为了排除染色体拷贝数异常的影响,建立人早期胚胎发育过程中正常胚胎的DNA甲基化图谱,研究全基因组范围内的甲基化重编程、细胞间的甲基化异质性以及父母本基因组甲基化差异,我们开展了第一个单细胞水平的人早期胚胎DNA甲基化研究,主要研究结果于2017年12月发表在Nature Genetics上[13]。

5、早期胚胎中染色体拷贝数异常与DNA甲基化的关系

DNA甲基化测序的主体信息是DNA序列信息,只是将没有甲基化的C替换成T来区别甲基化与非甲基化。因此,DNA甲基化测序数据可以用来评估大范围的染色体拷贝数变异(CNV),甚至是单碱基分辨率的单核苷酸突变(SNV)。

通过分析480个单细胞的染色体拷贝数,我们发现,在62个着床前的胚胎中有33个胚胎含有至少1个拷贝数异常的卵裂球。这意味着近一半的胚胎出现了染色体拷贝数异常。

进一步的比较分析显示,早期胚胎中染色体拷贝数一旦增加,全基因组整体的DNA甲基化水平会降低,相反,染色体拷贝数减少则整体DNA甲基化水平上升,如图4。

这些数据显示,要建立人的早期胚胎发育过程中正常的DNA甲基化图谱,我们必须排除染色体拷贝数异常的影响。在去除拷贝数异常的细胞之后,我们对拷贝数正常的细胞基因组DNA甲基化进行了深入分析。

图4 人早期胚胎拷贝数异常与DNA甲基化相关。

左侧显示了不同发育阶段的胚胎中单细胞拷贝数分布(红色为拷贝数异常的细胞),右侧显示拷贝数变化与DNA甲基化的关系。
6、De novo DNA甲基化

此前基于scRRBS和RRBS方法的研究结果显示,受精之后,全基因组范围内会发生迅速的去甲基化,到囊胚阶段DNA甲基化水平降至最低[7,8]。

由于RRBS技术方法的限制,我们只能够检测到全基因组上5%左右的CpG位点的甲基化信息,且这些位点主要集中在CpG相对密集的区域,如CpG岛、启动子等。在早期胚胎发育过程中,基因组其他区域的DNA甲基化如何变化?

此次,我们采用post-bisulfite adaptor tagging(PBAT)方法对人的早期胚胎发育各个阶段进行了深度测序,平均一个细胞能捕获全基因组上20%的CpG位点。

通过比较不同发育阶段的DNA甲基化数据,我们发现从早期雄原核到中期雄原核、4细胞到8细胞发育阶段都出现了DNA甲基化水平升高的趋势。

进一步细分基因组不同区域比较,也能发现显著的DNA加甲基化,如图5。这意味着在人的早期胚胎发育过程中,DNA甲基化重编程不仅仅是一味的去甲基化,而是去甲基化和de novo加甲基化动态平衡的过程。

富集分析显示,这些加甲基化的区域主要集中在转座子区域。在我们2014年Nature文章中[7],我们报道了转座子在受精之后活性增强,我们进一步比较发现,其活性增强趋势与de novo加甲基化趋势非常吻合。

我们推测人早期胚胎通过全基因组大幅度去甲基化获得多能性,而通过de novo DNA甲基化抑制转座子的活性,从而维持早期胚胎基因组的稳定性。

图5 人早期胚胎不同阶段DNA甲基化动态变化。

(a)早期雄原核到中期雄原核、4细胞到8细胞显著的de novo加甲基化。(b)PRKCZ基因内含子区域de novo加甲基化示例。

7、父母本基因组甲基化差异

早在2014年的研究中,我们报道了精子和卵细胞受精之后,雄原核快速去甲基化,到合子晚期,雄原核的DNA甲基化水平已经低于雌原核[7]。

但是当雌雄原核融合之后,胚胎从父亲和母亲遗传的基因组上各自DNA甲基化如何变化?为了回答这个问题,我们利用二项分布和贝叶斯模型分析DNA甲基化测序数据,预测基因组上的杂合单核苷酸多态性位点,从而区分胚胎中父亲和母亲的基因组信息,进而比较父母本基因组的DNA甲基化差异。

分析结果显示,从2细胞到囊胚阶段,胚胎从父亲遗传的基因组上,DNA甲基化已降至比母亲基因组更低的水平,如图6。甚至在着床之后(包括胚和胎盘),尽管父母本基因组甲基化水平都非常高,父本基因组甲基化水平仍比母本基因组低。这预示着母本基因组对早期胚胎发育的调控可能发挥更加重要的作用。

图6 人早期胚胎发育过程中父母本基因组DNA甲基化动态变化。

(a)父本基因组为红色,母本基因组为蓝色。(b)示例显示母本基因组甲基化比父本基因组甲基化水平高。

8、单细胞DNA甲基化异质性助力追踪细胞分裂谱系

人早期胚胎中每个细胞的基因组DNA甲基化是否具有异质性?如果有异质性,我们能否根据DNA甲基化区分不同单细胞的遗传谱系?

为了回答这些问题,我们首先在小鼠2细胞阶段的胚胎中,利用荧光染色标记了其中一个细胞,等到胚胎发育到4细胞阶段时,我们能够非常清楚的观察到其中2个细胞都带有荧光标记,而另外2个细胞没有。由此,我们可以判断带有荧光标记的2个细胞由同一个母细胞分裂而来。

通过比较小鼠多个4细胞阶段每个细胞的DNA甲基化数据,我们发现,小鼠4细胞胚胎中由同一个母细胞分裂而来的2个细胞之间,DNA甲基化呈现负相关。进一步分析人4细胞胚胎中的数据,我们发现了类似的相关性分布模式,我们推测在人4细胞胚胎中,DNA甲基化呈现负相关性的2个细胞来自同一个母细胞,如图7。

由此,我们第一次在早期胚胎中利用DNA甲基化信息追踪了单个细胞的遗传谱系。

图7 单细胞DNA甲基化测序追踪细胞遗传谱系。

(a)荧光染色显示 4细胞阶段胚胎中有2个细胞带有荧光。(b-c)4细胞阶段胚胎内部4个细胞间DNA甲基化相关性分布和示例。

9、精子和卵细胞全基因组范围DNA甲基化差异

精子和卵细胞(Metaphase II oocyte)全基因组DNA甲基化水平存在较大差异,这些配子特异的DNA甲基化存在于基因组的哪些区域?

此次我们测得的DNA甲基化数据在精子和卵细胞基因组上分别覆盖到93%和82%的CpG位点,为系统比较精子和卵细胞全基因组的DNA甲基化差异提供了数据支持。

我们发现,在基因组上17.1%的区域,精子甲基化水平高于卵细胞,仅0.8%的区域在卵细胞中特异高甲基化,如图8。

我们进一步分析差异甲基化区域在基因组上的分布,结果显示,精子特异高甲基化的区域主要富集在体细胞特异的增强子和转座子区域,而卵细胞特异高甲基化的区域则集中分布在CpG岛、启动子以及转座子区域。

这些分布特征表明,尽管精子和卵细胞基因组高甲基化区域有各自的分布偏好,但都会在转座子区域明显富集,预示受精之后,合子基因组在转座子区域呈现出较高甲基化水平,维持基因组稳定性。

图8 卵细胞特异高甲基化区域热图。

受精之后,卵细胞特异高甲基化区域迅速去甲基化,到着床之后又迅速加甲基化。

父母本特异的DNA甲基化分析,可参考中国农业大学郭伟龙博士和中国医学科学院血液学研究所朱平副研究员最新发表在Bioinformatics杂志的DNA甲基化数据分析和可视化工具:CGmapTools[14]。

北京大学生命科学学院生物动态光学成像中心朱平博士(现为中国医学科学院血液病医院血液学研究所副研究员)、郭红山博士、侯宇博士,以及北京大学第三医院博士生任一昕为该论文的并列第一作者;北京大学生命科学学院汤富酬研究员、北京大学第三医院乔杰教授、闫丽盈研究员为该论文的共同通讯作者。该项研究得到了国家自然科学基金、国家重大科学研究计划、北京市科学技术委员会、国家高技术研究发展计划、北京未来基因诊断高精尖创新中心的资助。

文章共同一作朱平副研究员(中国医学科学院血液病医院血液学研究所),主要研究方向为造血发育和血液疾病的组学研究,包括基因组、转录组和表观遗传,结合单细胞组学技术和生物信息分析方法,致力于解析造血关键的调控网络,为血液疾病的诊断和治疗提供更好的解决方案。目前,课题组参与人血细胞分子图谱计划(Atlas of Blood Cells,http://www.chinablood.com.cn/system/2017/09/08/014009860.shtml),建立人体内正常生理的造血图谱,为造血和血液疾病相关研究提供分子基础。

参考文献

1. Bianconi, E. et al. An estimation of the number of cells in the human body. Annals of Human Biology 40, 463–471 (2013).

2. Bird, A. DNA methylation patterns and epigenetic memory. Genes Dev. 16, 6–21 (2002).

3. Tang, F. et al. mRNA-Seq whole-transcriptome analysis of a single cell. Nat Meth 6, 377–382 (2009).

4. Navin, N. et al. Tumour evolution inferred by single-cell sequencing. Nature 472, 90–94 (2011).

5. Guo, H. et al. Single-cell methylome landscapes of mouse embryonic stem cells and early embryos analyzed using reduced representation bisulfite sequencing. Genome Res. 23, 2126–2135 (2013).

6. Guo, H. et al. Profiling DNA methylome landscapes of mammalian cells with single-cell reduced-representation bisulfite sequencing. Nature Protocols 10, 645–659 (2015).

7. Guo, H. et al. The DNA methylation landscape of human early embryos. Nature 511, 606–610 (2014).

8. Smith, Z. D. et al. DNA methylation dynamics of the human preimplantation embryo. Nature 511, 611–615 (2014).

9. Guo, F. et al. The Transcriptome and DNA Methylome Landscapes of Human Primordial Germ Cells. Cell 161, 1437–1452 (2015).

10. Vanneste, E. et al. Chromosome instability is common in human cleavage-stage embryos. Nat. Med. 15, 577–583 (2009).

11. Ambartsumyan, G. & Clark, A. T. Aneuploidy and early human embryo development. Hum. Mol. Genet. 17, R10–5 (2008).

12. Okae, H. et al. Genome-Wide Analysis of DNA Methylation Dynamics during Early Human Development. PLOS Genet10, e1004868 (2014).

13. Zhu, P. et al. Single-cell DNA methylome sequencing of human preimplantation embryos. Nat Genet 50, 12–19 (2017).

14. Guo, W. et al. CGmapTools improves the precision of heterozygous SNV calls and supports allele-specific methylation detection and visualization in bisulfite-sequencing data. Bioinformatics (2017). doi:10.1093/bioinformatics/btx595

作者:朱平博士

(3)

本文由来源 北大生科,由 王迪 整理编辑!

热评文章