文章发表在Nature Biotechnology上
据文章介绍,Five-letter测序可以同时兼顾遗传学和表观遗传学信息,检测同一DNA分子上顺式的遗传和表观遗传标记组合,与目前的测序平台兼容(图1a)。该方法使用双碱基编码方法,即两个碱基的组合状态信息,可以明确地解码多达16个状态(图1c)。在其工作流程中(图1d),样本DNA首先通过超声处理片段化,然后连接到两端的短合成DNA发夹接头上。而后将该哑铃结构分开,对于每条原始样本DNA链,通过3′末端的DNA聚合酶延伸合成互补拷贝链,以产生发夹构建体,原始样本DNA链通过合成发夹与其互补链相连,缺乏表观遗传修饰。接着将测序接头连接到末端,将带有修饰的C保护起来,未受保护的C则脱氨形成尿嘧啶(图1d)。UvrD解旋酶加入到脱氨反应中,脱氨构建体不再完全互补,因此可以通过聚合酶链反应(PCR)扩增。这些构建体以配对端格式进行排序,其中read 1(P7引物)是原始链,read 2(P5引物)是拷贝链。reads数据成对对齐,因此read 1与其互补read 2对齐。来自两个read的同源残基通过计算解析以产生单个遗传或表观遗传代码(图1e)。
图1. Five-letter测序示意图。来源:Nature Biotechnology
cfDNA分析是诊断学的一个新兴领域,其应用领域包括增强的无创产前诊断、早期癌症检测和疾病监测。如何高效利用血液中提取的有限数量的cfDNA是一个巨大的挑战。一种可以同时检测来自同一样本的遗传和表观遗传信息的精确测序方法,可以改变cfDNA分析。研究团队利用Five-letter测序流程分析了Ⅲ期结肠癌患者的cfDNA。当DNA输入量从2ng增加到80ng时,PCR和簇复制率为38.2%到14.5%(图2)。当DNA输入量为2ng、10ng和80ng时,基因组中分别有90.85%、90.89%和90.35%被至少一条reads覆盖,平均测序深度分别为21.8×、27.6×和30.4×(图2b)。对于λ和pUC19 DNA对照,即使2ng混合样本中含有0.05ng对照DNA,Five-letter甲基化检测的准确性仍然很高,达到98%以上的敏感性,特异性分别为99.89%、99.94%和99.98%(图2c)。
图2. Five-letter测序的cfDNA检测应用。来源:Nature Biotechnology
5mC的酶促氧化产生5hmC。5hmC已被证明具有作为生物状态和疾病标志物的价值,包括从cfDNA检测早期癌症。研究人员进一步调整了研究方法,以实现对DNA序列中G、C、T、A、mC和hmC的检测(图2a)。该方法中reads使用图4b所示的双碱基代码进行成对比对和解析。unmodC(未修饰的胞嘧啶)、5mC和5hmC中的每一个都可以被解析,因为三个CpG单元具有不同的双碱基编码测序reads(图4b)。研究人员使用了完全未甲基化的pUC19载体和完全甲基化的lambda载体,就像在评估Five-letter测序方案中使用的那样,以及在特定CpGs中存在5hmC的额外短合成寡核苷酸。Six-letter测序方案在所有与这些CpGs比对的reads中正确识别了95.24%的5mC和97.93%的5hmC(图4c),并在所有reads中保持了很高的unmodC检测准确性(99.93%)。
图3. Six-letter测序示意图。来源:Nature Biotechnology
该研究开发了一个测序平台,该平台只需要较少的DNA输入量,可在单个工作流程和数据框架中以碱基分辨率提供包括5mC和5hmC的表观遗传信息,以及全部遗传学信息。该平台通过分子水平的双碱基编码机制与解码软件相结合,提高了基因测序和变异鉴定的准确性,并以高精度检测表观遗传信息。该平台比对使用四碱基系统,比亚硫酸氢盐测序或EM-seq使用的三碱基比对更快、更准确。在单一的实验和数据工作流程中获取准确的遗传和表观遗传信息,可提供更全面的生物学信息,易于使用和降低成本,可以在生命科学研究和疾病诊断方面提供许多优势。
参考资料:
Füllgrabe, J., Gosal, W. S., Creed, P., Liu, S., Lumby, C. K., Morley, D. J., ... & Balasubramanian, S. (2023). Simultaneous sequencing of genetic and epigenetic bases in DNA. Nature Biotechnology, 1-8.
本文由 SEQ.CN 作者:白云 发表,转载请注明来源!