资讯

NGS接头暗号 | 论一个全能接头的”自我修养”

上篇《NGS悬案 | 样本先生,您带错帽子了》结尾(点击链接,查看上篇精彩内容),我们提到了“一个优秀index的自我修养”,其中包括生产过程的准确性,针对平台的优化,和考虑index的容错性等方面。今天我们就来谈谈,在实际的建库过程中使用的DNA片段链接的接头(adapter),需要具备哪些要素。

全能接头的“自我修养”

illumina的Y型接头是一个公认的聪明又漂亮的设计。自推出以来,仿者众多,虽不尽相同,但异曲同工。随着测序通量的迅速提高和样本通量的相应增加,接头上带有的index序列也在不断变化。从最初的TSLT (low throughput)单端index,变化到TSHT (high throughput)的双端index,以期满足不同混样程度的需求。

然而,随着index hopping(标签跳跃)的问题显露,这些index接头策略显然已不能满足需求。在illumina白皮书中提到的降低index misassigment几条操作里,排在首位的即为Prepare dual indexed library with unique indexes,意思就是采取p5和p7都带有独特的标签,两端交叉检验,去除index misassignment的干扰。

我们一起来看一种新型“3合1”接头结构。这种接头,功能更强大,设计中处处体现了“一个全能接头的自我修养”。

在P5和P7端的蓝色部分为index,且index 1与index 2 为一组特异性搭配的unique dual index(UDI)。P7端绿色部分为Unique Molecular Identifier(UMI)。我们称之为“3合1新型接头”。所谓“3合1”,一方面是指含有P5 index,P7 index和UMI三种元件;另一方面是指同一种接头,有不同的三种应用。三种不同的读取方式,可以行使三种不同的功能。

“3合1”接头最精巧的部分就是P5 index 1和P7 index 2 成组设计。首先,这两个index本身的序列在设计层面上完全满足了我们之前文章提到的“一个优秀index”需要满足的各种因素。其次,两个index 可以进行双重检验,这样可以剔除在各个阶段由于串扰而导致的index misassignment的reads,保证进入最终分析流程的reads可以最接近真实样品。

1.降低实验操作中引入的各种污染

下图是一种最常用的双端index组合标记DNA片段的index。当时这种index的推出,大大增加了混样的上限。但是实际操作永远不可能尽善尽美,一直存在交叉污染的可能性。

如下图更近一步的解释,我们假设有1% A2接头从A2孔中污染到了A1孔,常规的双端index组合标记的方法最终的文库分子,有1%的错误分配率;而如果采取双端index标记方法,数据分析时,会剔除双端index不匹配文库分子,将index错误分配率降低到0.01%。与之前对比,index misassignment非常可观的降低了两个数量级。

2.剔除ExAmp测序平台造成的index hopping

在illumina各种的测序平台 HiSeq 3000/4000,HiSeq X系列以及日前在行业内大火的Novaseq,均运用了ExAmp扩增方式和Patterned flow cell样品槽。新技术的应用使得信号点排布更加规则,扩增效率大大增加,通量更高。但是另一角度来讲,也扩大了游离接头的干扰。

如下图所示,与正确文库分子并不匹配的游离接头在Patterned flow cell中“阴差阳错”作为引物对文库分子进行扩增,使DNA片段标记了游离接头上带有的index,高效的ExAmp扩增方式则迅速的放大了这个错误。

在illumina优化ExAmp技术前,我们只能接受平台的不完美。而“3合1”新型接头巧妙的UDI接头设计,通过在数据分析时进行最终把关,剔除测序扩增过程中由于串扰造成的双端接头不匹配的文库分子,从而很大程度解决测序平台造成的index hopping,降低index错配情况的产生。

正如上述所说,“3合1”是从最终下机的数据进行质控,因此,不管index misassignment发生在哪一意想不到的环节,理论上该策略都可以提供当下最优的解决方案。

综上,如下图所示,“3合1”新型接头的UDI元件,从最终下机的数据进行质控,可以解决NGS整个流程中多个步骤产生的index hopping问题,大大控制了index 错误分配的现象。

“3合1”接头的应用概述

带有三个核心元素的新型“3合1接头”功能强大,突出表现在三种不同的读取方式实现三种不同的功能检测。

1.基因分型检验

只需要读取P7端 index,即把“3合1”接头当做普通的illumina Truseq TSLT单端接头来读取信息。这种应用方式适合对样品串扰不敏感的测序,比如遗传病等体细胞层面的突变。

2.灵敏度检验

利用“3合1接头”的P5和P7端两个元件,读取两端UDI,进行双侧检验,有效降低index错误分配,防止样品交叉污染。

3.低频突变检验

运用“3合1接头”全部元件,一方面,P7和P5端的UDI设计可以有效降低NGS各个阶段的index misassignment;另一方面利用紧随P7端 index的UMI,可以用于检测低频突变,例如液体活检用户。

UMI实际包含有9nt的随机序列,在片段打断后,连接接头的同时便引入了UMI标签来冻结扩增前的状态,后续利用UMI进行数据分析时,对样本原始状态进行追踪和提取分组。

综上, 新型的“3合1”接头无论在降低index misassignment 方面,还是助力低频检验方面,均具有巨大技术优势

(42)

本文由 SEQ.CN 作者:白云 发表,转载请注明来源!

热评文章