科研

首页 - 全部文章 - 科研 - 干货分享 | 普林斯顿教授详谈RNA与蛋白质互作高通量检测技术

干货分享 | 普林斯顿教授详谈RNA与蛋白质互作高通量检测技术

译者丨沈励泽

2020年2月,来自普林斯顿大学化学系的Kleiner博士在Elsevier出版社旗下的Current Opinion in Chemical Biology杂志发表综述,总结了目前RNA与蛋白互作的高通量测序的各种技术手段。Kleiner博士长期致力于m6A甲基化研究中各种与测序和质谱相关的方法学优化工作,力求为m6A甲基化研究竭尽全力。

摘 要

RNA-蛋白质相互作用在转录后基因调控中至关重要。随着RNA测序技术和高效液相质谱联用的蛋白质组学技术的快速发展,将这些创新的化学生物工具与生物学研究相结合,预示了在细胞水平研究分子的互作将成为可能。本文作者描述了蛋白质组学和转录组学方法在开发和应用细胞RNA-蛋白质互作方面的最新研究进展,重点聚焦基于测序技术和RNA结合蛋白的蛋白质组学分析技术,以及阐释RNA修饰在蛋白质-RNA结合事件中担任的重要角色。

01

前  言

转录后基因调控在生物过程中起着十分重要的作用。很大程度上,潜在的分子机制是由RNA转录本与大量RNA结合蛋白(RNA binding proteins, RBPs)在物理层面的互作介导的,这些蛋白调节RNA剪接(splicing)、稳定性(stability)、核转运(nuclear export)和翻译(translation)等特性。因此,阐释这些RBPs的RNA结合偏好并绘制RBPs蛋白质组图有助于揭示RNA-蛋白质结合互作的生物学功能。

另外,最新研究表明RNA修饰作为RNA-蛋白质复合物的调节元件,增加了互作的复杂性。尽管RNA-蛋白质相互作用的早期研究仅限于单个蛋白复合物的研究,但是RNA测序和蛋白质组学在技术层面的进步使得研究人员能够从转录组和蛋白质组两个维度进行分析。
值得注意的是,在完整的生物样品如细胞和动物组织中进行UV介导的蛋白质-RNA复合物光交联,在开发以高通量测序研究RBP-RNA互作的方法中发挥了重要作用。此外,化学生物学方法如用人工核苷酸进行代谢标记,生物正交化学(bio-orthogonal chemistry)和蛋白质工程学,也都应用到阐明蛋白质-RNA互作组学数据研究中。本文作者将重点介绍细胞中RNA-蛋白质互作的高通量组学技术最新进展,并展望该领域未来的研究发展方向。

02

研究RNA-蛋白结合位点印记的方法

Approaches to footprint RNA-protein binding sites

理解RBP生物学功能和分子机制的关键是鉴定所有RNA转录本的集合。此外,RBP的RNA结合位点或“足迹”(footprint)也可以帮助我们进一步了解其生物学活性。因此早期的研究主要依靠体外选择,利用RBP对固定序列结合的偏好性在随机RNA库中寻找特定规律。这种方法能够鉴定出某种或某类RBP对哪种规律序列有结合偏好性,这种高亲和力的结合序列也称为motif,此方法可以在转录组测序中挖掘出相关的RNA序列。体外选择方法操作简单易行,然而并不能鉴定到生理条件下真实RNA-蛋白互作事件,因此只能限定在对从活体样本中分离的RNA-蛋白复合物的鉴定应用上。

图1. 三类主流的RNA-蛋白结合位点高通量测序鉴定方法

Darnell等人在2008年发表了公认的第一篇RNA-蛋白互作高通量测序方法论文(Pubmed ID:18978773),这种方法被称为HITS-CLIP或CLIP-seq。HITS-CLIP结合了几种关键方法,通过高交联和免疫沉淀分离天然RNA-蛋白质复合物。该方法的核心是紫外线诱导的光交联,该交联可以在完整细胞上操作,并且交联的RNA-蛋白质互作效率比蛋白质-蛋白质的效率高很多。RNA-蛋白质发生交联后,就可以在严格的免疫沉淀条件下分离出低亲和度的蛋白质-RNA互作,并通过逆转录cDNA和测序来鉴定相关的RNA。

通常在免疫沉淀之前和之后对RNA进行部分酶消化,以更精确地定位RBP足迹。HITS-CLIP是许多基于UV-光交联的CLIP方法的先驱,这些方法的目的是为了绘制单个RBP在转录组范围内的RNA结合图谱。图1a还罗列了包括CRAC、PAR-CLIP、iCLIP和eCLIP以及对原有HITS-CLIP进行改进的方法。这些改进通常分为以下几类:

(1)利用4-硫尿苷(4-SU)或6-硫鸟嘌呤(6-SG)对细胞RNA进行代谢标记从而增强光交联作用;

(2)优化免疫沉淀和分离条件;

(3)改进cDNA文库建库方法和生物信息分析算法,旨在绘制具有单核苷酸分辨率的RBP结合位点信息(通常依赖于交联诱导突变的鉴定)。

当前,这些改进的CLIP方法代表了在整个转录组中绘制RBP足迹的最新技术,并已被广泛应用。尽管UV交联是可以应用于几乎所有RBP研究,但是RNAm5C甲基转移酶的独特催化机制使其能够通过化学手段与底物RNA交联。图1b报道了两种交联方法来绘制m5C甲基转移酶底物,即Aza-IP和miCLIP。在Aza-IP方法中,RNA-蛋白质交联是由5-氮杂胞苷(5-azacytidine)介导的,通过代谢标记在转录组范围内整合。而在miCLIP方法中,通过使用突变甲基转移酶与其底物胞苷残基结合交联后,运用类似UV交联的CLIP流程方法进行后续的免疫沉淀和RNA测序分析。

非交联策略也已应用于RBP结合RNA图谱相关研究中。图1c中的TRIBE原理是当腺苷脱氨酶(ADARs)接近RNA转录本时,能够催化腺苷对肌苷(A:I)编辑(例如通过与感兴趣的RBP融合)。此方法不需要纯化RNA-蛋白复合物,因为在逆转录过程中肌苷主要转化为C,并且通过测序和生物信息学分析可以直接确定它的存在。图1c中使用更活跃的ADAR突变体的方法叫HyperTRIBE,是TRIBE的增强版。Wickens等人开发了另一种非交联的方法,名为“RNA标签”(RNA tagging),主要依赖线虫的聚U聚合酶(PUP-2)与感兴趣的RBP融合,导致polyU尾巴沉积在RBP相关的RNA上,然后在cDNA文库生成过程中选择性富集PolyU标签。TRIBE和RNA tagging的主要优点是不需要纯化RNA-蛋白质复合物,但是它们都涉及将酶与目标RBP融合,这可能会影响RNA结合效率,且无法提供单碱基分辨率水平的结合数据。

03

RNA结合蛋白的蛋白质组分析方法

Approaches to profile the RNA-binding proteome

图2. RNA结合蛋白检测方法

CLIP的测序方法可以提供单个RBP结合到RNA的信息,但无法研究RNA结合蛋白对应的蛋白质组信息。若要发现新的RBP及其在蛋白质组范围内的特征,有必要将蛋白质组学应用于RBP分析。由于蛋白通量较低且无法扩增,使得蛋白质组学研究比RNA测序更具有挑战性,在最近十年,出现了多种用于细胞RBP互补蛋白质组学特征研究的方法,这些方法都是建立在最初CLIP实验开发的RNA-蛋白质交联方法的基础上。

Hentze和Landthaler实验室独立开发了第一种从细胞中分离RBP的技术,称为“交互作用捕获”(interactome capture)(图2a)。在其各自的方法中,首先将RBP通过UV交联到RNA上,然后通过与oligo-dT珠杂交从细胞中富集polyA RNA-蛋白复合物,在酶消化RNA后,运用质谱的蛋白质组学来鉴定分离的RBP。由于核酸杂交耐受高盐和离子去污剂,因此可以在严格的变性条件下进行oligo-dT富集,从而从细胞里游离蛋白中分离出RNA交联蛋白。互作捕获法已被广泛用于研究RBP与mRNA的互作,可用于254nm UV交联或更长波长的辐射结合4-SU标记的RNA。已知在HeLa和HEK293细胞中鉴定出约800个RBP,其中许多是首次发现的RBP。

非依赖ployA RNA的另一种方法是RICK/ CARIC法,可用于分析与RNA转录本相关的RBP,而不论其是否有polyA(图2b)。这种方法依靠RNA上的5-乙炔基尿苷(5-EU)标记和生物素标记来富集与新生转录本(nascent transcripts)交联的RBP,并为oligo-dT的富集提供结果。研究RBP要有所突破就必须考虑在开发方法上有更大的通用性,不能只局限于分析与polyA化RNA相关的RBP,需要开发能够更深入了解与RNA结合有关的蛋白质结构域和氨基酸残基的方法。

Bonasio等人开发了一种名为RBR-ID的方法(图2c),通过分析交联的胰蛋白酶肽来鉴定RBP结合区。RBR-ID并不是测量特定的交联肽-寡核苷酸种类,而是利用了亲本(非交联)胰蛋白酶肽的信号强度随之降低的优势。在胚胎干细胞的核蛋白质组上使用这种检测方法,可以在肽水平上鉴定出约800个RBP结合区,包括染色质调节剂中几个以前未知的RNA结合域。此外,RBR-ID法不需要对RNA进行富集,因此可以提供RNA结合蛋白质组的无差别快照信息(unbiased snapshot)。

以上提到的这些分析RBP的方法主要依赖核酸序列或亲和试剂的特异性识别来分离交联的RBP-RNA复合物,也可以直接利用共价蛋白-RNA结合物的理化特性从游离RNA中富集这些游离蛋白(图2d)。实际上用TriZol提取RNA时,RNA从DNA和蛋白质中的差异化分离是从细胞样品中分离RNA的常用技术。考虑到共价RNA-蛋白质复合物可能表现出不同于任一单独组分的杂化相分离特性的基本原理,研究者决定通过交联物种是否可以通过分离过程中通常被丢弃的相间层来富集。

2019年发表在Nature Communications、Cell、Nature Biotechnology杂志的三项研究中(Pubmed ID:30824702, 30528433, 30607034),相分离是分离RNA交联的RBP的有效方法。XRNAX和OOPS这两种方法(图2d)使用的是标准的Trizol制剂。此外XRNAX法还结合了在质谱分析之前二氧化硅的交联肽RNA片段的额外纯化方法。第三种方法PTex利用改性的苯酚-甲苯有机层,并在中性和酸性pH下连续萃取(图2d)。与Oligo-dT的互作捕获法相比,这三种方法在哺乳动物细胞中能发现更多的RBP,反映出这些方法更具有广泛的适用性。此外,由于细菌mRNA缺乏polyA,无法通过oligo-dT捕获获得细菌RBP,所以OOPS和PTex还能用于研究细菌RBP。另一种叫“硅珠纯化”(TRAPP)的方法,可从细胞中富集RNA-RBP复合物且不限于RNA是否携带polyA结构(图2e)。

04

RNA修饰相关蛋白研究方法进展

Approaches to study RNA modification–associated proteins

图3. 研究依赖RNA修饰的RBP的方法

由于RNA上的修饰水平较低,因此CLIP或RNA互作捕获等方法不太适用于研究与RNA修饰相关的RBP(或者叫阅读蛋白reader)。同时,作者也指出现在仍然缺乏在细胞修饰位点附近进行偏向光交联(bias photocrosslinking)的方法。因此鉴定这些RNA修饰阅读蛋白很大程度上依赖于合成一段带有m6A修饰motif序列的oligo寡核苷酸碱基序列,这段oligo上带有生物素等标记,方便进行pulldown。该方法已经成功鉴定了多种新型的m6A阅读蛋白,如陈建军课题组的黄慧琳博士(现任职于中山大学肿瘤防治中心)发表在2018年的Nature Cell Biology上的利用pulldown技术成功鉴定了IGF2BP家族新型的m6A阅读蛋白的研究。

由于RBP或阅读蛋白通常以低亲和力与带修饰的oligo结合,因此可能需要其他步骤才能有效捕获这些蛋白质。值得注意的是,Vermeulen课题组曾在2017年的Nature Structural & Molecular Biology(Pubmed ID:28869609)发表了,利用包含GG(m6A)CU共有motif的四个串联重复序列和基于SILAC的定量蛋白质组学的oligo对哺乳动物细胞中与m6A修饰互作的蛋白分析(图3a)的论文。
作者所在的普林斯顿大学化学系也于2017年在JACS(Pubmed ID: 29140688)发表了开发出一种基于光交联的化学蛋白质组学方法,该方法依赖于特定的修饰侧翼的含二嗪氨酸尿苷残基(diazirine-containing uridine residue)修饰的合成oligo(图3b)。为了发现新的阅读蛋白,该方法将光交联的优点(如低亲和力结合剂相应的稳定性、严格的纯化条件)与化学合成的多功能性相结合,使得能够“询问/检视(interrogation)”任何可合成的核苷酸。此方法和传统的affinity pulldown方法都依赖于修饰和未修饰的oligo对蛋白进行富集后的比较,揭示了带修饰核苷酸对RNA-蛋白质互作亲和力的正面和负面影响。
作为用于RNA修饰分析的补充方法,作者在2019年的Biochemistry(Pubmed ID: 31287290)发文称,已经开发出一种体外的选择平台,用于审视转录组层面阅读蛋白的序列结合偏好(图3c)。这种方法依靠人工化学合成特定碱基位点带有修饰的随机序列RNA library,继而进行亲和力选择并测序。作者用这种方法来分析某类m6A阅读蛋白如YTH域蛋白的结合偏好,揭示了m6A修饰的序列motif在生化上的独特偏好性。

05

结论与未来展望

Conclusions and perspectives

转录和转录后水平上的新基因调控机制的发现激发了人们对以RNA为中心的相关研究热情。人们对细胞生物学理解的进一步加深,与高通量测序技术以及基于质谱的蛋白质组学等革命性技术的发展息息相关。利用这些技术,研究人员开发出了可靠的实验方法来绘制细胞中RNA-蛋白质互作图谱,从而为全面了解蛋白质组和转录组之间的物理联系奠定了基础。

展望未来,以下几个领域为进一步的研究和开发新方法提供了方向:

  • 目前对RNA的运输和亚细胞定位的基本原理仍知之甚少,开发和应用工具来研究亚细胞分辨率下的动态过程有助于了解这些基本原理。为此,针对RNA邻近标记的实验方法开发将成为解决这个问题非常关键的步骤;
  • RNA转录后修饰对RNA-蛋白质互作和细胞进程的影响仍需继续探索,并且当前仍缺乏探测和研究活细胞中单个转录物修饰的通用方法;
  • 转录组学和蛋白质组学分析需要在单细胞层面来了解不同细胞之间的异质性;

综上所述,随着转录组学和蛋白质组学数据的激增,一个重要的目标是继续开发强大的实验工具,以选择功能上重要性的,并需要深入进行生物学验证的,高可信度的RNA-蛋白质互作。

译 者 简 介

沈励泽,联川生物高级产品经理,市场部负责人,在NGS领域有多年从事数据分析和产品开发经验。目前负责公司高通量测序产品开发与售前技术支持工作,主持开发m6A甲基化测序并撰写书籍《RNA甲基化修饰m6A研究一本通》。同时参与协助肿瘤外显子、单细胞测序等产品的相关开发工作。
(1)

本文由 SEQ.CN 作者:陈初夏 发表,转载请注明来源!

热评文章