“人类细胞图谱计划”(Human Cell Atlas Project)是一项大型国际合作项目:根据独特的分子信息(如基因表达)对所有人类细胞种类进行定义,并将这些信息与传统的细胞学表述(如位置和形态)相关联。
去年十月,由麻省理工学院-哈佛大学布罗德研究所( the Broad Institute of MIT and Harvard)、维尔康姆基金会桑格研究所(Wellcome Trust Sanger Institute)和维尔康姆基金会牵头的细胞图谱计划启动会议(Human Cell Atlas Launch Meeting)引起了科学界和全社会的广泛关注。近日,项目主要参与者Aviv Regev, Sarah A. Teichmann, Eric S. Lander等在生物预印网站bioRxiv上发表了对这次会议的总结报告。
报告全文编译如下:
The Human Cell Atlas
Introduction
自1665年Hooke发现细胞以来,人类对细胞的研究具有悠久的历史,对细胞分类的尝试亦持续了150多年。欲要研究人体生理,必先了解人类细胞。从古至今,技术的进步一直主导着细胞分类的进程。从光学显微镜到电子显微镜再到荧光原位杂交技术,这些非凡努力使生物学家们获得了骄人成果,如:对造血和免疫系统以及视网膜神经元的了解。
然而,我们对细胞类型的知识了解仍然不够完善。现有的分类乃是基于不同的标准,如形态、分子和功能,这使得它们往往无法互相关联。对细胞的分子分类多数是为了特定的目的而设,基于偶然发现的标志物或选择之便,而非系统性及综合性的。迄今为止,唯一一个已知的、从单个受精卵到成年体的完整系谱细胞树属于线虫(nematode C. elegans),而它是透明的,且只包含了1000个左右的细胞。
从概念上来说,我们面临的一个挑战是缺乏对细胞类型(cell type)和细胞状态(cell state)的严格定义。这两个概念间的分界模糊不清,因为细胞时时处于动态变化之中,并可能与我们所知的定义相差甚远。最终,由数据驱动的理论将很大可能重定义我们的观念。
对更深入细胞知识的渴求伴随了我们多年,而在近年来,创建一个系统性的、能够对人类细胞进行高度分类的细胞图谱的需求,才逐渐有了可实现性。这一可行性,是单细胞基因谱获得技术的发展所给予的。
第一个能够被大规模应用的单细胞基因组表征方法是单细胞RNA-seq主导的转录组分析。如今,大规模平行测序技术能够同时对成千上万个单细胞的转录本进行检测,它具有不断提高的准确性和敏感性,成本却在不断降低。
随之而来的是许多在不同发展阶段和高通量实现过程中起作用的附加技术的发展,用于检测:组织单细胞(甚或亚细胞层级)的在体基因表达;细胞或亚细胞分辨率下大量蛋白的分布;染色质状态的多种方面;使细胞系得以精确重建的DNA突变。单细胞多组学方法也正在发展,用于在一个细胞中同时检测多种类型的分子信息。
因此,科学界正逐渐达成共识:是时候创建一个项目,来达成150多年来我们完善人类细胞图谱(Human Cell Atlas)的夙愿了。这促成了2016年10月在伦敦开展的国际会议。而这篇文章旨在吸引更多的科学界同道参与到这项课题中来。
以下,我们将阐明细胞图谱(cell atlas)的概念,并拓展它在生物和医学领域的潜在效用;讨论一份细胞图谱将如何带来在组织学、细胞发展、生理学、病理学,和胞内外调控等方面的新认知,并提高我们预测细胞变化及其影响的能力。它亦能带来可应用于研究和临床的分子工具的产生。人类细胞图谱计划将是国际上多个科学界的共同成就。
什么是人类细胞图谱?
基本来说,人类细胞图谱必须包含一个综合性参考目录,基于所有人类细胞的稳定属性和瞬态特征,以及它们的位置和丰度。而一个图谱亦不仅仅只是一份目录:它能够显示这些要素之间的关系,并有时能够据此揭示功能性进程。
要想做到有用,一份图谱必须是抽象化的:综合性地体现出某些特性,而忽略其他。此外,一份图谱还必须提供一个坐标系统,这个系统中的概念可以在不同水平上都通用。在任何分辨率下都可以了解概念特征,高维信息则能够被化繁为简。
因此,一个关键性问题是人类细胞图谱如何做到提炼主要特征,提供坐标并展现它们之间的关联。一个自然的解决方案是:通过定义一系列分子标志物来描述每个人类细胞。除了描述编码人类蛋白的基因的表达状况外,分子标志物的集合还将包括非编码基因的表达水平、转录本可变剪接的水平,每个启动子和增强子的染色质状态,以及每个蛋白和它们的的翻译后修饰状态的水平等。所需收集信息的最佳量级和种类是由技术可行性和每个层次的生物学视点所决定的。如今,获取具体到每个细胞每个基因表达水平的信息已经可以通过高通量来实现。
这份图谱还必须具有代表组织学和解剖学信息、时间信息和疾病状态的辅助坐标或注释。这些信息对于协调包括细胞生理学、组织学和功能信息的分子表达谱非常必要。如何最优化地获得并描述这些信息需要引起重视。
从某些方面来说,人类细胞图谱计划(基本单位是单个细胞)和人类基因组计划(基本单位是单个基因)非常相似。二者均致力于创建生物学的“元素周期表”,综合性地罗列两个人类生命中关键性的“原子”单位(细胞和基因),并由此为生物学研究和医学应用打造重要基础。而二者不同之处在于,由于人类细胞图谱计划独特的细胞生物学方向,它需要特殊的实验工具、分子和细胞学描述符的选择,以及通向终点途中的大量挑战。
我们理想的人类细胞图谱计划应当囊括不同领域中所有可能的标志物:1)一个人体中的所有细胞;2)每个细胞的空间位置;3)一个人类生命中每一刻的每个细胞;4)每个人类的细胞图谱的叠加,根据不同健康状态、基因型、生活方式和外界环境加以注释。
当然,这是不可能实现的。但是通过大量样本来理解所有人类细胞的关键特征和它们之间的关系的可行性正在增加。接下来,让我们回到科学界对创建人类细胞图谱可能持有的疑问。首先,我们能够从人类细胞图谱中寻求什么?
人类细胞图谱与生物学
人类细胞图谱将为生物学和医学带来深远的影响,通过将我们对解剖学、细胞发展、生理学、病理学、细胞内调节、细胞间通信的理解提高到一个新的分辨率水平。它还将为基础研究(检测、纯化和基因操作)和临床应用(诊断、预后和治疗反应监控)提供宝贵的标志、特征和工具。
人类细胞图谱与细胞分类
分析的最基础层次是细胞类型的鉴别。在细胞图谱中,细胞被描述为高维空间中的点。相似的细胞在一些功能上也相近,即使由于生理状态差异、分子系统固有噪音、测量误差等原因,它们并不完全相同。因此”细胞类型“可被定义为一种区域或概率分布,不论是在完整高维空间(full-dimensional space)还是在一个反映显著特征的低维空间投影中。
细胞分类学通常被描述为基于形态学、生理学和分子差异的层级制度,然而基于这三者各自的分类方式却难说是否相互兼容。新的计算方法对于发现细胞类型和更好地分类,以及最终重新定义概念本身来说都非常需要。一旦从特殊空间区域中定义出细胞类型后,重要的下一步是根据更简单的分子标志来对它们进行细分,从而能够将它们罗列到图谱中,综合并比较从不同独立实验室和独立个体中获得的结果,并创造用于验证和后续研究的工具和试剂。
近年来科学界在这一方向的不同领域取得了许多骄人成果。如在16年的一项研究中,用单细胞RNA测序结合膜片钳技术,对一种特殊的抑制皮质细胞类型进行进行电生理学测量,结果显示转录组与细胞生理学状态高度相关,进而说明了转录组可作为对其他神经元属性研究的一种指针。
人类细胞图谱与组织学
组织学考察细胞和组织中分子的空间位置,过去我们同样也已经获取了关于细胞类型、标志、组织结构的大量知识,将会在人类细胞图谱中被进一步精炼及无缝衔接。已有的方法包括原位杂交法、蛋白染色、可基于细胞分子表达谱和周边信息对细胞特征进行迭代优化的算法、网络分析方法,以及近期出现的、可集成单细胞基因组数据到同一空间背景中的新方法等,均取得了不俗成果。
人类细胞图谱与细胞发展分化
细胞通过部分不同步的发展通路分支,最终分化为不同的细胞类型,这一过程是由分子变化主导的,并同样反映到分子变化中,尤其是基因表达模式。因此将这种发展方式重建为高纬度空间中的轨迹是具可能性的。假如有足够的细胞可供观察,我们甚至可以推断在这种发展中的尖锐转变。细胞在发展通路中的不同点上表现出的相对比例有助于传达临床信息,包括每个阶段的持续时间,以及祖细胞和开始分化细胞的平衡。从表达谱中可以推断出细胞增殖率和死亡率的相关信息。
在动物模型中可以通过标记常见祖细胞类型来创建系谱树。在人类细胞中,通过利用每次细胞分裂时DNA变化的稳定积累来完成系谱追踪或者作为分子钟则更加可行。
一些早期算法已被用于从大量单细胞信息中推断动态轨迹。近期研究则为如何从单细胞RNA-seq数据中推断同步和正交的生物学进程提供了原理验证。线性发展轨迹也已被重建。
人类细胞图谱与细胞生理和内稳态
除了发展和分化之外,细胞还时常进入不同的生理学变化和稳态调控动态过程,包括循环过程(如细胞周期)、瞬态反应(如对药物和组织损伤的反应)和塑性阶段(长期恒定,但可受环境影响改变)。细胞的分子表型反映了这些不同过程和它们相互作用的叠加。
整体(bulk)组织的生理学过程研究受到细胞间非同步性和异质性的制约。相对地,单细胞水平的分析则利用了细胞间非同步性和异质性,通过研究细胞群体中的多样性来揭示潜在结构。
在循环和瞬态过程的异步观测中,细胞进入各项进程和进程的持续时间或许可以受到调控。一旦细胞受到控制,人们就可以获得反映各个阶段的基因标志,并将它们用于进一步打磨和精炼模型。假如获得了足够数据,我们或许能够梳理平行发生的进程(如细胞周期和分化)。还可能捕捉塑性阶段之间的瞬态过渡,尤其当它们受到合适生理信号强化时。最终,我们将很有可能获悉稳态的本质。两个连续稳态之间的过渡阶段在细胞间各不相同,但在每个细胞中是稳定的。
近期的研究已能够在免疫细胞对病原体的反应过程中,通过单细胞表达谱追踪细胞周期中的循环进程和瞬态反应。短暂控制细胞,在高分辨率下综合定义已表达基因、分辨不同阶段之间的时间比、并将这些发现关联到正交测量中是可行的。
人类细胞图谱与疾病
人类细胞图谱将成为疾病研究的重要参考。对疾病的单细胞分析已被证明是种强有效的工具。由于具有展现细胞和组织具有的大量分子标志的常规能力,而非只专注于有限数量的已知标志或细胞群体,单细胞分析将获得大规模的推广应用。它对于研究同一组织生态体系中,异常细胞和其他细胞之间或促进或抑制疾病进程的相互作用非常有帮助,这类研究正在越来越受到关注。对疾病样品的单细胞分析也很可能成为研究整个正常细胞生理学的关键,因为疾病同时也扰乱了关键细胞进程,而这一过程蕴含大量信息。
不同患者的单细胞信息也有利于我们研究细胞比例和状态的多样性,以及这种多样性与基因多样性、病因和治疗反应的关联。进一步的研究将把单细胞分析扩大到成千上万的患者中,以此来直接研究基因多样性是如何影响基因转录和调控的。在造血系统和癌症领域的研究将可能在短期获得大量成果。
人类细胞图谱与胞内外分子机制
人类细胞图谱也可以阐明胞内、胞间和组织基质间的调控细胞类型、分化、反应和状态的分子机制。通过单细胞RNA-seq分析可以发现细胞内调节细胞分化和对刺激反应的调控者。除了转录组分析以外,单细胞多组学分析能通过关联调控者与靶标来促进对细胞进程的推断。在将来,通过使用合并CRISPER文库来操作基因,并读取出单个细胞中的基因扰乱及其对表型的影响(如单细胞RNA-seq),能够将研究对象从自然产生的变化拓展到工程性控制的扰乱。
细胞图谱也能根据细胞类型和患者的相关信息进一步揭示细胞内的交流。基于细胞所表达的分泌物和细胞表面分子,从纯化细胞群体表达谱中也可推断细胞之间的相互作用。
人类细胞图谱在研究与医学中的应用
人类基因组计划对生物医学的主要影响是提供了综合性的参考——一条可以直接从中获得答案并推断独特标志的DNA链。同理,人类细胞图谱也能为基础研究和临床相关应用提供类似的好处。研究者们将能够从中精确获知在某种细胞中目标基因将表达到什么水平。他们还将能够从中推断出特异性鉴别某种细胞类型的表达标志。这种标志能为大量实验提供起点,不论是作为分离、标记、追踪、操作动物模型或人类样本中细胞的分子标志物,还是用于描述药物对组织生理状态的作用,这样的细胞鉴定标志物将在临床检验中被广泛使用。
如何创建人类细胞图谱
创建人类细胞图谱需要生物学家、技术专家、病理学家、内科医生、外科医生、计算机科学家、统计学家等来共同进行广泛的科学讨论并提出一个强有力的计划。相关讨论已经进行了两年多,如今是时候为这项国际合作课题制定一个计划了。
为抛砖引玉,我们提出以下几点作为参考。
1)阶段性的目标
虽然总目标是创建一个囊括不同细胞类型的分子测量、空间结构和解释,以及组织学,细胞发展,生理学和分子机制的综合性图谱,但将这一目标分解为多个中间目标更能提高其分辨率、全面性和深度。
2)采样方法
对一个人体中的所有细胞进行采样是不可能也不必要的。采样的关键在于结合可靠的统计抽样、生物富集与纯化、在生物模型中研究。使用一种能够兼顾细胞量和检测深度、的自适应迭代方法将对研究非常有益,通过最初的少量采样来决定如何进一步采样。
3)分析广度
虽然单细胞或核转录组分析将在刚开始的几年中作为主力,但发展大量多样的强有力的高通量分析方法非常重要,包括原位RNA和蛋白质空间模式分析、染色质和基因折叠分析、以及体细胞突变分析。虽然这些方法中的部分已经成熟,但其他仍将受益于集中发展,以及不同技术间的对比。
4)生物范围
考虑组织样品来源的平衡非常重要:健康个体不同阶段下的组织;带有疾病的个体组织;生物模型样品。其中生物模型在关键发展期的样品更易获得,操作也更可行。课题将围绕不同器官、系统和疾病来策划。
5)质量把控
结果的高质量和技术可重复性对一个可被广泛参考的图谱的创建至关紧要。尤其是对固有的生物变异和预计系统测量噪声应当加以重视。严格的实验方法、标准和基准的发展、比较和推广需要大量投资。参与到课题中的所有独立团体和大型机构在界定并保证高质量方面均非常重要。采集的样品也同样需要卓越的临床注释和meta数据的一致性来保驾护航。
6)全球公平
人类细胞图谱应当能够服务于世界上的所有人,因此必须跨越性别、种族、环境,以及全球疾病负担等所有可能影响细胞的分子表达谱的因素,并必须在最大化图谱的益处。计划本身应当鼓励并支持全球所有参与其中的科学界、研究中心和国家,认识到尊重并学习不同人群、文化、风俗、信仰和传统的价值。
7)公开数据
在全部参与者的允许和法律的支持下,人类细胞图谱将是一项公开的成果。为使多态性的数据便于解读,数据将被对应到每个基因的”标准模型“上。建立一个能够提供足够聚合与保存、质量控制、分析软件、与用户友好界面的数据平台,是使图谱能够发挥作用的关键。
8)灵活性
人类细胞图谱应当在知识和技术层面上都非常灵活。应当认识到不论是计划的生物学目标还是实验方法、计算方式、总体规模还是完成标准都在随着见解和工具的发展而飞速变化。
9)前瞻性
任何今天获取的数据都比以前更快更精确更低廉,任何计划中所获得的里程碑式成果都将被更深入、广泛、精确、综合的后来者所替代。虽然我们为人类细胞图谱计划确立了一个目标,我们应当看到这并不是终结,而应将视其为通向未来的一个关键踏脚石。
结论
过去的岁月多次证明了全球科学界共同努力的价值和成果,能够使世界上千千万万的研究室受益。我们将这项富有历史的传统扩展到了生物体的基本单位——细胞。
即使任重而道远,我们仍然充满自信,科学的创造力和协作能够使我们到达彼端。如今正是开始的时刻。
附:
单细胞基因组学的关键技术 |
单细胞RNA测序(scRNA-seq) |
质谱流式细胞技术(mass cytometry) |
单细胞基因组和表观基因组测序(Single-cell genome and epigenome sequencing) |
单细胞多组学(transcriptomic,genomic,epigenomic,proteomic) |
多重原位分析(Multiplex in situ analysis)及其他空间技术 |
细胞系谱测定(Cell lineage determination) |
Figure 1.人体解剖学的层次结构视图
Figure 2. 解剖学:细胞和组织结构
Figure 3. 发展轨迹
Figure 4. 生理学
参考文献:
REGEV, A., TEICHMANN, S., LANDER, E. S., AMIT, I., BENOIST, C., BIRNEY, E., BODENMILLER, B., CAMPBELL, P., CARNINCI, P., CLATWORTHY, M., CLEVERS, H., DEPLANCKE, B., DUNHAM, I., EBERWINE, J., EILS, R., ENARD, W., FARMER, A., FUGGER, L., GOTTGENS, B., HACOHEN, N., HANIFFA, M., HEMBERG, M., KIM, S. K., KLENERMAN, P., KRIEGSTEIN, A., LEIN, E., LINNARSSON, S., LUNDEBERG, J., MAJUMDER, P., MARIONI, J., MERAD, M., MHLANGA, M., NAWIJN, M., NETEA, M., NOLAN, G., PE'ER, D., PHILIPAKIS, A., PONTING, C. P., QUAKE, S. R., REIK, W., ROZENBLATT-ROSEN, O., SANES, J. R., SATIJA, R., SHUMACHER, T., SHALEK, A. K., SHAPIRO, E., SHARMA, P., SHIN, J., STEGLE, O., STRATTON, M., STUBBINGTON, M. J. T., VAN OUDENAARDEN, A., WAGNER, A., WATT, F. M., WEISSMAN, J. S., WOLD, B., XAVIER, R. J. & YOSEF, N. 2017. The Human Cell Atlas. bioRxiv.
来源:转录时空
本文由来源 转录时空,由 陈初夏 整理编辑!