《自然·方法》杂志多年来一直在关注和报道关于单细胞分析的方法,但是直至2018年4月HCA第一批研究数据集发表,人们才发现它推动了雄心勃勃的“人类细胞图谱计划(HCA)”的建立与不断发展。
人类细胞图谱计划意在对人体的细胞类型进行作图。这项计划目前在很大程度上得益于单细胞RNA测序方法的驱动,已经得到了不同类型的图谱。分子作图可以产生某种细胞类型的转录本、蛋白质或表观遗传学表达谱,功能和形态学作图将这些表达谱与细胞行为及外观链接了起来,而空间作图则将细胞定位于某个组织或器官之内。在这几个方面和层次上建立起来的人类细胞图谱计划可以与伟大的人类基因组计划相媲美,不同的是,人类基因组计划研究的是基因,而人类细胞图谱则是汇编一套人类细胞的参考数据集。
此外,还有一些相关科学计划也值得关注。艾伦大脑图谱计划多年来已经推动了对大脑的作图计划,其中一些是在单细胞水平上的。美国国立卫生研究院的人类生物分子图谱计划(HuBMAP)资助了对单细胞技术的研发并将它们应用于组织作图。人类蛋白质图谱计划运用免疫组织化学技术对1万多种基因产物进行染色分析并形成染色模式数据库,近期已经发展到对细胞株内蛋白质进行定位。最后,几项研究对模式生物体进行单细胞表达谱分析,是对人类细胞图谱的有力补充。各种正式和非正式的方法正在将人类细胞图谱计划与其他科学项目对接起来。尽管在这些科学计划中重复劳动不可避免,但继续积极地寻求这些对接很重要。
作为一项由科学家推动开展的科学计划,人类细胞图谱计划是一项充满开放合作精神的科学计划,科学家只要接受它的价值观就可以参与,其中包括数据与方法的早期共享。人类细胞图谱计划具有相对宽松的草根结构,毫无疑问使之机遇与挑战并存。这样一种战略分布式的工作方法使得科学投入最大化,最有可能改善达到科学目标的机会。管理这样一个庞大的全球科学家大协作充满了挑战,在达成对组织问题和科学问题的一致上变得更为困难。
这样的问题随处可见,在这样规模的大科学计划中是必须得到解决的。例如,如何在单细胞分子表达谱基础上对某个细胞类型进行最好的定义,并且不同于传统方法,也就是运用一些稳定的标记物或独特的形态学或定位?单个细胞组不仅随细胞类型,还随细胞状态而变化,是细胞巨量相互影响的结果。事实上,人类细胞图谱计划很可能改变我们对这些知识内容的进一步认识。
但是随着数据的产生,必须做出以下决策:细胞类型在图谱中如何进行注释,将需要建立一致性参考标准。观念上讲,应该使数据处理和注释的步骤对使用者透明,并综合地提供相关的、先验的知识。非常有意义的是,还必须建立显示这样的高维数据的新方法。在建立了这些步骤后,更具有挑战性的是潜在的图谱使用者范围的改变,从单细胞研究专家到毫无单细胞学知识的生物学家和生物信息学家,甚至是临床医生。
更为复杂的重要事情是,单细胞分子研究方法仍然在积极发展之中。图谱将随着方法的改善而精细化,而且早期的数据集是方法研究本身的急需资源。人类细胞图谱计划的参与者还会定期地组织进行系统性方法的比较,建立未来方法借以比较的平台。
一种方法要满足所有的需要是不太可能的。例如,单细胞核测序正在被证明对于那些难以分离的组织如大脑是有用的。基于微滴的测序方法是高通量的,可以对许多细胞进行表达谱分析,但是测序的深度很低。与之相反,基于微孔的测序方法通常有较高的转录本捕捉率、对获得某些细胞群体的较深度表达谱是有用的。研发一些补充方法来解决相关问题很重要。
从计算生物学角度考虑,使产生自不同方法的数据得到比较是关键的。有两种方法在《自然·方法》得到讨论:一种是将来自单细胞实验的细胞项目建立为次生的参考数据集,另一种则按时间顺序将单个细胞与它们在实验中的基因表达模式进行匹配。
多年来,人类细胞图谱计划的最后公众形象可能还不太彰显,但是,无疑,它将记载下生物学和科学方法论探索者的前进之路。
资料来源 Nature Methods
责任编辑 彦隐