科学家利用内源性标记构建出人类细胞蛋白分布图谱

2022-03-19 绿谷生物 Science
浏览

蛋白是基因表达的产物,是细胞的分子构件。这样的例子包括协调细胞化学的酶,塑造细胞结构的蛋白丝,或药物的作用靶标。基因组序列为我们提供了产生人体细胞的全套蛋白。然而,系统地描述蛋白如何在细胞内分布以维持其运作仍然是现代细胞生物学的一个重要目标。全面的人类蛋白质组分布图谱将为探索基因在健康和疾病中的功能提供参考。

亚细胞定位和物理相互作用是与任何特定蛋白的功能紧密相关的关键方面。蛋白定位于不同的亚细胞区室,这使得细胞功能在空间上得到了分离。蛋白之间也有物理上的相互作用,形成将参与相同过程的蛋白连接起来的分子网络。因此,绘制细胞的分子分布图谱需要全面描述不同蛋白的定位位置以及它们如何相互作用。在其他策略中,绘制细胞结构的一种强有力的方法是利用与荧光蛋白“标签”的融合来可视化单个蛋白。这些标签不仅使我们能够对活细胞中的蛋白定位进行成像,而且还能通过作为免疫纯化-质谱分析(immunopurification–mass spectrometry, IP-MS)的手柄来测量蛋白相互作用。基因组工程的最新进展促进了对人类内源性基因的标记,从而使相应的蛋白可以在其天然的细胞环境中得到表征。

在一项新的研究中,来自美国、德国和丹麦的研究人员利用高通量的CRISPR介导的基因组编辑,构建出一个由1310个荧光标记的细胞系组成的文库。通过使用这个文库进行配对的IP-MS和活细胞成像,他们产生了一种绘制出相应的1310个蛋白的细胞定位和物理相互作用的大型数据集。相关研究结果发表在2022年3月11日的Science期刊上,论文标题为“OpenCell: Endogenous tagging for the cartography of human cellular organization”。


OpenCell:结合内源性标记、活细胞成像和相互作用蛋白质组学来绘制人类蛋白质组的分布。图片来自Science, 2022, doi:10.1126/science.abi6983。

应用无监督聚类(unsupervised clustering)和机器学习相结合的方法进行图像分析,使得这些作者能够客观地识别具有共同空间或相互作用特征的蛋白。他们的数据提供了对单个蛋白功能的新见解,但也使他们能够推导出人类细胞结构的一些一般原则。特别是,他们发现,结合RNA的蛋白形成了一个独立的由特定的定位和相互作用特征定义的亚组。他们还发现,一种给定蛋白的精确空间分布与它的细胞功能密切相关,这样就可以从成像数据的分析中获得精细的分子见解。他们的开源数据集可以通过opencell.czbiohub.org的交互式网络界面进行探索。

综上所述,这些研究结果表明,内源性标记与相互作用组(interactome)和显微镜分析相结合,提供了关于人类蛋白质组分布的新的系统层面的见解。每个蛋白的亚细胞分布所包含的信息是高度特异的,可以与机器学习的进展相配合,单独使用显微镜来推断出细粒度的功能信息。这为未知蛋白的表征、高通量筛选以及分化和疾病期间复杂细胞状态的建模开辟了激动人心的途径。


Nathan H. Cho et al. OpenCell: Endogenous tagging for the cartography of human cellular organization. Science, 2022, doi:10.1126/science.abi6983.