Inference and analysis of cell-cell communication using CellChat - PubMed (nih.gov)
目录
在线数据
摘要
基础介绍
分析结果
1,概述
2,识别预测通路
3,连续的信号转导
4,预测空间共定位细胞群之间的关键信号转导事件
5,联合学习时程 scRNA-seq 数据,揭示动态交流模式
6,不同scRNA-seq数据集之间
7,对疾病做出反应的主要信号变化
在线数据
CellChat
数据和代码获取:CellChatDB 包含在 CellChat 存储库 (GitHub - sqjin/CellChat: R toolkit for inference, visualization and analysis of cell-cell communication from single-cell data) 中。KEGG途径数据库可在 KEGG PATHWAY Database 获得。本研究中分析的数据集可从基因表达综合 (GEO) 存储库中获得,登录号如下:GSE113854、GSE122043(包括四个样本GSM3453535、GSM3453536、GSM3453537、GSM3453538;)和 GSE147424。
基于网络的CellChat Explorer,包括用于探索配体-受体相互作用数据库的Ligand-Receptor Interaction Explorer和用于探索组织中细胞间通讯的Cell-Cell Communication Atlas Explorer,可在 http://www.cellchat.org/ 上获得。
摘要
了解细胞之间的全局通信需要准确表示细胞间信号转导链路,并对这些链路进行有效的系统级分析。我们构建了一个配体、受体及其辅因子之间相互作用的数据库,这些辅因子准确地代表了已知的异聚分子复合物。然后,我们开发了CellChat,这是一种能够从单细胞RNA测序(scRNA-seq)数据中定量推断和分析细胞间通信网络的工具。CellChat使用网络分析和模式识别方法预测细胞的主要信号输入和输出,以及这些细胞和信号如何协调功能。通过多方面的学习和定量对比,CellChat对信号通路进行分类,并描绘了不同数据集中的保守和特定于上下文的通路。
基础介绍
通过可溶性和膜结合因子发出信号串扰对于为各种细胞决策提供信息至关重要,包括激活细胞周期或程序性细胞死亡、迁移或沿谱系分化的决策。
开发了 CellChat,这是一个开源 R 包 (https://github.com/sqjin/CellChat),用于从 scRNA-seq 数据推断、可视化和分析细胞间通讯。首先,我们手动策划了一个全面的信号分子相互作用数据库,该数据库考虑了配体-受体相互作用的已知结构组成,例如多聚体配体-受体复合物、可溶性激动剂和拮抗剂,以及刺激性和抑制性膜结合的共受体。接下来,CellChat使用质量作用模型推断给定scRNA-seq数据中的细胞状态特异性信号通信,以及细胞组的差异表达分析和统计测试,这些细胞组可以是离散状态,也可以是沿伪时间细胞轨迹的连续状态。CellChat 还提供多个可视化输出,以促进直观的用户引导式数据解释。
分析结果
1,概述
CellChat需要来自细胞的基因表达数据作为用户输入,并通过将基因表达与信号转导配体、受体及其辅因子之间相互作用的先验知识相结合,对细胞间通讯的概率进行建模。
两种模式:基于标签和无标签的模式
a 配体-受体相互作用数据库概述。CellChatDB考虑了配体-受体复合物的已知组成,包括具有多聚体配体和受体的复合物,以及几种辅因子类型:可溶性激动剂,拮抗剂,共刺激和共抑制膜结合受体。CellChatDB 包含 2021 个经过验证的交互,包括 60% 的分泌交互。此外,48%的相互作用涉及异聚分子复合物。b CellChat 要么要求用户分配单元格标签作为输入,要么根据作为输入提供的低维数据表示自动对单元格进行分组。c CellChat对通信概率进行建模,并识别重要的通信。d CellChat为不同的分析任务提供了多种可视化输出。层次图和圆图中的不同颜色表示不同的像元组。气泡图中的颜色与通信概率成正比,其中深色和黄色对应于最小和最大值。e CellChat通过图论、模式识别和流形学习等方法定量测量网络,以更好地促进细胞间通信网络的解释和设计原则的识别。除了分析单个数据集外,CellChat还描绘了不同背景下的信号变化,例如不同的发育阶段和生物条件。
2,识别预测通路
分层图显示了推断的 TGFβ 信号转导的细胞间通信网络。该图由两部分组成:左侧和右侧分别突出显示了对成纤维细胞状态和其他非成纤维细胞皮肤细胞状态的自分泌和旁分泌信号。实心圆圈和开放圆圈分别表示源和目标。圆圈大小与每个像元组中的像元数量成正比,边宽表示通信概率。边缘颜色与信令源一致。FIB-A – I:九个成纤维细胞群;MYL-A – E:五个髓系细胞群;ENDO-A – F:六个内皮细胞群;TC:T细胞;BC:B细胞;SCH:施万细胞;DC:树突状细胞,LYME:淋巴内皮细胞;(b) 热图显示基于计算的 TGFβ 信号转导网络的四个网络中心性度量,每个细胞组的相对重要性。c 各配体-受体对对TGFβ信号通路整体通讯网络的相对贡献,即各配体-受体对推断网络总通讯概率与TGFβ信号通路总通讯概率之比。d 推断的ncWNT信令网络。e 每个ncWNT配体-受体对的相对贡献。f ncWNT信令的计算网络中心性度量。g 推断的分泌细胞的传出通信模式,显示了推断的潜在模式与细胞群之间的对应关系,以及信号通路。流动的厚度表示细胞组或信号通路对每个潜在模式的贡献。h 推断出的靶细胞传入通信模式。i 根据信号通路的功能相似性将信号通路投射到二维流形上。每个点代表一个信号通路的通信网络。点大小与整体通信概率成正比。不同的颜色代表不同的信号通路组。j 使用两种不同的相似度量来量化推断网络之间的相似性。示例显示了与相似的主要源/目标的功能相似性,以及与相似网络拓扑的结构相似性。k 根据其结构相似性将信号通路投射到二维流形上。
(除了探索单个通路的详细通讯外,一个重要的问题是多个细胞组和信号通路如何协调发挥作用。为了解决这个问题,CellChat采用了一种基于非负矩阵分解的模式识别方法来识别全局通信模式,以及不同细胞组中的关键信号(参见“方法”部分)。该分析的输出是一组所谓的通信模式,这些模式在传出信号(即将细胞视为发送者)或传入信号转导(即将细胞视为接收者)的背景下将细胞群与信号通路连接起来。)
3,连续的信号转导
左图:将真皮皮肤细胞投射到低维空间的扩散图,并显示从成纤维细胞到 DC(真皮凝聚物)细胞的真皮分化。单元格根据它们在此空间中的位置进行分组。右图:密度图显示了每个细胞群/群体中所选标记基因的表达分布。b 显示所选标记基因的表皮轨迹和相关密度图的扩散图。c 通过规范的 WNT 信号转导显示真皮和表皮相互作用的分层图。左侧和右侧分别显示真皮轨迹和表皮轨迹的自分泌和旁分泌信号。圆圈大小与每个像元组中的像元数量成正比,边宽表示通信概率。d 小提琴图显示了推断的 WNT 信号转导网络中涉及的信号转导基因的表达分布。e 通过 ncWNT 信号传导的真皮和表皮相互作用。f 推断的ncWNT信号转导网络中涉及的信号转导基因的表达分布。g冲积图可视化分泌细胞的传出信号模式,显示了推断的潜在模式与细胞群之间的对应关系,以及信号通路。流动的厚度表示细胞组或信号通路对每个潜在模式的贡献。每种模式的高度与其相关细胞组或信号通路的数量成正比。传出模式揭示了发送细胞如何相互协调,以及它们如何与某些信号通路协调以驱动通信。h 靶细胞的传入信号传导模式。传入模式显示靶细胞如何相互协调,以及它们如何与某些信号通路协调以响应传入的信号传导。
4,预测空间共定位细胞群之间的关键信号转导事件
a E14.5 毛囊 (HF) 发育过程中的斑块、pre-DC、DC1 和 DC2 细胞的空间图。DC:真皮凝结物。b 两个细胞群中任何一对的重要配体-受体对的数量。边缘宽度与指示的配体-受体对数量成正比。c 推断的FGF和WNT信令网络。圆圈大小与每个像元组中的像元数量成正比,边宽表示通信概率。d 所有重要的配体-受体对,有助于将信号从斑块发送到三种 DC 状态。点的颜色和大小表示计算出的通信概率和 p 值。p 值由单侧置换检验计算得出。e 分泌细胞的传出通讯模式,显示推断的潜在模式与细胞群之间的对应关系,以及信号通路。f 目标细胞的传入通信模式。g 推断的 Pros1-Axl 信号转导网络,以及 Pros1 配体、Axl 受体和细胞迁移标志物 Thy1 的 scRNA-seq 表达分布。边宽表示通信概率。h RNAscope 数据(n = 4 个独立实验)显示 E14.5 胚胎小鼠皮肤早期发育毛囊中 Edn3(红色)、Axl(绿色)和 Thy1(白色)转录本的空间分布。上皮斑块和真皮凝结物 (DC) 用虚线注释和勾勒。右下角面板中的白色纯曲箭头标记了 CellChat 预测的皮肤空间内的 Pros1-Axl 信号转导。DAPI(蓝绿色)染色细胞核。比例尺:50μm。i 推断的 Edn3-Ednrb 信号转导网络,以及黑色素细胞标志物 Dct、Edn3 配体及其受体 Ednrb 的 scRNA-seq 表达分布。DC:真皮凝结物;MELA:黑色素细胞;(j) RNAscope 数据(n = 4 个独立实验)显示 E14.5 胚胎小鼠皮肤早期发育毛囊中 Dct(绿色)、Edn3(红色)和 Ednrb(白色)转录本的空间分布。箭头标记可能的黑色素细胞群。右上角面板中的纯白色弯曲箭头标记了皮肤空间内 CellChat 预测的 Edn3-Ednrb 信号转导。DAPI(蓝绿色)染色细胞核。比例尺:50μm。
5,联合学习时程 scRNA-seq 数据,揭示动态交流模式
E13.5 和 E14.5 处胚胎皮肤细胞组成的示意图。对不同的细胞群进行颜色编码,以匹配图 e 和 h 中的颜色。FIB-A:A型成纤维细胞;FIB-B:B型成纤维细胞;FIB-P:增殖成纤维细胞。MYL:髓系细胞;ENDO:内皮细胞;MELA:黑色素细胞;b 根据E13.5和E14.5的信号通路的功能相似性,将它们联合投影和聚类到共享的二维流形中。圆形和方形符号分别表示来自 E13.5 和 E14.5 的信令网络。每个点或方块代表一个信号通路的通信网络。点或正方形大小与总通信概率成正比。不同的颜色代表不同的信号通路组。c 每个通路组的放大视图。d E13.5和E14.5之间的重叠信号通路根据它们在共享二维流形中的成对欧几里得距离进行排序。e E13.5处推断的WNT信令网络。左侧和右侧分别显示真皮和表皮的自分泌和旁分泌信号。圆圈大小与每个像元组中的像元数量成正比,边宽表示通信概率。f 每个配体-受体对在 E13.5 处对整个 WNT 信号转导网络的相对贡献。g Wnt 信号转导基因在 E13.5 处的表达分布。h E14.5处推断的WNT信令网络。i 每个配体-受体对在 E14.5 处的相对贡献。j Wnt 信号转导基因在 E14.5 处的表达分布。k 所有重要的信号通路都根据它们在E13.5和E14.5之间推断网络内整体信息流的差异进行排名。红色的顶部信号通路在E13.5中更富集,中间黑色的信号通路在E13.5和E14.5中同样富集,底部绿色的信号通路在E14.5中更富集。l 点图显示了 E13.5 和 E14.5 之间分泌细胞的传出信号模式的比较。点大小与从模式识别分析中计算出的贡献分数成正比。贡献分数越高,意味着信号通路在相应的细胞群中更富集。
6,不同scRNA-seq数据集之间
E13.5 胚胎形态发生期间和第 12 天成人伤口诱导修复期间皮肤细胞组成的示意图。不同的细胞群分别进行颜色编码以匹配图 e 和 f 中的颜色。b 根据推断网络的结构相似性,将来自E13.5的信号通路联合投影和聚类到共享的二维流形上。圆形和方形符号分别代表来自 E13.5 和绕线的信令网络。每个圆圈或正方形代表一个信号通路的通信网络。圆形或正方形的大小与该信令网络的总通信概率成正比。不同的颜色代表不同的信号通路组。c 每个通路组的放大视图。d E13.5 和 wound 之间的重叠信号通路根据它们在共享二维流形中的成对欧几里得距离进行排序。距离越大,差异越大。E-F分层图分别显示了 E13.5 和 Wound 处 MK 信号通路推断的细胞间通讯网络。圆圈大小与每个像元组中的像元数量成正比,边宽表示通信概率。g 所有重要的信号通路都根据它们在推断网络内E13.5和伤口之间的整体信息流的差异进行排序。信令网络的整体信息流是通过汇总该网络中的所有通信概率来计算的。红色的顶部信号通路在E13.5中更富集,而绿色的底部信号通路在伤口中更富集。
7,对疾病做出反应的主要信号变化
CellChat R 软件包是一个多功能且易于使用的工具包,用于从任何给定的 scRNA-seq 数据推断、分析和可视化细胞间通讯。它提供了多个图形输出,以方便不同的分析后任务。特别值得注意的是,我们定制的分层图提供了一种直观的方式来可视化给定通路信号转导的复杂细节,包括:(i)源细胞群和靶细胞群的清晰视图,(ii)易于识别的信号转导方向性和概率,以及(iii)旁分泌与自分泌信号转导链接。我们通过将 CellChat 应用于寻找连续的细胞谱系相关信号转导事件、空间共定位细胞群之间的通信、时间过程 scRNA-seq 数据的时间变化以及来自不同生物学背景的数据集之间的保守和特定上下文通信,展示了 CellChat 的多样化功能。
参考文献:
Inference and analysis of cell-cell communication using CellChat