单细胞转录因子分析好帮手——pySCENIC-环球风云-资讯-生物在线

单细胞转录因子分析好帮手——pySCENIC

作者:上海吉凯基因医学科技股份有限公司 2023-04-06T09:59 (访问量:11857)

转录因子(transcription factors, TFs)是指通过结合基因上游特异核苷酸序列,进而调控该基因转录的一类蛋白质。转录因子可以协调,驱动基因表达,构成了复杂的转录因子调控网络,从而调控免疫反应、发育模式等许多生命进程。因此分析转录因子表达及其调控活性对于解析复杂生命活动具有重要意义。


SCENIC(single-cell regulatory network inference and clustering)是一种基于共表达和motif分析的技术,旨在推断单细胞转录组数据中存在的转录因子及其靶基因并构建调控网络,以直观查看基因表达调控关系和鉴定细胞状态。以Python语言实现的SCENIC(pySCENIC)速度较快。在输入单细胞基因表达量矩阵后,pySCENIC的分析过程分为三步:1. 基于共表达模式 (coexpression pattern) 推断转录因子及其所有的候选靶基因 (target genes);2. cisTarget分析每个共表达模块中的基因,去除间接靶标基因,仅保留TF motif富集的模块和targets,被保留的TF-target genes 称为regulon;3. AUCelll为每个细胞的regulon活性打分,构建细胞-regulon 活性矩阵。
案例分析
研究概况
膀胱癌(BC)是世界上泌尿生殖系统恶性疾病之一。在过去的十年中,肿瘤微环境(TME)一直是癌症生物学的一个热门领域。但是关于BC微环境中不同细胞类型的异质性的研究还是很少。作者对52721个来自膀胱尿道上皮癌或粘膜旁样本的单细胞转录组进行了分析,并制作了膀胱癌组织内的整个TME图谱。作者强调了一个癌症相关成纤维细胞(CAF)亚群(被命名为炎症性癌症相关成纤维细胞(iCAFs))在BC中的作用,并发现了治疗膀胱癌的可能靶标。此外,通过将scRNA-seq数据与3500多个大体RNA测序或公共数据集中的微阵列图谱联系起来,作者还研究了TME与BC的分子亚型之间的关系。这些结果促进了对患者之间异质性的理解,并为膀胱癌的个体化治疗提供了依据。
样本信息
实验组:8个膀胱癌样本
对照组:3个癌旁粘膜样本
研究过程及结果
(着重解读pySCENIC分析)

作者进行单细胞测序后进行了分群,把52721个细胞分成了8个主群,分别是上皮细胞(EPCAM+);内皮细胞(CD31+);两种类型的成纤维细胞(COL1A1+)---炎症性癌症相关成纤维细胞iCAFs(PDGFRA+)和肌癌症相关成纤维细胞mCAFs(RGS5+);B细胞(CD79A+);骨髓细胞 (LYZ+);T细胞(CD3D+)和肥大细胞(TPSAB1+)(图1)。
图1.按细胞类型着色的tSNE图

被招募到肿瘤区域的单核细胞经历M2极化
髓系细胞进一步分为了7个亚群:肿瘤相关巨噬细胞TAMs(MRC1+C1high);CD1C+树突状细胞(CD1C+DCs,CD1C+CLEC10A+);单核细胞(S100A8+S100A9+);增殖的骨髓细胞 (TOP2A+); 交叉呈现的DCs (CLEC9A+); 滤泡B细胞 (CD79A+MS4A1+);和LAMP3+ DCs(LAMP3+CCR7+)(图2a)。并且用流式细胞仪证实了这些亚群。不同细胞类型之间的差异也可以通过TF motif的活性来确定 (图2b)。
图2
a. LYZ+细胞亚群的tSNE图
b. SCENIC分析得到的TF motif的活性也可以识别细胞亚群。以每一行的Z-score显示

值得注意的是,单核细胞主要来源于正常粘膜组织,而肿瘤相关巨噬细胞(TAMs)在膀胱癌组织中富集。此外,这两种细胞的转录组似乎呈现出持续的变化,表明招募到肿瘤区域的单核细胞被重编程为TAMs (图3a)。为了进一步研究这个持续的过程,作者对单核细胞和TAMs进行了拟时序分析和RNA速率分析,也观察到了类似的现象(图3b)。结合SCENIC分析识别到的关键motif,作者发现单核细胞被重编程为TAMs的过程中,三个motif (BACH1、MAFG和NFE2) 的活性下调,与此同时MAF、STAT1和STAT2的motif活性升高,这可能是导致M2极化的原因(图3c)。这些结果为抑制或者逆转免疫抑制微环境的形成提供了潜在靶点。
图3
a. 单核细胞与TAMs之间差异表达的基因,红色框显示两组细胞的共同特征。
b. Monocle2预测的从单核细胞到TAMs的分化轨迹
c. 在分化过程中被明显抑制或激活的TF motif,以细胞群着色

在膀胱癌中鉴定到两种不同的成纤维细胞亚型
成纤维细胞进一步被分为两种不同的类型(图4a):PDGFRA+成纤维细胞(iCAFs)表现出多种细胞因子和趋化因子的强烈表达,RGS5+成纤维细胞具有与肌癌相关成纤维细胞(mCAFs)相似的特征。通过GO富集分析,作者探究了这两种细胞类型的功能富集通路。接着SCENIC分析进一步研究了这两种成纤维细胞类型的功能。发现MEF2D和MEF2C是mCAF的特异性motif,这些motif在肌肉系的转录调控中具有深远的作用。Motif TCF21和TWIST2在iCAFs中被高度激活,TCF21与冠心病有关,能够增强平滑肌细胞的“纤维肌细胞”表型 (图4b, c)。
图4
a. 成纤维细胞的tSNE图,按集群(上方)和亚群标记(下方)着色
b. 由SCENIC估计的每个细胞的TF motif的曲线下面积(AUC)得分的热图。显示的分别是iCAFs和mCAFs中前五个激活的motif
c. tSNE图按转录因子表达水平(上方)和AUC分数着色(下方)着色

结 语

通过以上案例,我们可以发现pySCENIC分析可以帮助验证细胞类型鉴定的结果,也可以结合拟时序轨迹分析,RNA速率分析等展示分化过程中的motif活性变化,还可以进一步探究细胞功能。希望这次关于pySCENIC进行转录因子调控网络分析的分享可以为老师们提供一些启发。

【参考文献】
1.Van de Sande, B., Flerin, C., Davie, K., De Waegeneer, M., Hulselmans, G., Aibar, S., Seurinck, R., Saelens, W., Cannoodt, R., Rouchon, Q., Verbeiren, T., De Maeyer, D., Reumers, J., Saeys, Y., & Aerts, S. (2020). A scalable SCENIC workflow for single-cell gene regulatory network analysis. Nature protocols, 15(7), 2247–2276.
2.Chen, Z., Zhou, L., Liu, L., Hou, Y., Xiong, M., Yang, Y., Hu, J., & Chen, K. (2020). Single-cell RNA sequencing highlights the role of inflammatory cancer-associated fibroblasts in bladder urothelial carcinoma. Nature communications, 11(1), 5077.
上海吉凯基因医学科技股份有限公司 商家主页

地 址: 上海市浦东新区张江高科技园区爱迪生路332号

联系人:

电 话: 4006210302

传 真:

Email:service@genechem.com.cn

相关咨询
ADVERTISEMENT