简介
1.PPI
PPI(Protein-protein interaction),蛋白质-蛋白质相互作用。网络图中的节点代表蛋白质,连线表示两个蛋白质之间存在关联。蛋白质是基因表达的产物,通过了解蛋白质分子之间的关联性从而间接了解基因之间的相关性,进而挖掘核心的调控基因。
2.STRING数据库
STRING数据库是蛋白质相互作用的数据库,覆盖物种多,蛋白数量多。数据库目前包含14'094个物种和67'592'464 个蛋白质。其中string数据库中的数据来自包含Biocarta, BioCyc, GO, KEGG, and Reactome在内的5个数据库。关系得分表示可信度,分越高越可信。
3.CytoscapeCytoscape是一个专注于开源网络可视化和分析的软件。其最强大的功能在于大规模蛋白质-蛋白质相互作用、蛋白质-DNA和遗传交互作用的分析。
数据准备
我们想要知道已知的多个蛋白之间的关联性,在这里我们选择案例#1作为示例。
- 打开STRING数据库——选择多个蛋白——输入蛋白——点击search——点击CONTINUE
- 这样我们就获取了输入蛋白之间的关联关系,我们将这张图以表格(string_interactions.tsv)的形式下载下来
- 具体的表格注释已写在表格中
使用cytoscape绘图
- 首先打开cytoscape软件,接下来我们将下载的表格(string_interactions.tsv)导入cytoscape当中
- 在导入的过程中,还有需要设置的部分
点击标题,确定每一列是节点属性还是线属性,也可设置这列的数据类型。如果这列是文字,选择ab,表示这一列是字符型;如果这列是数值,根据需要,选择整型或者浮点型;如果这列是布尔值,选择y/n。案例中我们使用默认选择。
- 表格导入之后就会自动生成网络图
这样的图还不是最终图,仍需要美化,这就体现了cytoscape的优势。
- 如何美化
节点的颜色、形状、字体修改。
如果提供的节点属性包含FC值和pvalue,我们可以根据FC设置节点的大小,FC值越大,节点越大;也或者根据pvalue值设置节点的由蓝到红的渐变等。
线的类型、颜色、粗细
总结
以上就是从STRING到PPI网络图的基本流程和简单操作。除了上述方法外,Cytoscape也可通过安装插件——stringApp的方法,来获取该数据库中的蛋白质之间的关联。不管哪种方法,最终目的都是获取PPI网络图。