组学数据分析实战指南 | （五）蛋白互作网络构建与可视化（STRING + Cytoscape）

最新推荐文章于 2026-06-15 13:57:31 发布

原创

最新推荐文章于 2026-06-15 13:57:31 发布 · 432 阅读

标签

#蛋白互作网络 #STRING #Cytoscape #组学数据分析

开发板推荐：天空星STM32F407VET6开发板

超高性价比 STM32主控 | 超高主频 | 一板兼容百芯 | 比赛神器 | 沉金彩色丝印

点击查看

1. 从蛋白列表到网络雏形：STRING数据库实战入门

大家好，我是你们的老朋友，一个在生物信息分析里摸爬滚打了十来年的“老码农”。今天咱们不聊那些虚头巴脑的理论，直接上手，把蛋白互作网络（PPI）从一堆枯燥的基因名，变成一张能发文章的漂亮网络图。这玩意儿听起来高大上，什么“系统生物学”、“网络药理学”都爱用它，但其实核心工具就俩：STRING数据库和Cytoscape软件。前者负责告诉你“谁和谁有关系”，后者负责把这种关系画得“又好看又有故事”。我敢说，只要你跟着我的步骤走，一个下午就能出图，绝对比你想象中简单。

我们先聊聊起点。你手头得有一份蛋白列表，这是分析的“种子”。这列表从哪来？太常见了：可能是你做完质谱（IP-MS）实验后鉴定到的那一长串互作蛋白，也可能是你做完转录组或蛋白组差异分析后，筛选出的那几百个显著性差异表达的基因。这里我有个经验之谈，列表的规模很重要。太少，比如就十几个蛋白，网络可能稀稀拉拉，看不出什么结构；太多，比如上千个，网络会复杂得像一团乱麻，后期可视化和你解读起来都头疼。根据我无数次实战的经验，50到300个蛋白是一个比较理想的“甜点区”，既能保证网络的丰富性，又不会让图形失控。

拿到列表后，我们的第一站就是STRING数据库。别被英文界面吓到，它的核心操作就是“粘贴-搜索”。打开STRING官网（记得用.org那个国际站，数据更全），找到“Multiple proteins”那个输入框。你可以直接把蛋白名称或ID（比如基因符号“TP53”、“AKT1”）一行一个地粘贴进去，或者更规范一点，上传一个纯文本文件。这里有个关键步骤：务必在“Organism”那里选对你的物种。如果你做的是人的样本，就选“Homo sapiens”；是小鼠，就选“Mus musculus”。这一步选错，后面所有的互作关系可能都是错的，因为蛋白互作有很强的物种特异性。点击“SEARCH”之后，稍微等一会儿，数据库就会开始它的魔法。

2. 深入STRING：不仅仅是搜一下那么简单

搜索完成后，你会先看到一个总结页面。这个页面千万别急着跳过，一定要仔细核对！ 它通常会显示“你输入了X个蛋白，成功匹配了Y个”。如果Y远小于X，那说明你列表里很多蛋白名在STRING里没找到，可能是别名、拼写错误，或者是数据库还没收录的新基因。这时候你需要回头检查你的列表，或者考虑使用更通用的标识符（比如UniProt ID）。确认无误后，点击“CONTINUE”，真正的网络图就展现在你面前了。

第一眼看到的网络可能有点杂乱，节点（蛋白）挤在一起，但这只是开始。STRING页面的下方有一排功能标签，这才是精华所在：