1. 从蛋白列表到网络雏形:STRING数据库实战入门
大家好,我是你们的老朋友,一个在生物信息分析里摸爬滚打了十来年的“老码农”。今天咱们不聊那些虚头巴脑的理论,直接上手,把蛋白互作网络(PPI)从一堆枯燥的基因名,变成一张能发文章的漂亮网络图。这玩意儿听起来高大上,什么“系统生物学”、“网络药理学”都爱用它,但其实核心工具就俩:STRING数据库和Cytoscape软件。前者负责告诉你“谁和谁有关系”,后者负责把这种关系画得“又好看又有故事”。我敢说,只要你跟着我的步骤走,一个下午就能出图,绝对比你想象中简单。
我们先聊聊起点。你手头得有一份蛋白列表,这是分析的“种子”。这列表从哪来?太常见了:可能是你做完质谱(IP-MS)实验后鉴定到的那一长串互作蛋白,也可能是你做完转录组或蛋白组差异分析后,筛选出的那几百个显著性差异表达的基因。这里我有个经验之谈,列表的规模很重要。太少,比如就十几个蛋白,网络可能稀稀拉拉,看不出什么结构;太多,比如上千个,网络会复杂得像一团乱麻,后期可视化和你解读起来都头疼。根据我无数次实战的经验,50到300个蛋白是一个比较理想的“甜点区”,既能保证网络的丰富性,又不会让图形失控。
拿到列表后,我们的第一站就是STRING数据库。别被英文界面吓到,它的核心操作就是“粘贴-搜索”。打开STRING官网(记得用.org那个国际站,数据更全),找到“Multiple proteins”那个输入框。你可以直接把蛋白名称或ID(比如基因符号“TP53”、“AKT1”)一行一个地粘贴进去,或者更规范一点,上传一个纯文本文件。这里有个关键步骤:务必在“Organism”那里选对你的物种。如果你做的是人的样本,就选“Homo sapiens”;是小鼠,就选“Mus musculus”。这一步选错,后面所有的互作关系可能都是错的,因为蛋白互作有很强的物种特异性。点击“SEARCH”之后,稍微等一会儿,数据库就会开始它的魔法。
2. 深入STRING:不仅仅是搜一下那么简单
搜索完成后,你会先看到一个总结页面。这个页面千万别急着跳过,一定要仔细核对! 它通常会显示“你输入了X个蛋白,成功匹配了Y个”。如果Y远小于X,那说明你列表里很多蛋白名在STRING里没找到,可能是别名、拼写错误,或者是数据库还没收录的新基因。这时候你需要回头检查你的列表,或者考虑使用更通用的标识符(比如UniProt ID)。确认无误后,点击“CONTINUE”,真正的网络图就展现在你面前了。
第一眼看到的网络可能有点杂乱,节点(蛋白)挤在一起,但这只是开始。STRING页面的下方有一排功能标签,这才是精华所在:
- Settings(设置):这是调整网络“松紧度”的核心。最重要的滑块是“Minimum required interaction score”,它代表互作关系的最低可信度阈值。分数范围从0到1,分数越高,要求证据越强。我一般会先从

3546

被折叠的 条评论
为什么被折叠?



