引言
拿到一个中药复方或一味单药,如何从几十上百个化学成分,一步步聚焦,找到它真正作用的蛋白靶点和信号通路?经过一段时间的文献阅读与实践摸索,我逐渐意识到,现代中药靶点筛选早已不是单打独斗,而是一套融合了计算预测、结构模拟、组学验证与AI建模的“组合拳”。
今天这篇文章是我对自己学习过程的一次系统整理,重点梳理当前主流的中药靶点筛选研究逻辑、核心技术方法,以及它们各自的适用边界与实操注意点,希望能给做中药研究的大家一些参考。
一、确立一条贯穿全程的研究主线
在进入具体方法之前,我观察到一个规律:目前高水平的机制研究,不论研究对象是复方还是单药,普遍遵循一条逻辑严密的流程主线。
我将它作为课题设计的“骨架”:
第一步:化学成分获取与鉴定
▶ 任务:明确复方/单药所含的全部化学物质。
▶ 途径:
① 高分辨液质联用(LC-MS)实验实测;
② 从TCMSP、BATMAN-TCM、HERB等中药数据库获取已知成分。
第二步:ADME活性成分筛选(剔除无效单体)
▶ 目的:评估成分在体内的吸收、分布、代谢、排泄特性,保留具备成药性的候选。
▶ 关键指标与阈值:
① 口服生物利用度(OB):TCMSP采用OBioavail 1.1模型(SVM+MLR+PLS),常用阈值 OB ≥ 30%。
② 类药性(DL):基于Tanimoto相似系数计算,常用阈值 DL ≥ 0.18。
▶ 特殊情形:研究中枢神经系统疾病时,额外加入血脑屏障(BBB)通透性过滤,阈值BBB≥-0.3。
第三步:靶点预测与疾病靶点交集
▶ 操作:将活性成分输入预测工具,得到“潜在作用靶点”;同时从GeneCards、OMIM等数据库收集疾病相关靶点。
▶ 产出:两者取交集,即“成分-靶点-疾病”互作网络的核心节点。
第四步:PPI网络构建与拓扑分析
▶ 工具:STRING数据库构建蛋白质-蛋白质相互作用网络;Cytoscape(Network Analyzer插件)进行拓扑分析。
▶ 关键指标:度值(Degree)—— 衡量节点连接数的核心参数,用于鉴定网络中的关键靶点。
第五步:通路富集分析与实验验证(闭环要求)
▶ 通路分析:将核心靶点导入KEGG和GO数据库进行功能富集。
▶ 实验验证:采用Western blot、qPCR、细胞表型实验等完成验证。
2021年《网络药理学评价方法指南》明确要求 —— 计算预测必须结合药动学考量,并强制执行实验验证,纯计算研究已难被高水平期刊接受。
二、逐一拆解五种核心靶点筛选方法与适用场景
围绕上面那条主线,目前最常用的靶点筛选技术大体可以归为五类。下面我按照自己的理解,分别讲清楚技术原理、适用场景以及我在实际选择时的考量。
方法一:网络药理学(最适用于复方全景扫描与假说生成)
▶ 适用场景:研究对象为含数十至上百种成分的复杂复方,需要快速建立“成分-靶点-疾病”整体网络图景,产出实验假说。
▶ 理论逻辑:疾病源于生物网络“失衡”,药物作用在于网络“纠偏”,与中药多成分协同特征天然契合。
▶ 关键工具与技术细节:
① 靶点预测(SwissTargetPrediction):
▶ 2D相似度:基于路径二进制指纹(FP2)计算Tanimoto系数;
▶ 3D相似度:基于Electroshape 5D(ES5D)向量计算曼哈顿距离(涵盖20种构象的原子坐标、电荷、亲脂性信息);
▶ 最终融合为Combined-Score,在超过37.6万已知化合物和3000余种靶点空间完成匹配。
② 网络分析(Cytoscape):优先考察Degree值,鉴定网络核心节点。
▶ 主要短板:
① 预测结果高度依赖公共数据库质量(陈旧数据引入假阳性/假阴性);
② 不同复方研究结果易趋同,缺乏剂量-效应关系考量;
③ 定位:提出假说的起点,而非确证结论的终点。
方法二:分子对接(最适用于成分-靶蛋白结合亲和力确证)
▶ 适用场景:网络药理学给出候选靶点后,需要在原子尺度验证“活性成分能否结合靶蛋白”。
▶ 核心物理量:结合自由能(ΔG,单位kcal/mol),综合静电、范德华力、氢键及疏水效应。
① 筛选门槛:ΔG < -5.0 kcal/mol 为潜在强结合剂;
② 参考范围:临床获批药物结合能多分布在 -5.0 至 -10.0 kcal/mol。
▶ 关键工具与精度选择:
|
精度模式 |
算法特征 |
速度 |
适用阶段 |
|
HTVS(高通量虚拟筛选) |
限制构象采样, 简化计分 |
≈ 2秒/化合物 |
百万级化合物库首轮粗筛 |
|
SP(标准精度) |
详尽枚举扭转角, 标准GlideScore |
≈ 10秒/化合物 |
中等规模库,兼顾速度与精度 |
|
XP(极高精度) |
“锚定-生长”机制, 引入溶剂化惩罚与氢键奖励 |
≈ 2分钟/化合物 |
少量候选化合物的最终确认 |
▶ 附加证据:可展示残基层面具体相互作用(氢键、π-阳离子、盐桥),提供物理化学层面的“实锤”。
▶ 主要短板:
① 严重依赖高分辨率蛋白3D晶体结构;
② 受体刚性假设无法完全模拟真实水相动态环境;
③ 补救策略:通常需补充分子动力学(MD)模拟和MM-PBSA/GBSA计算。
方法三:反向药理学与药效团搜索(最适用于已知活性单体的靶点反推)
▶ 适用场景:手握结构明确、活性清楚的中药单体(如黄酮、生物碱、萜类),但其作用靶点不清晰。
▶ 核心逻辑:与传统“先有靶点再找配体”相反——从已知活性单体出发,反向推测其可能作用的蛋白网络。
▶ 关键技术:反向药效团匹配——药效团指配体中被受体识别的三维特征集合(氢键供/受体、疏水中心、芳环中心及空间距离)。
▶ 关键工具(PharmMapper):后台整合超过 23,236个蛋白质靶点 和 16,159个可成药药效团模型。
▶ 评估优化策略:
① 简单Fit Score信噪比较高,我更倾向使用标准化统计得分(Z-score)—— 基于背景数据库随机匹配概率,提升多药理学轮廓预测准确度(包括脱靶/毒性靶点识别)。
② 辅助指标:富集因子(EF)—— 衡量前1%或5%预测结果中真实靶点发现率相对于随机抽样的提升倍数。
▶ 主要短板:依赖已知靶点-配体结合的三维结构信息;对高柔性配体的匹配精度下降。
方法四:多组学整合筛选(最适用于高证据等级机制深挖)
▶ 适用场景:经费相对充足,需要构建“基因→蛋白→代谢”完整因果链,冲击顶刊级别机制研究。
▶ 本质特征:与前三种“计算预测”不同,直接基于生物学实验样本读取真实变化,证据强度最高。
▶ 三大组学层级与技术路径:
|
组学层级 |
技术手段 |
捕获信息 |
生物学意义 |
|
转录组学 |
RNA-seq |
差异表达基因 (DEGs) |
最敏感, 反映药物诱导的早期应激与信号级联 |
|
蛋白质组学 |
LC-MS/MS |
蛋白丰度及翻译后修饰 (如磷酸化) |
对应具体受体/代谢酶, 功能执行层 |
|
代谢组学 |
色谱-质谱联用; 空间代谢组学(MSI) |
内源性小分子代谢物 及其组织空间分布 |
最终表型; MSI(DESI/SIMS/MALDI)能直观展示药物分布 与代谢网络空间位移 |
方法五:深度学习与AI预测(最适用于未知化合物盲筛与无结构靶点预测)
▶ 适用场景:传统数据库覆盖不到的“全新”化合物,或靶点三维结构未解析(对接无法进行)时。
▶ 核心优势:不依赖已知配体(网络药理学依赖),也不依赖三维晶体结构(分子对接依赖),从海量异构数据中自主提取高阶特征。
▶ 输入输出形式:
① 化合物 → SMILES字符串、摩根指纹、分子图拓扑结构;
② 蛋白质 → 氨基酸一维序列或接触图;
③ 输出 → 结合亲和力分数或结合概率。
▶ 代表性架构:
① DeepPurpose库:集成15种编码器(CNN、RNN、Transformer)与超50种神经网络架构,端到端输出结合亲和力,对非计算机专业研究者相对友好;
② DeepDrug架构:残差图卷积网络(RGCN)+ CNN,在药物-靶点及药物-药物协同作用预测中表现突出。
▶ 主要短板:
① 归纳场景(Inductive)泛化能力弱:训练集未出现的新化合物/蛋白时,AUROC断崖下降,提示过拟合风险;
② “黑盒”属性:缺乏物理药效学直接解释力。
三、横向对比:根据什么来选方法?
基于上述拆解,我从通量、证据强度、成本、首选场景、核心局限五个维度整理如下,便于快速决策:
|
方法 |
数据通量 |
证据强度 |
成本 |
我的首选场景 |
我警惕的局限 |
|
网络药理学 |
极高 |
较低 (假说级别) |
极低 |
复方初筛、通路探索、 产出实验假说 |
受限于已知知识库, 假阳性高,不反映体内动态 |
|
分子对接 |
较高 |
中等 (原子级物理解释) |
较低 |
验证特定成分-靶蛋白的结合亲和力 |
依赖高精度晶体结构, 受体刚性假设 |
|
反向药理学 |
较高 |
中等 |
较低 |
已知活性单体的靶点 及脱靶搜索 |
依赖已知靶点结构, 柔性配体精度下降 |
|
多组学整合 |
低至中等 |
极高 (真实样本因果链) |
极高 |
顶刊级机制深挖、 毒性研究、空间分布分析 |
难区分直接靶点与下游效应, 生物噪音干扰 |
|
深度学习/AI |
极高 (GPU加速) |
中至低 (可解释性正在提升) |
中等 |
未知化合物盲筛、 无结构靶点的预测 |
归纳场景泛化弱, 依赖训练集质量,黑盒属性 |
总结
回顾以上从“五步主线”到“五大方法”的系统梳理,我最终沉淀出两条清晰的认知。
体会一:融合是必经之路,单一方法无法独立支撑完整靶点研究。
我观察到,高水平研究普遍遵循一套“三段式”复合路径:预测与假设(网络药理学 / AI)→ 微观确证(分子对接 / 药效团)→ 表型验证(多组学 + 实验)
体会二:规范是底线要求,实验验证已从“加分项”变为“必选项”。
随着《网络药理学评价方法指南》的落地,加上AI、空间代谢组学和AlphaFold等工具的不断赋能,中药靶点研究正从“粗糙的可能性列举”稳步迈向 “空间-时间-剂量全要素精准解析”。
然而,回到现实,我在实际课题中经常卡在同一个难题上:想要跑通上面这套“三段式”流程,尤其是完成高质量的多组学整合与实验验证,往往面临经费吃紧、周期漫长、数据整合门槛高的三重阻力。
基于此,谱度众合推出了一条针对性极强的“现实解题路径”:经费仅需3万元,周期仅1个月 —— 对于正在规划课题、希望在有限经费和时间内产出的研究者而言,这套方案提供了一个兼顾“证据强度、发文效率与合规性”的务实选择。它衔接了我前面讲到的“从预测到验证”的闭环缺口,让中药靶点研究的复合范式在现实中真正“落地可及”。
参考资料
1. Zhai Y, Liu L, Zhang F, et al. Network pharmacology: a crucial approach in traditional Chinese medicine research. Chin Med. 2025;20(1):8. doi:10.1186/s13020-024-01056-2
2. Wu J, Li XY, Liang J, et al. Network pharmacological analysis of active components of Tongqiao Huoxue Decoction in the treatment of intracerebral hemorrhage. Ann Transl Med. 2022;10(10):567. doi:10.21037/atm-22-1403
3. Zhang P, Zhang D, Zhou W, Wang L, Wang B, Zhang T, Li S. Network pharmacology: towards the artificial intelligence-based precision traditional Chinese medicine. Brief Bioinform. 2024;25(1):bbad518. doi:10.1093/bib/bbad518
4. Li J, Lu C, Jiang M, et al. Traditional Chinese medicine-based network pharmacology could lead to new multicompound drug discovery. Evid Based Complement Alternat Med. 2012;2012:149762. doi:10.1155/2012/149762
5. Wang X, Hu Y, Zhou X, Li S. Editorial: Network pharmacology and traditional medicine: setting the new standards by combining in silico and experimental work. Front Pharmacol. 2022;13:1002537. doi:10.3389/fphar.2022.1002537
6. Yin Y, Xie Y, Tan S, Zhang Y, Xu C. Network pharmacology insights into the mechanistic basis of Taohe Chengqi Decoction in the treatment of constipation. Medicine (Baltimore). 2026;105(6):e47501. doi:10.1097/MD.00000000000047501
7. Lyu M, Wang Y, Chen Q, et al. Molecular mechanism underlying effects of Wumeiwan on steroid-dependent asthma: a network pharmacology, molecular docking, and experimental verification study. Drug Des Devel Ther. 2022;16:909-929. doi:10.2147/DDDT.S349950

被折叠的 条评论
为什么被折叠?



