文章总结与翻译
一、主要内容
本文提出了一种基于多GPT智能体的强化学习算法MolRL-MGPT,用于从头药物设计(de novo drug design),核心目标是生成兼具特定属性(如与蛋白靶点的结合亲和力、类药性、合成可及性)和高多样性的药物分子。
- 研究背景:传统药物发现过程耗时耗力、成功率低,而现有AI驱动的药物设计方法在分子多样性方面存在不足,多智能体强化学习(MARL)尚未被有效应用于该领域。
- 核心框架:
- 将分子设计视为协作马尔可夫博弈,采用多个轻量级GPT模型作为智能体,基于SMILES(简化分子线性输入规范)字符串进行预训练初始化。
- 设计了包含主损失项和辅助损失项的损失函数:主损失项最大化分子得分,辅助损失项鼓励智能体在化学空间中探索不同方向以提升多样性;引入分子记忆库存储高分分子,结合经验回放机制优化模型训练。
- 实验验证:
- 在GuacaMol基准测试的20个任务中,13个任务表现优于现有基线方法,总得分排名第一。
- 成功应用于SARS-CoV-2的两个蛋白靶点(PLPro_7JIR和RdRp_6YYT)抑制剂设计,生成的候选分子具有良好的结合亲和力和合成可及性。
- 在GSK3β、JNK3和QED最大化任务的消融实验中,验证了多智能体协作、方向探索、经验回放等模块的有效性。

订阅专栏 解锁全文

206

被折叠的 条评论
为什么被折叠?



