2025_NIPS_De novo Drug Design using Reinforcement Learning with Multiple GPT Agents

原创于 2026-06-23 11:30:00 发布 · 5 阅读

·

0

·

标签

#gpt #人工智能 #深度学习

LLM Daily 同时被 2 个专栏收录

2852 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

241 篇文章

订阅专栏

文章总结与翻译

一、主要内容

本文提出了一种基于多GPT智能体的强化学习算法MolRL-MGPT，用于从头药物设计（de novo drug design），核心目标是生成兼具特定属性（如与蛋白靶点的结合亲和力、类药性、合成可及性）和高多样性的药物分子。

研究背景：传统药物发现过程耗时耗力、成功率低，而现有AI驱动的药物设计方法在分子多样性方面存在不足，多智能体强化学习（MARL）尚未被有效应用于该领域。
核心框架：
- 将分子设计视为协作马尔可夫博弈，采用多个轻量级GPT模型作为智能体，基于SMILES（简化分子线性输入规范）字符串进行预训练初始化。
- 设计了包含主损失项和辅助损失项的损失函数：主损失项最大化分子得分，辅助损失项鼓励智能体在化学空间中探索不同方向以提升多样性；引入分子记忆库存储高分分子，结合经验回放机制优化模型训练。
实验验证：
- 在GuacaMol基准测试的20个任务中，13个任务表现优于现有基线方法，总得分排名第一。
- 成功应用于SARS-CoV-2的两个蛋白靶点（PLPro_7JIR和RdRp_6YYT）抑制剂设计，生成的候选分子具有良好的结合亲和力和合成可及性。
- 在GSK3β、JNK3和QED最大化任务的消融实验中，验证了多智能体协作、方向探索、经验回放等模块的有效性。

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。