2025_NIPS_De novo Drug Design using Reinforcement Learning with Multiple GPT Agents

文章总结与翻译

一、主要内容

本文提出了一种基于多GPT智能体的强化学习算法MolRL-MGPT,用于从头药物设计(de novo drug design),核心目标是生成兼具特定属性(如与蛋白靶点的结合亲和力、类药性、合成可及性)和高多样性的药物分子。

  1. 研究背景:传统药物发现过程耗时耗力、成功率低,而现有AI驱动的药物设计方法在分子多样性方面存在不足,多智能体强化学习(MARL)尚未被有效应用于该领域。
  2. 核心框架
    • 将分子设计视为协作马尔可夫博弈,采用多个轻量级GPT模型作为智能体,基于SMILES(简化分子线性输入规范)字符串进行预训练初始化。
    • 设计了包含主损失项和辅助损失项的损失函数:主损失项最大化分子得分,辅助损失项鼓励智能体在化学空间中探索不同方向以提升多样性;引入分子记忆库存储高分分子,结合经验回放机制优化模型训练。
  3. 实验验证
    • 在GuacaMol基准测试的20个任务中,13个任务表现优于现有基线方法,总得分排名第一。
    • 成功应用于SARS-CoV-2的两个蛋白靶点(PLPro_7JIR和RdRp_6YYT)抑制剂设计,生成的候选分子具有良好的结合亲和力和合成可及性。
    • 在GSK3β、JNK3和QED最大化任务的消融实验中,验证了多智能体协作、方向探索、经验回放等模块的有效性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值