文章主要内容与创新点总结
一、主要内容
本文针对脑细胞类型功能注释面临的参考标记不完善、文献关联不精准、传统工具注释泛化等问题,开发了名为BRAINCELL-AID的多智能体AI系统,用于脑细胞类型及相关标记基因集的注释。
该系统整合了三个核心智能体:查询智能体(基于微调的大语言模型LLMs)、文献智能体(检索相关生物医学文献)和检索增强生成(RAG)智能体(结合文献证据优化注释结果),形成“初始注释-文献检索-证据强化”的完整工作流。系统以MSigDB数据库中7000余个基因集为训练和评估数据,在小鼠和人类基因集注释中分别达到77%和74%的生物真实性一致性。
基于艾伦脑图谱(ABC Atlas)的5322个小鼠脑细胞簇数据,BRAINCELL-AID完成了20,000余个脑特异性标记基因集的注释,涵盖单细胞RNA测序、空间转录组学等多模态数据。通过与传统基因集富集分析(GSEA)对比,该系统能提供更具神经学意义的精准注释(如基底节相关细胞类型的特异性描述),还能识别区域特异性基因共表达模式、推断基因集合功能角色,并生成可验证的生物学假设(如黑质、腹侧被盖区等区域的双递质信号传导假设)。
此外,研究搭建了开放的BRAINCELL-AID网页门户,支持神经科学社区协作评估、修订和补充注释,推动人机协同的脑细胞图谱完善,为跨物种脑细胞类型的高质量注释奠定基础。
二、创新点
- 多智能体协同架构:首次构建“查询智能体-文献智能体-RAG智能体”的模块化工作流,将LLM微调与文献证据 grounding 相结合,有效解
订阅专栏 解锁全文

926

被折叠的 条评论
为什么被折叠?



