当AI开始做研究，人类科学家还剩下什么？清华团队打造AgentSociety²人机协同研究环境

原创于 2026-06-18 17:09:34 发布 · 303 阅读

4 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#人工智能

当 AI Scientists 开始进入科学研究，一个新的问题随之出现：如果 AI 已经能够读文献、生成假设、设计实验、运行仿真、分析结果，甚至撰写论文，人类研究者还应该站在哪里？

这个问题在社会科学中尤其重要。社会科学研究的对象不是分子、材料或代码，而是由人、关系、制度、空间和信息共同构成的复杂社会过程。它不仅需要计算能力，也需要问题意识、理论判断、价值约束和机制解释。AI 可以帮助研究者更快地探索假设、更系统地组织实验、更大规模地运行仿真，但它不能替代人类判断什么问题值得研究，什么结果具有意义，什么干预应当被谨慎对待。

AgentSociety² 的人机协同设计，正是围绕这一点展开。它并不是让 AI Social Scientist 接管社会科学研究，而是将 AI 放入一个 human-in-the-loop 的研究流程中：AI 负责拓展可探索的问题范围、降低工程负担、组织实验过程和整理结果；人类研究者则在关键节点保留控制权，决定研究问题、修订假设、设定约束、解释机制，并判断结果背后的社会意义。

在 AI Scientists 时代，人类研究者并不会退场，而是从繁重的流程执行者，转向更关键的科学判断者。

* 官网：

AgentSociety² | An Integrated Research Environment for Executable Social Science

* 论文：

https://agentsociety2.fiblab.net/paper/AgentSociety2.pdf

* GitHub：

https://github.com/tsinghua-fib-lab/agentsociety

2025 年，清华大学团队推出 AgentSociety，将大语言模型智能体、真实社会环境与大规模仿真引擎结合起来，构建了一个面向复杂社会问题的大规模社会模拟器。系统能够支持万级智能体与大规模交互仿真，使研究者可以在计算环境中观察意见极化、信息传播、全民基本收入、飓风冲击和城市可持续性等社会现象如何从个体行为、社会互动和环境反馈中不断涌现。

图1. 大规模社会模拟器 AgentSociety-1 发展历程

AgentSociety-1 的关键意义在于，让 AI 智能体作为「硅基参与者」进入模拟社会。研究者可以在可控环境中构建人群、设定场景、观察互动，并分析微观行为如何涌现为宏观社会动态。

但社会科学研究不止于运行仿真。完整研究还包括提出问题、形成假设、设计实验、解释结果和撰写论文。AgentSociety-1 已经把「AI 社会」构建起来，而 AgentSociety² 进一步把社会科学研究流程接入这个 AI 社会。

因此，清华大学团队将 AgentSociety² 定位为「面向可执行社会科学的一体化研究环境（An Integrated Research Environment for Executable Social Science）」。它的核心变化，是将 AI 社会科学家（AI Social Scientists）与硅基参与者（Silicon Participants）放在同一运行环境中，使研究流程与模拟社会真正连接起来。

图2. AgentSociety² 通过智能体整合四种经典研究范式，形成面向社会科学研究的「智能融合范式」

人类研究者：在智能体洪流中保留科学判断

AgentSociety² 的设计首先回应的是一个根本问题：当 AI 开始进入社会科学研究流程，哪些环节可以交给智能体执行，哪些环节仍必须由人类研究者判断？
社会科学面对的是复杂社会过程，而不是静态数据或标准化实验材料。平台机制不能随意更改，公共政策不能轻易试错，灾害冲击也无法被人为重置。AgentSociety² 的目标不是让 AI 替代研究者，而是在加速实验构建和流程执行的同时，让人类继续掌握问题定义、机制解释和结论判断。
围绕这一目标，AgentSociety² 形成了三层设计。
第一层：双角色闭环，让 AI 科学家与硅基被试进入同一个研究环境
在 AgentSociety-1 中，LLM 智能体主要作为「硅基参与者」进入模拟社会，用来观察行为轨迹、群体互动和社会动态；但文献调研、理论建构、结果解释和论文写作，仍然主要发生在平台之外。
AgentSociety² 进一步引入 AI Social Scientists，把研究流程和模拟社会放进同一个运行环境：AI 社会科学家组织文献、假设、实验、分析和写作，硅基参与者则在模拟社会中行动、互动并提供实验反馈。由此，社会科学研究不再是「人在外部设计实验、平台内部运行仿真」，而是形成从问题提出、实验执行到结果解释的闭环。
第二层：人类掌舵，让 AI 加速科研而不是接管科研
AgentSociety² 采用 human-in-the-loop 的研究方式。它既不是高度托管但难以控制的聊天式科研助手，也不是需要研究者从零搭建的底层仿真框架，而是把 AI 的执行能力和人的判断能力放在同一个工作空间中。
AI 负责降低工程负担，帮助完成实验配置、仿真执行、结果整理和报告生成；人类研究者则在关键节点保留判断权，包括确认假设、修订变量映射、设定干预条件、解释实验有效性，并决定哪些结论可以被发布。AI 负责加速流程，人类负责把握方向。
第三层：机制实验室，把社会科学假设变成可以运行的实验
很多 AI for Science 系统处理的是相对明确的优化或预测任务，而社会科学更关心机制：个体认知、社会互动、制度条件和环境情境，如何共同生成宏观现象？在 AgentSociety² 中，研究问题和理论假设会被转化为可配置的智能体行为、环境规则、干预程序和测量指标。环境不再只是仿真的背景，而是可以承载机制、施加干预、收集行为轨迹的实验容器。过去写在论文中的假设，现在可以进一步变成真正运行起来的社会实验。

图3. AgentSociety²：从以仿真为中心的硅基被试模拟系统，走向硅基被试与硅基科学家协同的双角色研究生态

通过这三层设计，AgentSociety² 不只是让智能体模拟社会，而是把人类研究者、AI 社会科学家和硅基参与者放入同一个可审计的研究系统。社会科学假设由此不再停留在文字层面，而可以进一步落实为可运行、可观测、可比较、可复查的实验。

AI 社会科学家：在研究闭环中执行科学流程

在 AgentSociety² 的双角色设计中，AI Social Scientist 承担的是研究流程的组织与执行角色。它并不只是完成文献检索、方案生成或报告写作等单点任务，而是将社会科学研究中从概念到变量、从假设到干预、从实验设计到结果解释的连续过程，组织为一条可执行、可检查、可追踪的研究链路。
对于社会科学而言，难点往往不在于提出一个研究问题，而在于如何将开放性的研究想法转化为可运行的实验结构。研究者需要明确理论依据、变量映射、实验条件、干预方式、测量指标和分析路径。AgentSociety² 中的 AI Social Scientist 正是围绕这一转换过程展开，使原本依赖人工串联的文献、假设、实验、仿真和分析环节，被整合进同一个研究闭环。

图4. AI 科学家支持从研究主题界定、假设生成、实验设计、仿真配置、仿真运行到结果分析和报告生成的完整科研流程

为支撑这一流程，AgentSociety² 构建了面向社会科学的编排层（harness layer）。这一层将技能库、子智能体、工具接口和阶段化流程连接起来，使 AI Social Scientist 不再以黑箱方式自由生成内容，而是在明确的任务阶段中推进研究，并在关键节点接受研究者检查与修正。由此，AI 的能力被约束在社会科学研究所需的方法流程之中，既能提高执行效率，也保留研究过程的可控性和可审计性。

图5. 面向 AI 社会科学家的任务契约机制（Harness contract）：结构化技能定义提供稳定的能力调用与激活接口，共享工作空间用于记录从文献检索到论文生成全过程中的显式状态演化

在这一机制下，AI Social Scientist 的工作被组织为四个连续环节。
1. 文献驱动的假设生成
AI Social Scientist 首先从文献和外部资料中提炼理论背景、研究空白和变量关系，而不是直接生成未经约束的假设。系统会将研究意图整理为结构化假设包，包括假设表述、理论依据、实验组设计和可调用的仿真模块，使后续实验能够追溯到明确的文献证据和理论来源。

图6. AgentSociety² 将文献检索结果转化为结构化证据，再形成可验证、可追踪、可进入仿真的假设包

2. 从研究语义到可执行配置
在实验设计阶段，AI Social Scientist 会把研究问题转化为仿真系统可以运行的配置。一方面，它保留研究假设、实验组、智能体类型和环境模块等高层语义；另一方面，它生成初始化配置、实验步骤、干预条件和评价指标，使实验既符合理论意图，也能够被仿真引擎稳定执行。

图7. AgentSociety² 将开放研究问题自动化转化为可运行的计算仿真实验

3. 从仿真结果到机制分析
仿真结束后，AI Social Scientist 会整合数值结果、实验上下文、交互记录和运行日志，并将其重新对应到研究问题和理论条件中。分析过程不只是汇总数据，而是比较不同实验组下的行为差异和涌现模式，提炼可解释、可比较、可回溯的研究结论。

图8. AgentSociety² 将实验上下文、运行记录、数据表和可视化结果整合为研究者可检查的分析报告

4. 从分析报告到论文草稿
在研究呈现阶段，AgentSociety² 会将研究主题、假设、实验配置、分析摘要、图表和文献组织成论文写作蓝图。系统进一步建立论断与证据之间的对应关系，并通过多类审查智能体检查结论是否过度、术语和数字是否一致、实验结果是否足以支撑相应判断，最终生成研究者可继续检查和修改的论文草稿。

图9. AgentSociety² 将假设、实验、分析和文献等研究产物整合为论文写作蓝图，通过叙事规划、证据审计、论断—证据对齐、多视角审查和发布门控，最终编译生成可提交的论文 PDF

这一流程的核心，是让 AI Social Scientist 成为社会科学研究的流程组织者。它将一般大模型的文献理解、规划、工具调用和写作能力，约束到社会科学研究所需要的程序结构中；它不是直接替研究者给出结论，而是帮助研究者把抽象问题推进为可运行的实验方案，并进一步连接到硅基参与者和智能体化环境（Agentic Environments）中。
在这一过程中，Agentic Environments 承担实验承载作用。公共品博弈、囚徒困境、信任博弈、心理实验、社交媒体空间、事件空间、经济空间和移动空间等社会机制，被封装为可调用、可组合的环境模块。AI Social Scientist 因而可以将研究问题进一步转译为参与者设定、环境规则、干预条件、测量指标和分析流程，使研究设计真正进入可执行环境。

图10. 智能体化实验环境通过统一接口、AST 解析、代码生成路由器（CodeGenRouter）、代码缓存和安全执行机制，将智能体的自然语言意图转化为可执行的环境操作

在系统底层，AgentSociety² 采用基于技能的智能体架构，为长期仿真中的硅基参与者提供稳定的行为基础。观察、认知、计划、记忆以及特定实验中的决策规则，被拆解为可复用的技能模块；每个智能体拥有独立工作空间，用于保存画像、状态、记忆、日志和检查点，并在 ReAct 循环中按需调用相关能力。这样的设计使硅基参与者不再是一次性文本生成器，而是在长期仿真中持续保留状态、更新记忆并记录轨迹的可追踪行为主体。

图11. AgentSociety² 将社会人智能体扩展为通用硅基被试智能体，每个智能体通过独立工作区记录状态、记忆与行为轨迹，并在 ReAct 循环中按需调用观察、规划、记忆、认知等技能，支持长期、可追踪、可复现的社会实验

由此，AI Social Scientist的角色不是替研究者下结论，而是将文献、假设、实验、仿真、分析和写作组织成连续流程。它承担流程执行、实验转译和证据整理，使社会科学研究能够在同一闭环中逐步推进。

人智协作：在小时尺度上推进社会科学研究

AgentSociety² 的另一项重要价值，是将社会科学实验从高度依赖人工搭建的工程流程，转化为可以由人类研究者与 AI Social Scientist 协同推进的快速研究工作流。
在传统智能体社会实验中，研究者往往需要分别完成文献整理、假设拆解、环境建模、智能体配置、实验脚本编写、仿真运行、数据分析和结果报告。AgentSociety² 将这些环节整合到同一平台中，使研究者可以从研究主题或初步想法出发，快速生成可检查的假设、实验配置、仿真结果与分析报告。由此，研究者不再需要从零搭建完整实验管线，而可以在更短时间内完成从问题提出到结果反馈的研究迭代。
这种效率提升并不意味着科学判断被自动化取代。相反，AgentSociety² 将重复性流程交给 AI Social Scientist 执行，将关键判断保留给人类研究者。研究者可以检查假设是否合理、实验配置是否符合理论意图、仿真结果是否支持相应解释，并据此调整参数、修订干预或重新运行实验。人机协作的核心，不是让 AI 独立完成社会科学研究，而是让研究者更快进入真正需要判断的环节。

图12. AgentSociety² 实验案例展示

为了验证这种研究工作流的通用性，AgentSociety² 展示了 7 类多尺度社会科学实验，覆盖微观行为实验、中观网络动态和宏观城市情境。在微观层面，平台支持社会规范涌现、公共品博弈和心理调查，用于研究合作、惩罚、自我偏差和间接认知过程；在中观层面，平台支持信息茧房和意见极化实验，用于分析推荐机制、用户选择和内容暴露如何影响群体分化；在宏观层面，平台进一步进入城市移动和灾害响应场景，用于模拟日常出行与危机冲击下的人群行为。

图13. AgentSociety² 研究案例实验结果

这些案例说明，AgentSociety² 并不是一个面向单一任务的智能体实验工具，而是一个能够承载不同尺度、不同学科问题的社会科学研究环境。研究者可以在同一平台中构建人群、配置环境、施加干预、运行仿真、比较结果，并形成可复查的研究证据。对于社会科学而言，这意味着研究迭代可以从以周或月为单位的工程组织，逐步转向以小时为单位的实验反馈。

迈向 AI 时代的社会科学基础设施

从计算社会科学的角度看，AgentSociety² 的意义不只是提供一个更大规模的社会模拟平台，而是将模拟个体、社会环境和研究流程连接为同一个可执行系统。过去，研究者可以观察真实世界，却很难频繁干预；可以构建仿真模型，却常常需要简化人类行为；可以借助大模型生成智能体，却仍需要在平台外手动组织假设、实验、分析和写作。AgentSociety² 试图把这些分散环节整合起来，使社会科学研究能够在同一环境中完成问题提出、机制设定、干预设计、仿真运行、结果分析和证据沉淀。
在这一闭环中，AI Social Scientist 提供流程执行能力，Silicon Participants 提供行为反馈，人类研究者则保留问题定义、机制解释和结论判断。AI 承担的是加速与组织，真正决定研究方向和社会意义的，仍然是人类科学家的判断。

图14. AgentSociety²：面向人机协同的一体化研究环境

在 AI for Science 快速发展的今天，AI Scientist 已经进入机器学习、生物医学、化学和材料等领域。但社会科学面对的是更复杂的对象：由人、关系、制度、空间和信息环境共同构成的社会过程。AgentSociety² 给出的路径，是让 AI 不只参与单点科研任务，而是进入社会科学研究的完整流程；不只模拟社会行为，而是帮助研究者把社会科学问题转化为可运行、可观测、可比较、可复查的实验。
由此，社会科学有机会从事后解释现象，进一步走向主动测试机制；从一次性研究项目，走向可积累、可复用、可审计的研究基础设施。对人类科学家而言，AI Scientists 时代真正留下的，并不是重复性的流程执行，而是更高层次的科学判断：什么问题值得被提出，什么机制值得被检验，什么结论可以被负责任地带回真实世界。
AgentSociety² 的目标，正是在真实世界之外，为社会科学打开一个更可控、更高效、也更可复现的实验室。