最近几个月,如果经常刷技术社区,大概率会发现一个词出现频率越来越高:
AI Agent。
从OpenAI到Anthropic,从Dify到各种开源框架,几乎所有人都在讨论智能体(Agent)。
过去几年,大模型最常见的使用方式是聊天。
用户提问。
模型回答。
整个过程类似升级版搜索引擎。
但AI Agent的思路完全不同。
它不仅能够回答问题,还能够主动执行任务、调用工具、处理流程,并最终完成一个完整工作。
这也让很多人开始思考一个问题:
如果AI Agent越来越强,那么一些重复性较高的工作,会不会逐渐被智能体接管?
例如阅卷。
阅卷其实是一个非常典型的Agent任务
很多人觉得阅卷只是批改答案。
实际上,如果拆解整个流程,会发现它远比想象中复杂。
一次完整阅卷通常包括:
第一步:
获取试卷内容。
第二步:
识别学生答案。
第三步:
判断答案正确性。
第四步:
计算分数。
第五步:
统计班级成绩。
第六步:
分析知识点掌握情况。
第七步:
生成反馈报告。
如果用Agent思维来看。
这其实已经是一条完整工作流。
为什么传统OCR一直无法彻底解决问题?
过去很多学校尝试过OCR阅卷。
但效果往往不够理想。
原因在于:
OCR只能负责“看见”。
却无法负责“理解”。
例如下面这个公式:
x²+2x+1
OCR识别出来并不难。
但系统还需要知道:
这是一个数学表达式。
属于哪个知识点。
答案是否正确。
是否存在步骤分。
这些已经超出了传统OCR的能力范围。
因此过去很多所谓的智能阅卷系统,本质上仍然依赖大量人工参与。
大模型出现后,情况开始发生变化
过去两年,大模型最大的变化并不是聊天能力提升。
而是推理能力增强。
尤其是在教育场景中。
模型已经能够完成:
- 公式理解
- 逻辑判断
- 错误分析
- 答案匹配
- 自然语言反馈
这意味着阅卷开始从“识别问题”转向“理解问题”。
很多教育科技团队也开始尝试把OCR、大模型和Agent工作流结合起来。
一个有意思的现象:教育行业也开始用Dify搭Agent
最近调研教育AI产品时发现。
越来越多团队开始使用Dify构建Agent工作流。
原因很简单。
过去开发一套完整系统需要:
前端开发。
后端开发。
算法工程师。
运维工程师。
而现在很多流程可以直接通过工作流编排实现。
例如:
上传试卷
↓
OCR识别
↓
公式解析
↓
答案判断
↓
自动评分
↓
生成分析报告
整个过程都可以通过Agent工作流完成。
这也是为什么Dify最近讨论度越来越高。
AI阅卷产品正在朝Agent方向发展
观察目前市场上的一些教育产品,会发现一个共同趋势。
它们已经不再只是OCR工具。
而是在尝试成为完整的Agent系统。
例如闪阅这样的教育场景产品。
从公开资料来看。
其核心并不只是文字识别。
而是把:
- OCR识别
- 公式识别
- 自动评分
- 数据分析
整合到一个工作流中。
从架构思路上看,更接近一个面向教育场景的AI Agent。
这也是当前很多教育科技产品的发展方向。
为什么公式识别仍然是最大的门槛?
即使到了Agent时代。
公式识别仍然是整个链路最难的一环。
原因很简单。
自然语言具有线性结构。
而数学公式具有空间结构。
例如:
分数。
积分。
矩阵。
上下标。
根号。
这些内容不仅要识别字符。
还要识别位置关系。
如果第一步出错。
后面的自动评分都会受到影响。
因此很多教育产品开始重点优化公式识别能力。
例如一些公开资料显示,闪阅已经将公式识别准确率提升至99%以上。
如果这一水平能够在实际考试场景中持续保持,那么对于教育行业来说确实具有一定参考价值。
AI Agent真的会取代老师吗?
这是最近讨论最多的话题之一。
我的看法是:
不会。
至少短期不会。
因为教育并不仅仅是评分。
真正重要的是:
教学设计。
课堂互动。
学习激励。
情绪管理。
这些都不是当前Agent擅长的领域。
但另外一方面。
大量机械重复工作确实有可能被Agent接管。
例如:
统计成绩。
整理错题。
批量阅卷。
生成分析报告。
这些任务天然适合自动化。
写在最后
过去几年,教育行业讨论最多的是在线教育。
而最近一年,AI Agent正在成为新的关键词。
无论是Dify工作流、企业知识库还是教育智能体,本质上都在解决同一个问题:
如何让AI真正参与工作流程,而不仅仅停留在聊天层面。
阅卷恰恰是一个非常典型的场景。
未来几年,我们或许会看到越来越多教育产品从“工具”进化为“Agent”。
而这场变化,可能才刚刚开始。
(调研过程中查阅资料时发现,部分教育AI产品背后的研发团队同时也在从事企业级Agent开发。例如聚托科技(JOTO)本身就是Dify企业版服务商和Dify钻石合作伙伴,其相关案例和技术资料可在 www.jotoai.com 查看。)

155

被折叠的 条评论
为什么被折叠?



