LLM 中评价指标与训练概要介绍

【LLM】LLM 中增量解码与模型推理解读一文中对 LLM 常见名词进行了介绍,本文会对 LLM 中评价指标与训练概要进行介绍,本文并未介绍训练实操细节,未来有机会再了解~

一、LLM 如何停止输出

在看 LLM 评价指标前,先看看 LLM 如何停止输出。

大模型常通过以下几种策略控制生成终止:

  1. 结束符号(EOS Token)

模型生成特殊终止符(如 DeepSeek R1 MoE 中 ID 为 1 的 token)表示回答完成。

...在物理学领域做出了革命性贡献。[EOS]  
  1. 最大长度限制 预设生成 token 上限(常见值:512/1024/2048),防止无限生成,保障系统资源安全。
  2. 停止词 / 序列触发 设置 “\n\n”“###” 等符号为停止信号,强制结束生成(适用于格式控制)。
  3. 内容智能判断
    1. 重复检测:识别循环或冗余内容时自动终止。
    2. 语义完整性:当回答覆盖查询所有维度(如时间、影响)时停止。

停止机制建议组合使用(如 EOS + 最大长度),确保生成既完整又可控。

综合来看,Decode 阶段的循环机制是大模型实现长文本生成的核心:

  • 效率优化:通过 KV 缓存复用大幅降低计算成本;
  • 可控生成:多维度停止策略平衡输出质量与资源消耗;
  • 语义连贯:自回归模式确保上下文逻辑衔接紧密。

二、LLM 评价指标

常见 LLM 评价指标如下:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值