小默说AI(17):Softmax —— 分数变概率

小默说AI(17):Softmax —— 分数变概率

上一集我们讲了前馈网络(FFN)的三步走:升维、GELU筛选、降维。Softmax是AI领域最常见的激活函数之一——从图像分类到Transformer的注意力机制,它无处不在。很多人对它只有一个模糊的印象:"就是把一堆数字变成概率的东西"。这期我们把它彻底讲透:它到底在做什么,为什么必须用指数变换,以及那个看似多余的"减去最大值"到底解决了什么问题。

一、从打分到概率:Softmax的使命

1.1 投票怎么变成百分比?

假设你训练了一个图像分类模型,最后一层对一张图片输出了四个分数:

  • :2.1
  • :0.5
  • :-1.3
  • :3.0

这些分数本身有明确的相对大小关系——鱼最可能,猫其次。但模型需要的是一个"概率分布",也就是每个类别的概率加起来等于1,且每个概率都是非负的。你不能用原始分数直接归一化,因为-1.3是负数,不能作为概率。

这时候就需要Softmax出场。它的作用就像一个翻译官,把原始打分翻译成概率。

Softmax的输入是一组K维实数,输出也是一组K维数值,满足两个条件:每个元素都在0到1之间所有元素之和为1。这恰好就是一个概率分布的数学定义。

二、Softmax的三步走

Softmax的计算过程可以拆成三步,理解这三步对理解它的行为至关重要。

2.1 第一步:指数变换

对每个输入值求e的幂次方。e的任意实数次幂都是一个正数,这就解决了分数可能为负的问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小默说AI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值