【深度学习基础】超参数介绍

最新推荐文章于 2026-04-21 10:05:13 发布

原创

最新推荐文章于 2026-04-21 10:05:13 发布 · 2.2k 阅读

·

4

·

标签

#深度学习

深度学习基础：

在深度神经网络中，超参数的调整是一项必备技能，通过观察在训练过程中的监测指标如损失loss和准确率来判断当前模型处于什么样的训练状态，及时调整超参数以更科学地训练模型能够提高资源利用率。下面将分别介绍并总结了不同超参数的调整规则。**按照超参数的重要程度进行介绍**

（1）学习率

学习率（learning rate或作lr）是指在优化算法中更新网络权重的幅度大小。学习率可以是恒定的、逐渐降低的，基于动量的或者是自适应的。不同的优化算法决定不同的学习率。
⼀般来说，微调参数层（finetune_net）会使用较小的学习率（eg：0.001）或固定不变，而从头训练输出层（scratch_net）可以使用较大的学习率（eg：0.01）
在这里插入图片描述

当学习率过大则可能导致模型不收敛，损失loss不断上下震荡；
学习率过小则导致模型收敛速度偏慢，需要更长的时间训练。
通常lr取值为[0.01,0.001,0.0001]

（2）批次大小batch_size

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。