【深度学习基础】超参数介绍

深度学习基础:

  1. 性能评估指标
  2. 超参数介绍
  3. 损失函数

在深度神经网络中,超参数的调整是一项必备技能,通过观察在训练过程中的监测指标如损失loss和准确率来判断当前模型处于什么样的训练状态,及时调整超参数以更科学地训练模型能够提高资源利用率。下面将分别介绍并总结了不同超参数的调整规则。**按照超参数的重要程度进行介绍**

(1)学习率

学习率(learning rate或作lr)是指在优化算法中更新网络权重的幅度大小。学习率可以是恒定的、逐渐降低的,基于动量的或者是自适应的。不同的优化算法决定不同的学习率。
⼀般来说,微调参数层(finetune_net)会使用 较小 的学习率(eg:0.001)或固定不变,而从头训练输出层(scratch_net)可以使用 较大 的学习率(eg:0.01)
在这里插入图片描述

  • 当学习率过大则可能导致模型不收敛,损失loss不断上下震荡;
  • 学习率过小则导致模型收敛速度偏慢,需要更长的时间训练。
  • 通常lr取值为[0.01,0.001,0.0001]

(2)批次大小batch_size

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值