深度学习基础:
在深度神经网络中,超参数的调整是一项必备技能,通过观察在训练过程中的监测指标如损失loss和准确率来判断当前模型处于什么样的训练状态,及时调整超参数以更科学地训练模型能够提高资源利用率。下面将分别介绍并总结了不同超参数的调整规则。**按照超参数的重要程度进行介绍**
(1)学习率
学习率(learning rate或作lr)是指在优化算法中更新网络权重的幅度大小。学习率可以是恒定的、逐渐降低的,基于动量的或者是自适应的。不同的优化算法决定不同的学习率。
⼀般来说,微调参数层(finetune_net)会使用 较小 的学习率(eg:0.001)或固定不变,而从头训练输出层(scratch_net)可以使用 较大 的学习率(eg:0.01)

- 当学习率过大则可能导致模型不收敛,损失loss不断上下震荡;
- 学习率过小则导致模型收敛速度偏慢,需要更长的时间训练。
- 通常lr取值为[0.01,0.001,0.0001]
(2)批次大小batch_size


1115

被折叠的 条评论
为什么被折叠?



