当前位置：网站首页>【提高准确率方法总结】

【提高准确率方法总结】

2022-06-10 03:25:00 【网络星空(luoc)】

文章目录

1.数据集扩增
2.增大数据集差异性，随机性
3.使用tensor transform对数据进行预处理
4.调节batch_size大小
5.设置shuffle=True
6.调节学习率（learning rate）
7.权重衰减（weight_decay）
8.适当增加训练轮次（num_epochs）
9.dropout()参数及位置
10.参数初始化
11.调整网络结构（层数，每层的大小，函数）

当初步搭建好网络，模型能出初步结果后，若想优化，可以考虑调整：

1.数据集扩增

一般增加数据集容量，训练后的准确率会得到明显提升。

2.增大数据集差异性，随机性

在制作数据集时可以考虑增加数据的差异性，随机性。

3.使用tensor transform对数据进行预处理

pytorch 中使用transform模块对数据进行预处理。

原因:transform可以提升数据泛化能力包括：数据中心化、数据标准化、缩放、裁剪、旋转、翻转、填充、噪声添加、灰度变换、线性变换、仿射变换、亮度、饱和度及对比度变换等。

4.调节batch_size大小

调整batch_size大小，可以16,32,64…这样依次往上调，寻找最适合的，当然不必要是2的倍数

原因：batch size的大小决定了深度学习训练过程中的完成每个epoch所需的时间和每次迭代(iteration)之间梯度的平滑程度。batch size过小，花费时间多，同时梯度震荡严重，不利于收敛；batch size过大，不同batch的梯度方向没有任何变化，容易陷入局部极小值。

5.设置shuffle=True

随机读取数据，一般在训练网络时使用，对于小数据集来说效果惊人。

原因：shuffle方法，用来打乱数据集中数据顺序，以避免数据投入的顺序对网络训练造成影响。
增加随机性，提高网络的泛化性能，避免因为有规律的数据出现，导致权重更新时的梯度过于极端，避免最终模型过拟合或欠拟合。因为按照某些顺序投入容易在训练中走偏或陷入局部最优使得训练效果出现差异，尤其是当batch size比较小的时候。

6.调节学习率（learning rate）

可以使用动态学习率，也可以先是大的学习率，然后慢慢减小，如开始是0.1，然后是0.05，每一次都对半分，寻找最合适的学习率。

原因：将输出误差反向传播给网络参数，以此来拟合样本的输出。本质上是最优化的一个过程，逐步趋向于最优解。但是每一次更新参数利用多少误差，就需要通过一个参数来控制，这个参数就是学习率（Learning rate）,也称为步长。
在这里插入图片描述
最理想的学习率不是固定值，而是一个随着训练次数衰减的变化的值，也就是在训练初期，学习率比较大，随着训练的进行，学习率不断减小，直到模型收敛。