当前位置:网站首页>深度学习理论——过拟合、欠拟合、正则化、优化器
深度学习理论——过拟合、欠拟合、正则化、优化器
2022-08-04 05:30:00 【学习历险记】





数据增强:1不要太过,否则只增加训练时间,不会增加泛化能力;2不增加无关的数据

L2正则:倾向于对训练集样本共有特性的响应;使模型偏好参数小的样本,减小过拟合的风险

几种常见的优化器


对于稀疏数据,尽量选用学习率可自适应的优化方法,不需要手动调节,最好采用默认值。
随机梯度下降算法通常训练时间更长,容易陷入鞍点,但是在好的初始化和学习率调度方案情况下,结果更可靠。
整体来说,Adam是目前最好选择。

边栏推荐
猜你喜欢

TensorFlow2 study notes: 5. Common activation functions

【论文阅读】Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation

强化学习中,Q-Learning与Sarsa的差别有多大?

Briefly say Q-Q map; stats.probplot (QQ map)

PyTorch

【论文阅读】Multi-View Spectral Clustering with Optimal Neighborhood Laplacian Matrix

动手学深度学习__数据操作

【深度学习21天学习挑战赛】2、复杂样本分类识别——卷积神经网络(CNN)服装图像分类

Data reading in yolov3 (1)

逻辑回归---简介、API简介、案例:癌症分类预测、分类评估法以及ROC曲线和AUC指标
随机推荐
属性动画的用法 以及ButterKnife的用法
Linear Regression 02---Boston Housing Price Prediction
TensorFlow2学习笔记:7、优化器
Pytorch问题总结
基于PyTorch的FCN-8s语义分割模型搭建
[Deep Learning 21 Days Learning Challenge] 2. Complex sample classification and recognition - convolutional neural network (CNN) clothing image classification
postgres recursive query
JPEG2jpg
图像合并水平拼接
ConnectionRefusedError: [Errno 111] Connection refused问题解决
双向LSTM
【CV-Learning】卷积神经网络
安卓连接mysql数据库,使用okhttp
【论文阅读】TransReID: Transformer-based Object Re-Identification
PostgreSQL schema (Schema)
Th in thymeleaf: href use notes
fuser 使用—— YOLOV5内存溢出——kill nvidai-smi 无pid 的 GPU 进程
深度确定性策略梯度(DDPG)
TensorFlow2学习笔记:4、第一个神经网模型,鸢尾花分类
动手学深度学习_线性回归