当前位置:网站首页>深度学习理论——过拟合、欠拟合、正则化、优化器
深度学习理论——过拟合、欠拟合、正则化、优化器
2022-08-04 05:30:00 【学习历险记】
数据增强:1不要太过,否则只增加训练时间,不会增加泛化能力;2不增加无关的数据
L2正则:倾向于对训练集样本共有特性的响应;使模型偏好参数小的样本,减小过拟合的风险
几种常见的优化器
对于稀疏数据,尽量选用学习率可自适应的优化方法,不需要手动调节,最好采用默认值。
随机梯度下降算法通常训练时间更长,容易陷入鞍点,但是在好的初始化和学习率调度方案情况下,结果更可靠。
整体来说,Adam是目前最好选择。
边栏推荐
猜你喜欢
【CV-Learning】图像分类
多项式回归(PolynomialFeatures)
Th in thymeleaf: href use notes
数据库的简述与常用操作指南
Pytest常用插件
【论文阅读】TransReID: Transformer-based Object Re-Identification
Vision Transformer 论文 + 详解( ViT )
[Deep Learning 21-Day Learning Challenge] 3. Use a self-made dataset - Convolutional Neural Network (CNN) Weather Recognition
图像形变(插值方法)
Pytorch语义分割理解
随机推荐
Usage of Thread, Handler and IntentService
AIDL communication between two APPs
MAE 论文《Masked Autoencoders Are Scalable Vision Learners》
语音驱动嘴型与面部动画生成的现状和趋势
基于PyTorch的FCN-8s语义分割模型搭建
The pipeline mechanism in sklearn
图像resize
Comparison of oracle's number and postgresql's numeric
Matplotlib中的fill_between;np.argsort()函数
度量学习(Metric learning、损失函数、triplet、三元组损失、fastreid)
TensorFlow2 study notes: 6. Overfitting and underfitting, and their mitigation solutions
动手学深度学习_多层感知机
latex-写论文时一些常用设置
【深度学习21天学习挑战赛】0、搭建学习环境
Qt日常学习
【深度学习21天学习挑战赛】1、我的手写被模型成功识别——CNN实现mnist手写数字识别模型学习笔记
Introduction of linear regression 01 - API use cases
【论文阅读】Exploring Spatial Significance via Hybrid Pyramidal Graph Network for Vehicle Re-identificatio
PostgreSQL schema (Schema)
【Copy攻城狮日志】飞浆学院强化学习7日打卡营-学习笔记