当前位置:网站首页>深度学习 | 三个概念:Epoch, Batch, Iteration
深度学习 | 三个概念:Epoch, Batch, Iteration
2022-07-01 23:18:00 【日和公主】

- Epoch(时期):
当一个完整的数据集通过了神经网络一次并且返回了一次,这个过程称为一次>epoch。(也就是说,所有训练样本在神经网络中都 进行了一次正向传播 和一次反向传播 )
再通俗一点,一个Epoch就是将所有训练样本训练一次的过程。然而,当一个Epoch的样本(也就是所有的训练样本)数量可能太过庞大(对于计算机而言),就需要把它分成多个小块,也就是就是分成多个Batch 来进行训练。**
Batch(批 / 一批样本):
将整个训练样本分成若干个Batch。Batch_Size(批大小):
每批样本的大小。Iteration(一次迭代):
训练一个Batch就是一次Iteration(这个概念跟程序语言中的迭代器相似)。
- 为什么要使用多于一个epoch?
在神经网络中传递完整的数据集一次是不够的,而且我们需要将完整的数据集在同样的神经网络中传递多次。但请记住,我们使用的是有限的数据集,并且我们使用一个迭代过程即梯度下降来优化学习过程。如下图所示。因此仅仅更新一次或者说使用一个epoch是不够的。
随着epoch数量增加,神经网络中的权重的更新次数也在增加,曲线从欠拟合变得过拟合。
那么,问题来了,几个epoch才是合适的呢?
不幸的是,这个问题并没有正确的答案。对于不同的数据集,答案是不一样的。但是数据的多样性会影响合适的epoch的数量。比如,只有黑色的猫的数据集,以及有各种颜色的猫的数据集。
换算关系:

实际上,梯度下降的几种方式的根本区别就在于上面公式中的 Batch_Size 不同。

举个例子:
边栏推荐
- Development trend and future direction of neural network Internet of things
- Y53. Chapter III kubernetes from introduction to mastery -- ingress (26)
- CKS CKA ckad change terminal to remote desktop
- 2021 RoboCom 世界机器人开发者大赛-本科组初赛
- dat.GUI
- jpa手写sql,用自定义实体类接收
- Know --matplotlib
- 2022安全员-C证考试题模拟考试题库及模拟考试
- 2022 examination questions and online simulation examination for safety management personnel of hazardous chemical business units
- Concepts of dictionary, hash table and array
猜你喜欢

"35 years old, the boss of the company, with a monthly salary of 20000, give away takeout": the times abandoned you, not even saying goodbye

What is mosaic?

2022 safety officer-c certificate examination question simulation examination question bank and simulation examination
![[applet] realize the left and right [sliding] list through the scroll view component](/img/18/b1b4e9923782856143721dad84cbab.png)
[applet] realize the left and right [sliding] list through the scroll view component

Notes on problems - /usr/bin/perl is needed by mysql-server-5.1.73-1 glibc23.x86_ sixty-four

2021 RoboCom 世界机器人开发者大赛-高职组初赛

Glass mosaic

Three development trends of enterprise application from the perspective of the third technological revolution

2022 crane driver (limited to bridge crane) examination questions and simulation examination

The online beggar function of Japanese shopping websites
随机推荐
Concepts of dictionary, hash table and array
y53.第三章 Kubernetes从入门到精通 -- ingress(二六)
Matplotlib common charts
[LeetCode] 最后一个单词的长度【58】
物联网应用技术专业是属于什么类
jpa手写sql,用自定义实体类接收
为什么PHP叫超文本预处理器
win 10 mstsc连接 RemoteApp
【无标题】
Development trend and future direction of neural network Internet of things
2022-07-01:某公司年会上,大家要玩一食发奖金游戏,一共有n个员工, 每个员工都有建设积分和捣乱积分, 他们需要排成一队,在队伍最前面的一定是老板
2021 RoboCom 世界机器人开发者大赛-本科组初赛
"35 years old, the boss of the company, with a monthly salary of 20000, give away takeout": the times abandoned you, not even saying goodbye
What is mosaic?
[micro service sentinel] sentinelresourceaspect details
Yunxin small class | common cognitive misunderstandings in IM and audio and video
CKS CKA CKAD 将终端更改为远程桌面
Notes on problems - /usr/bin/perl is needed by mysql-server-5.1.73-1 glibc23.x86_ sixty-four
问题随记 —— /usr/bin/perl is needed by MySQL-server-5.1.73-1.glibc23.x86_64
【微服务|Sentinel】@SentinelResource详解

