当前位置:网站首页>深度学习 | 三个概念:Epoch, Batch, Iteration
深度学习 | 三个概念:Epoch, Batch, Iteration
2022-07-01 23:18:00 【日和公主】

- Epoch(时期):
当一个完整的数据集通过了神经网络一次并且返回了一次,这个过程称为一次>epoch。(也就是说,所有训练样本在神经网络中都 进行了一次正向传播 和一次反向传播 )
再通俗一点,一个Epoch就是将所有训练样本训练一次的过程。然而,当一个Epoch的样本(也就是所有的训练样本)数量可能太过庞大(对于计算机而言),就需要把它分成多个小块,也就是就是分成多个Batch 来进行训练。**
Batch(批 / 一批样本):
将整个训练样本分成若干个Batch。Batch_Size(批大小):
每批样本的大小。Iteration(一次迭代):
训练一个Batch就是一次Iteration(这个概念跟程序语言中的迭代器相似)。
- 为什么要使用多于一个epoch?
在神经网络中传递完整的数据集一次是不够的,而且我们需要将完整的数据集在同样的神经网络中传递多次。但请记住,我们使用的是有限的数据集,并且我们使用一个迭代过程即梯度下降来优化学习过程。如下图所示。因此仅仅更新一次或者说使用一个epoch是不够的。
随着epoch数量增加,神经网络中的权重的更新次数也在增加,曲线从欠拟合变得过拟合。
那么,问题来了,几个epoch才是合适的呢?
不幸的是,这个问题并没有正确的答案。对于不同的数据集,答案是不一样的。但是数据的多样性会影响合适的epoch的数量。比如,只有黑色的猫的数据集,以及有各种颜色的猫的数据集。
换算关系:

实际上,梯度下降的几种方式的根本区别就在于上面公式中的 Batch_Size 不同。

举个例子:
边栏推荐
- 2022年危险化学品经营单位安全管理人员考试题及在线模拟考试
- Who do you want to know when opening a stock account? Is it safe to open an account online?
- Anomaly-Transformer (ICLR 2022 Spotlight)复现过程及问题
- CKS CKA CKAD 将终端更改为远程桌面
- Zhao Fuquan: to ensure supply in the short term, we should build a safe, efficient and resilient supply chain in the long term
- 2022 R1 fast opening pressure vessel operation test questions and answers
- JS - use of arguments
- 证券开户选哪个证券公司比较好,哪个更安全
- 每日三题 6.30
- 2021 RoboCom 世界机器人开发者大赛-本科组初赛
猜你喜欢

Zhongang Mining: it has inherent advantages to develop the characteristic chemical industry dominated by fluorine chemical industry

Commemorate becoming the first dayus200 tripartite demo contributor

What category does the Internet of things application technology major belong to

Redis RDB快照

建模和影视后期有什么关联?

The online beggar function of Japanese shopping websites

纪念成为首个DAYUs200三方demo贡献者

“35岁,公司老总,月薪2万送外卖“:时代抛弃你,连声再见都没有

问题随记 —— file /usr/share/mysql/charsets/README from install of MySQL-server-5.1.73-1.glibc23.x86_64 c

Notes to problems - file /usr/share/mysql/charsets/readme from install of mysql-server-5.1.73-1 glibc23.x86_ 64 c
随机推荐
Airserver latest win64 bit personal screen projection software
Redis~02 cache: how to ensure data consistency in MySQL and redis when updating data?
每日三题 6.30
AirServer最新Win64位个人版投屏软件
2022-07-01:某公司年会上,大家要玩一食发奖金游戏,一共有n个员工, 每个员工都有建设积分和捣乱积分, 他们需要排成一队,在队伍最前面的一定是老板
Experience of practical learning of Silicon Valley products
Redis RDB快照
CADD course learning (3) -- target drug interaction
Redis 主从同步
Postgresql源码(58)元组拼接heap_form_tuple剖析
[micro service sentinel] sentinel integrates openfeign
物联网技术应用属于什么专业分类
What is the difference between memory leak and memory overflow?
Who do you want to know when opening a stock account? Is it safe to open an account online?
Linux基础 —— CentOS7 离线安装 MySQL
Redis AOF日志
【小程序】通过scroll-view组件实现左右【滑动】列表
flutter Unable to load asset: assets/images/888. png
云信小课堂 | IM及音视频中常见的认知误区
What category does the Internet of things application technology major belong to

