当前位置:网站首页>(Note)优化器Adam的学习率设置
(Note)优化器Adam的学习率设置
2022-07-23 20:26:00 【[email protected]】
记录一下知乎看到的问题:Adam的学习率设置
常用的神经网络优化器Adam的自适应学习率并不是真正意义上的自适应。
从统计的角度看,Adam的自适应原理也是根据统计对梯度进行修正,但依然离不开前面设置的学习率。如果学习率设置的过大,则会导致模型发散,造成收敛较慢或陷入局部最小值点,因为过大的学习率会在优化过程中跳过最优解或次优解。按照经验,一开始并不会设置过大的学习率,而是需要根据不同的任务进行选择。通常默认的学习率设置为1e-3。
同时神经网络的损失函数基本不是凸函数,而梯度下降法这些优化方法主要针对的是凸函数,所以在优化方面深度学习的学习率会设置的比传统机器学习小得多。如果学习率设置过高,Adam优化器只会矫正梯度,而不会影响设置的初始学习率,这时模型的Loss会出现较大的波动,这代表模型没有办法收敛。
- 相对于SGD来说,Adam的lr更加统一。
即不同的task可以用一个相同的lr去调节,通用性更强;
- learning rate decay很重要。
即使按照paper里面的原理,lr可自动学习已无需调整,但是下降一次之后效能依然有大幅提升;
- lr的decay影响远远不如SGD。
一般来说SGD在CV问题有两次lr下降,每一次的提升都较为可观,但是Adam在第一次的之后后续的影响微乎其微。这一点甚至在multi-scale的长周期训练中,Adam还不如SGD;
Reference:
https://www.zhihu.com/question/387050717
版权声明
本文为[[email protected]]所创,转载请带上原文链接,感谢
https://blog.csdn.net/qq_40728667/article/details/125921684
边栏推荐
- If the order is not paid within 30 minutes, it will be automatically cancelled
- 平安证券低佣金开户链接安全吗,怎么办理低佣金
- 一文读懂研发效能洞察的五大流动指标
- 我,AI博士生,在线众筹研究主题
- el-upload实现上传文件预览
- Task03 | return
- The instructions on Microsoft website about opening or closing smartscreen in edge browser are incorrect
- 解决1秒钟内,用户快速点击,重复请求的问题
- 一文教你Mysql安装
- 使用高德地图JS API 2.0加载起点终点路径轨迹
猜你喜欢

Discussion on the usage of scanf () and getchar ()

138-查询案例-涉及知识点:forEach遍历&computed计算属性&v-for循环

第十二天:续第十一天(BGP相关知识)

关于网段CIDR的笔记

Improving Performance with Explicit Rendering(通过显式渲染提高性能)

Go to the square for dinner

深度学习-NLP经典论文、课程、论文等资源整理分享

去广场吃饭

第3章业务功能开发(创建线索)

Preprocessing tropomi (sentinel 5p) data with envi
随机推荐
MySQL's past and present life, Hello, MySQL
实践数据湖iceberg 第三十七课 kakfa写入iceberg的 icberg表的 enfource ,not enfource测试
EXCEL的密码相关
2022.7.11mySQL作业
去广场吃饭
-2021最新对比学习(Contrastive Learning)相关必读论文整理分享
jsp+ssm+mysql实现的租车车辆管理系统汽车租赁
138-查询案例-涉及知识点:forEach遍历&computed计算属性&v-for循环
121. 买卖股票的最佳时机
[Q]重定向nmcli的手册到txt文本出错
A beautiful road
支付产品及其使用场景
TROPOMI(哨兵5P)数据介绍及下载方法
OpenLayers实例-Accessible Map-可访问的地图
链表——203. 移除链表元素
13 ways of Excel automation to avoid repeating tasks in Microsoft Excel
2022DASCTF MAY
从ACL 2022 Onsite经历看NLP热点
Lyscripttools extended script module
Excel自动化之13种方法来避免在 Microsoft Excel 中重复任务