当前位置:网站首页>多伦多大学博士论文 | 深度学习中的训练效率和鲁棒性
多伦多大学博士论文 | 深度学习中的训练效率和鲁棒性
2022-06-27 17:54:00 【智源社区】

论文链接:https://arxiv.org/abs/2112.01423
度学习模型训练效率低;它们通过多次处理数以百万计的训练数据来学习,并且需要强大的计算资源来同时并行处理大量数据,而不是顺序处理。深度学习模型也存在非预期失效模式;他们可能会被愚弄,做出错误的预测。
在本文中,我们研究了提高深度学习模型训练效率和鲁棒性的方法。在学习视觉语义嵌入的背景下,我们发现优先学习更多的信息训练数据可以提高收敛速度和提高测试数据的泛化性能。我们形式化了一个简单的技巧,称为硬负挖掘,作为学习目标函数的修改,没有计算开销。接下来,我们在深度学习的通用优化方法中寻求优化速度的改进。我们展示了对训练数据采样的冗余感知修改提高了训练速度,并开发了一种检测训练信号多样性的有效方法,即梯度聚类。最后,我们研究了深度学习中的对抗鲁棒性,以及在不使用额外数据训练的情况下实现最大对抗鲁棒性的方法。对于线性模型,我们证明保证最大的鲁棒性实现只有通过适当的选择优化器,正则化,或架构。
边栏推荐
- 基于STM32F103ZET6库函数蜂鸣器实验
- 什么是 ICMP ?ping和ICMP之间有啥关系?
- 谈谈线程安全
- 实施MES管理系统前,要对哪些问题进行评估
- Solution of adding st-link to Huada MCU Keil
- 通过 G1 GC Log 重新认识 G1 垃圾回收器
- 《第五项修炼》(The Fifth Discipline):学习型组织的艺术与实践
- Character interception triplets of data warehouse: substrb, substr, substring
- NVIDIA Clara-AGX-Developer-Kit installation
- 判断一个变量是数组还是对象?
猜你喜欢

DFS and BFS simple principle

《第五项修炼》(The Fifth Discipline):学习型组织的艺术与实践

2022年第一季度消费金融APP用户洞察——总数达4479万人

What is ICMP? What is the relationship between Ping and ICMP?

Cloud native database: the outlet of the database, you can also take off

Blink SQL built in functions

VS code 运行yarn run dev 报yarn : 无法加载文件XXX的问题

Vs code runs "yarn run dev" and reports "yarn": the file XXX cannot be loaded

全面解析零知识证明:消解扩容难题 重新定义「隐私安全」

A simple calculation method of vanishing point
随机推荐
Core dynamic Lianke rushes to the scientific innovation board: with an annual revenue of 170million yuan, Beifang Electronics Institute and Zhongcheng venture capital are shareholders
通过 G1 GC Log 重新认识 G1 垃圾回收器
图扑数字孪生智慧能源一体化管控平台
Running lantern experiment based on stm32f103zet6 library function
shell脚本常用命令(三)
Market status and development prospect forecast of global handheld ventilator industry in 2022
One to one relationship
脉脉热帖:为啥大厂都热衷于造轮子?
Current market situation and development prospect forecast of global 3,3 ', 4,4' - biphenyltetracarboxylic dianhydride industry in 2022
Introduction to deep learning and neural networks
Memoirs of actual combat: breaking the border from webshell
Market status and development prospect forecast of the global shuttleless air jet loom industry in 2022
流程判断-三目运算-for循环
一种朴素的消失点计算方法
Buzzer experiment based on stm32f103zet6 library function
xctf攻防世界 MISC薪手进阶区
Market status and development prospect forecast of global active quality control air sampler industry in 2022
Online text batch inversion by line tool
Character interception triplets of data warehouse: substrb, substr, substring
Gartner聚焦中国低代码发展 UniPro如何践行“差异化”