当前位置:网站首页>超参数优化-摘抄
超参数优化-摘抄
2022-07-31 05:16:00 【Young_win】
超参数优化简介
构建深度学习模型时,你必须确定:应该堆叠多少层?每层应该包含多少个单元或过滤器?激活应该使用relu还是其他函数?在某一层之后是否应该使用BatchNormalization?应该使用多大的dropout比率?这些在架构层面的参数叫超参数(hyperparameter)。相对应地,模型参数是可以通过反向传播进行训练的。
调节超参数的办法,一般是“制定一个原则,系统性地自动探索可能的决策空间”。搜索架构空间,并根据经验找到性能最佳的架构。超参数优化的过程:
1.)选择一组超参数(自动选择);
2.)构建相应的模型;
3.)将模型在训练数据上拟合,并衡量其在验证数据上的最终性能;
4.)选择要尝试的下一组超参数(自动选择);
5.)重复上述过程;
6.)最后,衡量模型在测试数据上的性能。
这个过程的关键在于,给定许多组超参数,使用验证性能的历史来选择下一组需要评估的超参数的算法,这类算法有:贝叶斯优化、遗传算法、简单随机搜索等。
超参数优化v.s.模型参数优化
训练模型权重相对简单,即在小批量数据上计算损失函数,然后用反向传播算法让权重向正确方向一定。
超参数优化:(1.)计算反馈信号-这组超参数在这个任务上是否得到了一个高性能的模型-的计算代价可能非常高,它需要在数据集上创建一个新模型 并从头开始训练;(2.)超参数空间通常由许多离散的决定组成,因而既不是连续的 也不是可微的。因此,通常不能在超参数空间中做梯度下降。相反,你必须依赖不使用梯度的优化方法,而这些方法的效率比梯度下降要低很多。
通常,随机搜索-随机选择需要评估的超参数,并重复这一过程-是最好的解决方案。a.)Python工具库Hyperopt是一个超参数优化工具,内部使用Parzen估计其的树来预测哪组超参数可能会得到好的结果。b.)Hyperas库是将Hyperopt与Keras模型集成在一起。
在进行大规模超参数字段优化时,有一个重要的问题需要牢记,即验证集过拟合。因为你是使用验证数据 计算出一个信号,然后根据这个信号 更新超参数,所以你实际上是在验证数据上 训练超参数,很快会对验证数据过拟合。
边栏推荐
- Pytorch学习笔记09——多分类问题
- qt:cannot open C:\Users\某某某\AppData\Local\Temp\main.obj.15576.16.jom for write
- configure:error no SDL library found
- Pytorch学习笔记7——处理多维特征的输入
- Filter out egrep itself when using ps | egrep
- Pytorch常用函数
- WeChat applet source code acquisition and decompilation method
- MYSQL transaction and lock problem handling
- flutter arr 依赖
- Podspec verification dependency error problem pod lib lint , need to specify the source
猜你喜欢
随机推荐
网页截图与反向代理
kotlin 插件更新到1.3.21
Xiaomi mobile phone SMS location service activation failed
Podspec automatic upgrade script
朴素贝叶斯文本分类(代码实现)
Principle analysis of famous website msdn.itellyou.cn
2021美赛C题M奖思路
QT VS中双击ui文件无法打开的问题
The browser looks for events bound or listened to by js
我的训练函数模板(动态修改学习率、参数初始化、优化器选择)
jenkins +miniprogram-ci upload WeChat applet with one click
[swagger close] The production environment closes the swagger method
CNN的一点理解
深度学习知识点杂谈
ERROR Error: No module factory availabl at Object.PROJECT_CONFIG_JSON_NOT_VALID_OR_NOT_EXIST ‘Error
理解js运算符
flutter 混合开发 module 依赖
MYSQL事务与锁问题处理
计算图像数据集均值和方差
quick-3.6源码修改纪录