当前位置:网站首页>迁移学习冻结网络的方法:
迁移学习冻结网络的方法:
2022-08-01 10:59:00 【Wsyoneself】
说明:pytorch(1-3),TensorFlow(4)
fine tune就是冻结网络前面的层,然后训练最后一层
- 给优化器传入所有参数,但将要冻结层的参数的
requires_grad置为False:optimizer = optim.SGD(model.parameters(), lr=1e-2) # 传入的是所有的参数 for name, param in model.named_parameters(): if 要冻结的网络层的名字(即name的值): param.requires_grad = False - 优化器传入不冻结的网络层的参数:
optimizer = optim.SGD(model.不冻结的网络层的name.parameters(), lr=1e-2) # 优化器只传入fc2的参数 - 最优做法是:优化器只传入requires_grad=True的参数,占用的内存会更小一点,效率也会更高。代码及结合1和2
节省显存:不将不更新的参数传入
optimizer提升速度:将不更新的参数的
requires_grad设置为False,节省了计算这部分参数梯度的时间
- 代码如下:
#定义优化算子 optimizer = tf.train.AdamOptimizer( 1e-3) #选择待优化的参数 output_vars = tf.get_collection(tf.GraphKyes.TRAINABLE_VARIABLES, scope= 'outpt') train_step = optimizer.minimize(loss_score,var_list = output_vars)
把需要更新梯度的层放在tf.get_collection这个函数里面,不需要更新的不放进去。
边栏推荐
猜你喜欢

小程序毕设作品之微信美食菜谱小程序毕业设计成品(1)开发概要

大众碰到点评的一个字体反爬,落地技术也是绝了

.NET深入解析LINQ框架(三:LINQ优雅的前奏)

如何从完美的智能合约中窃取 1 亿美元

如何在IntellJ IDEA中批量修改文件换行符

Mini Program Graduation Works WeChat Food Recipes Mini Program Graduation Design Finished Products (3) Background Functions

Promise learning (2) An article takes you to quickly understand the common APIs in Promise

基于ArkUI eTS开发的坚果食谱(NutRecipes)

Solve vscode input! Unable to quickly generate skeletons (three methods for the new version of vscode to quickly generate skeletons)

一文说明白ECDSA spec256k1 spec256r1 EdDSA ed25519千丝万缕的关系
随机推荐
MySQL常用语句总结
深度学习 | MATLAB实现一维卷积神经网络convolution1dLayer参数设定
Mini Program Graduation Works WeChat Food Recipes Mini Program Graduation Design Finished Products (2) Mini Program Functions
【cartographer ros】十: 延时和误差分析
千万级乘客排队系统重构&压测方案——总结篇
回归预测 | MATLAB实现TPA-LSTM(时间注意力注意力机制长短期记忆神经网络)多输入单输出
URL.createObjectURL、URL.revokeObjectURL、Uint8Array、Blob使用详解
编码解码(btoa、encodeURIComponent、encodeURI、escape)
C#/VB.NET 将PPT或PPTX转换为图像
DBPack SQL Tracing 功能及数据加密功能详解
Qt 支持HEIC/HEIF格式图片
slice、splice、split傻傻分不清
Promise learning (4) The ultimate solution for asynchronous programming async + await: write asynchronous code in a synchronous way
JWT
【钛晨报】国家统计局:7月制造业PMI为49%;玖富旗下理财产品涉嫌欺诈,涉及390亿元;国内航线机票燃油附加费8月5日0时起下调
轮询和长轮询的区别
将本地项目推送到远程仓库
如何设计一个分布式 ID 发号器?
2022年7月31日--使用C#迈出第一步--使用 C# 创建具有约定、空格和注释的易读代码
CTFshow,命令执行:web37