当前位置:网站首页>研究生新生培训第三周:ResNet+ResNeXt
研究生新生培训第三周:ResNet+ResNeXt
2022-07-29 05:21:00 【Fanshoo】
PART 1:视频学习
一、ResNet
1.ResNet网络创新点
2.ResNet结局的问题

3.ResNet-34网络结构
4.ResNet网络结构

5.Residual结构

分别在层数较低的ResNet和深层ResNet使用的网络结构
Residual计算原理:

6.网络训练结果
在普通神经网络,越深层的网络反而表现出的效果越差

ResNet:

二、Batch Nomalization

BN的作用为够加速网络的收敛并提升准确率,目的是使每一个batch的feature map满足均值为0,方差为1的分布规律
三、迁移学习
1.迁移学习的优势
2.常见的迁移学习方式

四、ResNeXt
1.进行分组卷积

最主要的不同就是在ResNet的基础上加入了分组卷积,进一步减少了参数量
2.网络结构

卷积block结构:

PART 2:代码实验
一、实验过程
1.引入模块

2.超参数设定

3.数据预处理

4.载入数据

5.实例化模型

6.训练,测试
训练:

测试:

学习率调整:

训练:

输出csv文件:

二、实验问题
在做神经网络训练的时候主要使用在本机搭建的pytorch平台,由于电脑显卡功能不理想,batch_size和epoch等参数都不能设置过大,大数据集和大参数模型训练常常爆显存。

实验效果不理想,由于网络问题一直没使用colab,在下一周着重解决一下实验平台问题,重新训练ResNet网络,获得比较好的实验结果。
PART 3:问题回答
1.Residual learning
解决了深层网络中梯度爆炸/梯度消失和精度下降(训练集中)的问题,加深了神经网络深度。
2.Batch Normalization
BN的作用为够加速网络的收敛并提升准确率,目的是使每一个batch的feature map满足均值为0,方差为1的分布规律 .
3.为什么分组卷积可以提升准确率?即然分组卷积可以提升准确率,同时还能降低计算量,分数数量尽量多不行吗?
(1)减少参数量,计算量,可以训练更深层的网络
(2)尽可能多分组为DW卷积,容易割裂各个特征图中的特征关系,导致效果不好
(3)应根据模型和计算量选择合适的卷积方式和参数设定
边栏推荐
- Are you sure you know the interaction problem of activity?
- Android Studio 实现登录注册-源代码 (连接MySql数据库)
- 【数据库】数据库课程设计一一疫苗接种数据库
- C # judge whether the user accesses by mobile phone or computer
- [competition website] collect machine learning / deep learning competition website (continuously updated)
- Training log 6 of the project "construction of Shandong University mobile Internet development technology teaching website"
- These process knowledge you must know
- D3.JS 纵向关系图(加箭头,连接线文字描述)
- [CV] what are the specific numbers of convolution kernels (filters) 3*3, 5*5, 7*7 and 11*11?
- 30 knowledge points that must be mastered in quantitative development [what is individual data]?
猜你喜欢

Reporting Services- Web Service

通过简单的脚本在Linux环境实现Mysql数据库的定时备份(Mysqldump命令备份)

Ribbon learning notes 1

【网络设计】ConvNeXt:A ConvNet for the 2020s

Flink, the mainstream real-time stream processing computing framework, is the first experience.

PHP write a diaper to buy the lowest price in the whole network

【Attention】Visual Attention Network

Technology that deeply understands the principle of MMAP and makes big manufacturers love it

Machine learning makes character recognition easier: kotlin+mvvm+ Huawei ml Kit

anaconda中移除旧环境、增加新环境、查看环境、安装库、清理缓存等操作命令
随机推荐
微信小程序源码获取(附工具的下载)
30 knowledge points that must be mastered in quantitative development [what is level-2 data]
Markdown语法
DataX installation
ANR优化:导致 OOM 崩溃及相对应的解决方案
File permissions of day02 operation
Realize the scheduled backup of MySQL database in Linux environment through simple script (mysqldump command backup)
Research on the implementation principle of reentrantlock in concurrent programming learning notes
【DL】关于tensor(张量)的介绍和理解
手撕ORM 框架(泛型+注解+反射)
简单聊聊 PendingIntent 与 Intent 的区别
[ml] PMML of machine learning model -- Overview
Centos7 silently installs Oracle
Flutter 绘制技巧探索:一起画箭头(技巧拓展)
Training log 7 of the project "construction of Shandong University mobile Internet development technology teaching website"
Spring, summer, autumn and winter with Miss Zhang (3)
Exploration of flutter drawing skills: draw arrows together (skill development)
mysql插入百万数据(使用函数和存储过程)
day02 作业之文件权限
【Clustrmaps】访客统计