当前位置:网站首页>yolov5改进(一) 添加注意力集中机制
yolov5改进(一) 添加注意力集中机制
2022-08-02 14:02:00 【weixin_50862344】
(1)自注意力集中机制
我想学的是注意力机制但是好像一开始跑歪了,学了自注意力机制。该说不说,讲的挺不错的。
台大李宏毅自注意力机制
input:vector set
muti-head:可能会有不同的联系
在图片中的应用:
将一个像素上的rgb看作一个vector
模型上的应用包括:①self-attention GAN
②DETR
CNN和Self-attention的对比:
CNN只考虑receptive field,Self-attention考虑全局。因此可以将cnn看作是小范围的(简化版)Self-attention
②小资料量时CNN占优,大量时Self-attention会超过CNN
对于理由李宏毅的说法是:Self-attention弹性大,CNN弹性小
RNN&SA
①SA平行化,RNN不可以平行话
②数据记忆量
(2)注意力机制
接下来就是正儿八经的注意力机制(Attention)
先上资料先上资料
pytorch应用的:
先上资料
其实csdn上是有网课的但是贫困小孩最近真是没钱花,但是我们还是可以参照他的架构进行学习
1.了解注意力机制
根据注意力作用的不同维度将注意力分成了四种基本类型:通道注意力、空间注意力、时间注意力和分支注意力
,以及两种组合注意力:通道-空间注意力和空间-时间注意力
。
spatial:空间
temporal:时间
画出三维坐标轴大概就长下面这样:
2.正儿八经进入注意力模块
遇到问题先看看b导的课
本小白遇到的不会的函数,例子更好理解一点
1)cat:拼接
2)view:改变cols和rows的排布
3)torch.mean通道平均值&torch.max通道最大值
torch.nn.AdaptiveAvgPool2d(output_size
):提供2维的自适应平均池化操作 对于任何输入大小的输入,可以将输出尺寸指定为H*W
对比于全局平均池化可以理解成切片方式不一样!!!
注意力机制是一个即插即用的模块,理论上可以放在任何一个特征层后面。
由于放置在主干会导致网络的预训练权重无法使用
,将注意力机制应用加强特征提取网络上
怎么有人连实战都写好了?还写得那么好?yolov5添加注意力集中机制这份是对应正儿八经从官网上下载下来的。
实际使用时出现什么问题我再补充吧!!感觉b导已经讲的很好了
1.如果是添加一个独立的注意力机制层,可能会影响后面层数(从backbone接受的特征图的层的层数就变了)
2.一般不添加到主干提取网络避免影响预训练权重
边栏推荐
- The future of financial services will never stop, and the bull market will continue 2021-05-28
- Flask框架深入一
- els 长条碰撞变形判断
- 网页设计(新手入门)[通俗易懂]
- MySQL数据库设计规范
- Linux:CentOS 7 安装MySQL5.7
- MySQL数据库语法格式
- 未来的金融服务永远不会停歇,牛市仍将继续 2021-05-28
- Audio processing: floating point data stream to PCM file
- els strip collision deformation judgment
猜你喜欢
第十五单元 分页、过滤
第十一单元 序列化器
海明校验码纠错设计原理
The most complete ever!A collection of 47 common terms of "digital transformation", read it in seconds~
鲲鹏devkit & boostkit
Flask框架的搭建及入门
shell脚本“画画”
动态刷新日志级别
CVE-2020-27986 (Sonarqube sensitive information leak) vulnerability fix
Image retrieval method based on deep learning!
随机推荐
Audio processing: floating point data stream to PCM file
Flutter 实现光影变换的立体旋转效果
Object detection scene SSD-Mobilenetv1-FPN
【Tensorflow】AttributeError: ‘_TfDeviceCaptureOp‘ object has no attribute ‘_set_device_from_string‘
WiFi Association & Omnipeek Packet Capture Analysis
MySQL数据库语法格式
stack && queue
Mysql's case the when you how to use
网络安全第四次作业
els strip collision deformation judgment
保姆级教程:写出自己的移动应用和小程序(篇三)
VMM是什么?_兮是什么意思
Sentinel源码(二)入口方法分析
Swagger 的使用
Flask上下文,蓝图和Flask-RESTful
世界上最大的开源基金会 Apache 是如何运作的?
rhce第三天作业
IDEA打包jar包
A number of embassies and consulates abroad have issued reminders about travel to China, personal and property safety
drf序列化器-Serializer