当前位置:网站首页>CNN 理解神经网络中卷积(大小,通道数,深度)
CNN 理解神经网络中卷积(大小,通道数,深度)
2022-08-02 04:37:00 【MarkerTm】
卷积
卷积核又称为卷积过滤器
卷积核的表示,使用三维张量 G ∈ R K ∗ K ∗ C G \in \mathbb{R}^{K*K*C} G∈RK∗K∗C,下图卷积核大小是331(K=3,C=1)
C是卷积核的通道数。
源图像的大小为 H ∗ W ∗ C H*W*C H∗W∗C,经过卷积核 G ∈ R K ∗ K ∗ C G \in \mathbb{R}^{K*K*C} G∈RK∗K∗C 进行卷积,得到新的特征图
新的特征图 H ˊ = H + 2 p − k s + 1 \acute{H}=\frac{H+2p-k}{s} + 1 Hˊ=sH+2p−k+1
p是填充,s 是步长
卷积完成后,通常会为每个特征图假上一个偏置
多通道卷积
通道:一个卷积核的通道数 必须 与它进行卷积的输入 相同。
如 32323 的图像,它的卷积核通道必须为3, 如卷积核大小可以为553
如下图就是 长方体的深度必须相同(左侧是源图像,中间是卷积核,右侧是卷积结果)
对于卷积运算,一个卷积核经过计算得到的一定是一个数字。
卷积核的深度:有几个卷积核深度就是几
池化
- 池化操作就是使用一个固定大小的滑窗在输入上滑动,每次将滑窗内的元素聚合为一个值作为输出。
- 根据聚合方式的不同,可以分为平均池化和最大值池化。
- 池化操作的主要目的是降维,以降低计算量,并在训练初期提供 一些平移不变性
- 对于多通道的输入,
池化是逐通道进行的
,因此不会改变输入的通道数 - 滑窗的大小k(假设滑窗的长和宽相等)和滑动的步长s都会影响最终的输出。
特殊的卷积
1*1卷积
通常1×1卷积有以下功能:
- 一是用于信息聚合,同时增加非线性,1×1卷积可以看作是对所有通道的信息进行线性加权,即信息聚合,同时,在卷积之后可以使用非线性激活,可以一定程度地增加模型的表达能力;
- 是用于通道数的变换,可以增加或者减少输出特征图的通道数。
边栏推荐
猜你喜欢
随机推荐
Minecraft 1.18.1、1.18.2模组开发 23.3D动画盔甲制作
Digicert EV证书签名后出现“证书对于请求用法无效”的解决方案
Scala basics [common method supplement, pattern matching]
Qt常见问题
lvm扩容(实战无废话)
The practice of alibaba, data synchronization component canal
300M级mysql数据库跨版本迁移流程
Camtasia 2022简体中文版屏幕录像和视频编辑软件
【疑问】最终推荐的loose pattern 如果依赖module 没有加载完毕,行为如何,是否报错
Visual SLAM Lecture Fourteen - Lecture 13 Practice: Designing a SLAM system (the most detailed code debugging and running steps)
线代005
如果有些字段不想进行序列化怎么办?
Qt FAQ
【数字IC手撕代码】Verilog固定优先级仲裁器|题目|原理|设计|仿真
MobaXsterm如何使用
分享|5G+智慧工业园区解决方案(附PDF)
递归实现排列型枚举(DAY 93)
acwing 最大数
力扣练习——48 找到小镇的法官
PDF file conversion format