当前位置:网站首页>一维卷积神经网络_卷积神经网络的基础知识「建议收藏」
一维卷积神经网络_卷积神经网络的基础知识「建议收藏」
2022-08-02 14:00:00 【全栈程序员站长】
大家好,又见面了,我是你们的朋友全栈君。
一维卷积
一维卷积的输入是一个向量和一个卷积核,输出也是一个向量。
通常状况下,输入向量长度远大于卷积核的长度。
输出向量的长度取决于卷积操作的填充方案,等宽卷积的输出向量的和输入的向量长度相等。
卷积核的长度通常是奇数,这是为了对称设计的。
一个例子:
一维卷积示例
注意相乘的顺序是相反的,这是卷积的定义决定的。
输出长度是7,卷积核长度是3,输出的长度是7-3+1 = 5。
也就是说这里的卷积操作若输入长度是m,卷积核长度是n,则输出长度是m-n+1。
这样的卷积就叫窄卷积。
等宽卷积就是在输入两边各填充(n-1)/2,最终输出长度是m+(n-1)/2*2-n+1 = m。
填充元素可以是0,也可以和边缘一样,也可以是镜像。
如上图例子中的输入向量,
- 填充0后的输入为 012345670
- 重复边缘填充后为:112345677
- 镜像填充后为: 212345676
如下图,等宽卷积以及0填充,输入是1 2 3 4 5 6 7,输出是0 2 4 6 8 10 20
0填充-等宽卷积
换种风格说一下卷积步长的概念,如下图
图a是步长为2,不填充;图b是步长为1,填充0的等宽卷积。
卷积步长为2,可以看成是步长为1状况下的输出隔两个取一个,当然这也就是步长的概念。默认情况下步长是1。使用等宽卷积时,步长为2的一维卷积会使得输出长度是输入的一半。
二维卷积
无填充的二维卷积
如上图,二维的卷积,假设输入维度是mxm,卷积核大小是nxn,则无填充的输出大小是(m-n+1)x(m-n+1)。这和一维卷积是类似的。有填充的二维卷积如下图,
卷积的padding
卷积核的含义
不同卷积核的作用:锐化,边缘等
在信号处理中,某些卷积核也被称为滤波器。如用滤波器对数字图像进行处理,获得目标图像。上图中有三个不同的卷积核,具有不同的作用,如锐化,去燥,提取边缘等。卷积神经网络中学习到的参数主要就是这些滤波器(也就是卷积核),在训练开始时,这些卷积核的值可能是0,或者随机数。训练结束时,这些卷积核就称为学习到的特征。
卷积层
全连接层和卷积层
如上图,全连接层有35个连接,5*7=35个不同参数。卷积层只有5*3=15个连接,但只有3个参数。因为在图b中,相同颜色的连接权重是相等的。这就称为权重共享。而3<7就包含了局部连接的含义,也就是说上边的神经元不是和下边的每一个神经元都有连接,而是它只与附近的几个连接。
池化层
用几个二维的例子来说明,概念非常简单。如这是2×2最大池化,
max-pooling
这是2×2平均池化
average-pooling
但要注意的是这里默认步长是(2,2),也就是横竖两个方向上的步长都是2。
讲道理的话,2×2最大池化步长是1的结果应该是如下图这样的,但好像不是很常用。
步长为1的最大池化
池化层也有填充的概念,道理和卷积差不多。
激活层
激活层不改变特征图的大小。也就是说输入大小是mxm的,则输出也是mxm的。只是输入中每个元素x都变成f(x),f就是激活函数。激活函数是一个一元函数,如sigmoid函数是
Sigmoid激活函数
或者ReLU函数
ReLU激活函数
优化效果的途径
- 增加网络层数
- 增加神经元个数
- 使用dropout
- 使用不同的优化器 Adam,RMSprop等
- 增加训练轮数
- 批处理大小
- 正则化
参考文献
https://nndl.github.io/ 《神经网络与深度学习》
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/125311.html原文链接:https://javaforall.cn
边栏推荐
- rpm包的卸载与安装[通俗易懂]
- 【Tensorflow】AttributeError: module ‘keras.backend‘ has no attribute ‘tf‘
- 多个驻外使领馆发提醒 事关赴华出行、人身财产安全
- 苏州大学:从 PostgreSQL 到 TDengine
- Break the limit of file locks and use storage power to help enterprises grow new momentum
- CVE-2020-27986(Sonarqube敏感信息泄漏) 漏洞修复
- 你接受不了60%的暴跌,就没有资格获得6000%的涨幅 2021-05-27
- 线程安全问题及关键字synchronized,volatile
- 打破文件锁限制,以存储力量助力企业增长新动力
- uview 2.x版本 tabbar在uniapp小程序里头点击两次才能选中图标
猜你喜欢
此次519暴跌的几点感触 2021-05-21
[C language] Explicit array solution (1)
"Second Uncle" is popular, do you know the basic elements of "exploding" short videos from the media?
如何解决mysql服务无法启动1069
线程安全问题及关键字synchronized,volatile
MySQL - ERROR 1045 (28000): Access denied for user ‘root’@‘localhost’ (using password: YES)
第二届中国Rust开发者大会(RustChinaConf 2021~2022)线上大会正式开启报名
Summer training camp-week2 graph theory
shell脚本“画画”
Awesome!Alibaba interview reference guide (Songshan version) open source sharing, programmer interview must brush
随机推荐
第二讲 软件生命周期
SQL函数 USER
Configure zabbix auto-discovery and auto-registration.
C# 编译错误:Compiler Error CS1044
政策利空对行情没有长期影响,牛市仍将继续 2021-05-19
A number of embassies and consulates abroad have issued reminders about travel to China, personal and property safety
Flashback Technology of Oracle Database
eclipse连接数据库后插入数据报错null
机器学习——交叉验证法
监管再次重拳出击,后市如何?2021-05-22
【Tensorflow】AttributeError: '_TfDeviceCaptureOp' object has no attribute '_set_device_from_string'
Interviewer: Can you talk about optimistic locking and pessimistic locking?
二分查找 && 树
Enterprise Network Planning Based on Huawei eNSP
【Tensorflow】AttributeError: ‘_TfDeviceCaptureOp‘ object has no attribute ‘_set_device_from_string‘
供应磷脂-聚乙二醇-羧基,DSPE-PEG-COOH,DSPE-PEG-Acid,MW:5000
How to improve the originality of self-media creation and create popular works?
web测试和app测试的区别?
mysql的case when如何用
标量替换、栈上分配、同步消除