当前位置:网站首页>卷积神经网络CNN
卷积神经网络CNN
2022-08-04 06:07:00 【一枚小可爱c】
为什么用CNN处理图像,而不是用全连接网络?
CNN或 ConvNet)是一种 具有局部连接、权重共享等特性的深层前馈神经网络.
卷积神经网络最早主要是用来处理图像信息,在用全连接前馈网络来处理图像时,会存在以下两个问题:
(1)参数太多:如果输入图像大小为100×100x3(即图像高度为100,宽 度为100以及RGB3个颜色通道),在全连接前馈网络中,第一个隐藏层的每个 神经元到输入层都有100 x 100 x3= 30000个互相独立的连接,每个连接都对 应一个权重参数,随着隐藏层神经元数量的增多,参数的规模也会急剧增加,这 会导致整个神经网络的训练效率非常低,也很容易出现过拟合.
(2)局部不变性特征:自然图像中的物体都具有局部不变性特征,比如尺 度缩放、平移、旋转等操作不影响其语义信息,而全连接前馈网络很难提取这些 局部不变性特征,一般需要进行数据增强来提高性能.
感受野
卷积神经网络是受生物学上感受野机制的启发而提出的,感受野(Receptive Field )机制主要是指听觉、视觉等神经系统中一些神经元的特性,即神经元 只接受其所支配的刺激区域内的信号,在视觉神经系统中,视觉皮层中的神经细 胞的输出依赖于视网膜上的光感受器,视网膜上的光感受器受刺激兴奋时,将神 经冲动信号传到视觉皮层,但不是所有视觉皮层中的神经元都会接受这些信号.一个神经元的感受野是指视网膜上的特定区域,只有这个区域内的刺激才能够 激活该神经元.
一维卷积
一维卷积经常用在信号处理中,用于计算信号的延迟累积.假设一个信号发生器每个时刻 t 产生一个信号 x ,其信息的衰减率为
,即在k-1个时间步长后,信息为原来的
倍,假设
,
,
,那么在时刻 t 收到的信号
为当前时刻产生的信息和以前时刻延迟信息的叠加,即
我们把w1,w2, 称为滤波器( Filter)或卷积核。
下图给出了两个滤波器的一维卷积示例,可以看出,两个滤波器分别提取 了输入序列的不同特征,滤波器w = [1/3, 1/3,1/3]可以检测信号序列中的低频这 信息,而滤波器w= [1,-2,1]可以检测信号序列中的高频信息.

二维卷积
卷积也经常用在图像处理中,因为图像为一个二维结构,所以需要将一维卷积进行扩展,给定一个图像
和一个滤波器
,一般U<<M,V<<N,其卷积为
为了简单起见,这里假设卷积的输出
的下标(i,j)从(U,V)开始.
下图是二维卷积的示例
卷积的变种
步长是指卷积核在滑动时的时间间隔,
零填充是指在输入向量两端进行补零,
(下图中 上面那个是步长为2的卷积示例,下面那个是输入两端各补一个零后的卷积示例)

空洞卷积
对于一个卷积层,如果希望增加输出单元的感受野,一般可以通过三种方式实现:
1)增加卷积核的大小;
2)增加层数,比如两层3x3的卷积可以近似一层 5×5卷积的效果;
3)在卷积之前进行汇聚操作,前两种方式会增加参数数量,而 第三种方式会丢失一些信息.
空洞卷积(Atrous Convolution )是一种不增加参数数量,同时增加输出单元感受野的一种方法,也称为膨胀卷积
空洞卷积通过给卷积插入“空洞”来变相地增加其大小,如果在卷积核的每两个元素之间插入D-1个空洞,卷积核的有效大小为
其中D称为膨胀率。当D=1时卷积核为普通的卷积核。
下图给出了空洞卷积的示例

边栏推荐
猜你喜欢

CAN协议详解-01

如何画好业务架构图。

什么是多态。

反射与枚举

千古第一文人苏轼的众CP

MAML principle explanation and code implementation

如何用matlab做高精度计算?【第一辑】

Provide 和 Inject 的用法

Hardware Knowledge: Introduction to RTMP and RTSP Traditional Streaming Protocols

Software: Recommend a domestic and very easy-to-use efficiency software uTools to everyone
随机推荐
两日总结八
专题讲座7 计算几何 学习心得
MMDeploy部署实战系列【第三章】:MMdeploy pytorch模型转换onnx,tensorrt
从零开始单相在线式不间断电源(UPS)(硬件)
likeshop外卖点餐系统开源啦100%开源无加密
HbuilderX 启动微信小程序 无法打开项目
【愚公系列】2022年07月 Go教学课程 027-深拷贝和浅拷贝
元素的增删克隆以及利用增删来显示数据到页面上
JVM工具之 JPS
SENet detailed explanation and Keras reproduction code
mysql:列类型之float、double
有趣的USB接口和颜色分类
Produce definition 产品与行业分析 勤于思考 善于总结 强于表达
国内外知名源码商城系统盘点
Triton部署mmdeploy导出的TensorRT模型失败篇
JVM 快速检测死锁
软件稳定性思考
带你了解一下PHP搭建的电商商城系统
VMD combined with ISSA to optimize LSSVM power prediction
数据特征预处理——缺失值的查看方式及处理