当前位置:网站首页>tansig和logsig的差异,为什么BP喜欢用tansig
tansig和logsig的差异,为什么BP喜欢用tansig
2022-07-06 17:47:00 【老饼讲解-BP神经网络】
原创文章,转载请说明来自《老饼讲解神经网络》:bp.bbbdata.com
关于《老饼讲解神经网络》:
本网结构化讲解神经网络的知识,原理和代码。
重现matlab神经网络工具箱的算法,是学习神经网络的好助手。
目录
为什么BP神经网络一般使用tansig,相信这是很多人的困惑。
我们不妨来分析tansig和logsig的属性、特性、导数等方面,
试图找出为什么倾向使用tansig的原因.
01. 公式分析
公式
tansig和logsig公式如下:
分析
从两者的公式来看,两者并无多大差异,
tansig只是在logsig的基础上进行拉伸平移操作。
两者都依赖指数计算,计算复杂度上无差异。
因此,公式层面上,并不构成倾向选择tansig的理由。
02. 特性分析
特性
当tansig自变量为一维时,它是一条S形曲线。
● 它的取值区间为 (-1,1)
● tansig非线性部分主要集中在【-1.7,1.7】之间,
● 在【-1.7,1.7】外,tansig逐渐趋向饱和。
当logsig自变量为一维时,它是一条S形曲线。
● 它的取值区间为 (0,1)
● logsig非线性部分主要集中在【-1.7,1.7】之间,
● 在【-1.7,1.7】外,logsig逐渐趋向饱和。
分析
从特性的对比,我们并没有发现两者有质的区别,
因为tansig就是将logsig进行拉伸,平移到【-1,1】的取值区间。
在特性上并没有发现太大的区别,
唯一的区别是,两者取值范围不一样。
03. 导数分析
导数
tansig的导数为:
logsig的导数为:
分析
通过导数的对比,
它们两者都可以用自身的值求得导数值,
计算量也一致,
因此,导数上tansig也没有更大的优势,
并不构成倾向使用tansig的原因
笔者的看法
通过以上方方面面的分析,我们几乎看不到tansig比logsig的优势好在哪。
那为什么要用tansig呢?
笔者的看法是,
一、统一输入范围。
二、充分利用激活函数活跃区间
我们知道,上一层的输入就是下一层的输出,
而tansig和logsig的活跃区间在【-1.7,1.7】之间,
在输入层,我们无疑把输入归一化到【-1,1】,
对利用第一个隐层的激活函数活跃区间更加有效。
而采用tansig,则在多隐层的情况下,
每层的输出,即下层的输入仍然是【-1,1】
这样每层的输入范围都是统一的,
且都是有效利用激活函数活跃区间的。
统一性是很有好处的,
至少在理论研究上,可以带来很多便利,
不然还要分别讨论输入层和隐层。
以上是笔者的看法,由于没有文献考证,仅供参考。
边栏推荐
- The MySQL database in Alibaba cloud was attacked, and finally the data was found
- C语言实例_5
- 405 method not allowed appears when the third party jumps to the website
- [Niuke] b-complete square
- AI automatically generates annotation documents from code
- 从底层结构开始学习FPGA----FIFO IP的定制与测试
- Taro applet enables wxml code compression
- Boot - Prometheus push gateway use
- 黑马笔记---异常处理
- UI control telerik UI for WinForms new theme - vs2022 heuristic theme
猜你喜欢

1123. The nearest common ancestor of the deepest leaf node

云呐|工单管理办法,如何开展工单管理
![[Niuke] b-complete square](/img/bd/0812b4fb1c4f6217ad5a0f3f3b8d5e.png)
[Niuke] b-complete square

Do you understand this patch of the interface control devaxpress WinForms skin editor?

Anfulai embedded weekly report no. 272: 2022.06.27--2022.07.03

How to manage distributed teams?

从底层结构开始学习FPGA----FIFO IP的定制与测试

Segmenttree

免费白嫖的图床对比

子网划分、构造超网 典型题
随机推荐
Taro2.* 小程序配置分享微信朋友圈
Lldp compatible CDP function configuration
The difference between spin and sleep
C语言实例_3
力扣1037. 有效的回旋镖
Transformation transformation operator
7.6模拟赛总结
[100 cases of JVM tuning practice] 05 - Method area tuning practice (Part 2)
Oracle:CDB限制PDB资源实战
黑马笔记---异常处理
接收用户输入,身高BMI体重指数检测小业务入门案例
The MySQL database in Alibaba cloud was attacked, and finally the data was found
Google发布安全更新,修复Chrome中已被利用的0 day
阿里云中mysql数据库被攻击了,最终数据找回来了
Gnet: notes on the use of a lightweight and high-performance go network framework
Niuke cold training camp 6B (Freund has no green name level)
交叉验证如何防止过拟合
Docker method to install MySQL
AI automatically generates annotation documents from code
Go zero micro service practical series (IX. ultimate optimization of seckill performance)






