当前位置:网站首页>softmax函数详解
softmax函数详解
2022-07-31 05:15:00 【龙虾在剥我的壳】
softmax函数
1.softmax函数理解
我们知道Logistic回归只能进行二分类,因为它的随机变量的取值只能是0或者1,那么如果我们面对多分类问题怎么
办?比如要将一封新收到的邮件分为垃圾邮件,个人邮件,还是工作邮件;根据病人的病情预测病人属于哪种病;那么今天要说的softmax回归能解决这类分类的问题。
softmax它将多个神经元的输出,映射到(0,1)区间内,其输出向量其实就是概率,为样本在某个类的概率
如下图只需先了解左边输入,右边输出概率就行了

softmax直白来说就是将原来输出是3,1,-3通过softmax函数一作用,就映射成为(0,1)的值,而这些值的累和为1(满足概率的性质),那么我们就可以将它理解成概率,在最后选取输出结点的时候,我们就可以选取概率最大(也就是值对应最大的)结点,作为我们的预测目标!
假设我们有一个数组,V,Vi表示V中的第i个元素,那么这个元素的softmax值就是
2.求导

我们能得到下面公式:
z4 = w41o1+w42o2+w43*o3
z5 = w51o1+w52o2+w53*o3
z6 = w61o1+w62o2+w63*o3
z4,z5,z6分别代表结点4,5,6的输出,01,02,03代表是结点1,2,3往后传的输入.
那么我们可以经过softmax函数得到
3.softmax损失函数
根据求梯度,然后利用梯度下降方法更新梯度!
要使用梯度下降,肯定需要一个损失函数,这里我们使用交叉熵(称它为损失函数)作为我们的损失函数,为什么使用交叉熵损失函数,不是这篇文章重点(大家只要知道用这个就可以了)
公式
y:代表真实值
a:代表softmax求出的值
i:代表的是输出结点的标号!在上面例子,i就可以取值为4,5,6三个结点(当然我这里只是为了简单,真实应用中可能有很多结点)
由于 log 运算符不会影响函数的单调性,我们对 Si 进行 log 操作:
我们希望 Si 越大越好,即正确类别对应的相对概率越大越好,那么就可以对 Si 前面加个负号,来表示损失函数:

对上式进一步处理,把指数约去:
这样,Softmax 的损失函数就转换成了简单的形式。
4.softmax实际应用
使用 Softmax 线性分类器,对 图片集进行分类。
总结
其实说白了softmax函数就是处理多分类问题的。在左边输入值,出来的是概率。重头戏就是中间这个转换的过程
1.交叉熵(作为损失函数)
2.求导
边栏推荐
- 腾讯云GPU桌面服务器驱动安装
- Principle analysis of famous website msdn.itellyou.cn
- 纯shell实现文本替换
- Tencent Cloud Lightweight Server deletes all firewall rules
- 著名网站msdn.itellyou.cn原理分析
- UiBot存在已打开的MicrosoftEdge浏览器,无法执行安装
- powershell statistics folder size
- Powershell中UTF-8环境中文乱码解决办法
- 通信原理——纠错编码 | 汉明码(海明码)手算详解
- understand js operators
猜你喜欢

VS2017 connects to MYSQL
![[Cloud native] Ribbon is no longer used at the bottom layer of OpenFeign starting from the 2020.0.X version](/img/7e/1d27e3f1856ab8c6cbfc5221c717bb.png)
[Cloud native] Ribbon is no longer used at the bottom layer of OpenFeign starting from the 2020.0.X version

MySQL compressed package installation, fool teaching

微信小程序源码获取与反编译方式

【云原生】微服务Nacos的简单介绍与使用

【云原生】SQL(及存储过程)跑得太慢怎么办?

qt:cannot open C:\Users\某某某\AppData\Local\Temp\main.obj.15576.16.jom for write

MySQL错误-this is incompatible with sql_mode=only_full_group_by完美解决方案

Take you to understand the MySQL isolation level, what happens when two transactions operate on the same row of data at the same time?

Xiaomi mobile phone SMS location service activation failed
随机推荐
Xiaomi mobile phone SMS location service activation failed
podspec自动化升级脚本
MySQL错误-this is incompatible with sql_mode=only_full_group_by完美解决方案
Global scope and function scope in js
cocos2d-x-3.2 Physics
Filter out egrep itself when using ps | egrep
Tencent Cloud Lightweight Server deletes all firewall rules
flutter arr dependencies
TransactionTemplate 事务编程式写法
cocoscreator3.5.2打包微信小游戏发布到QQ小游戏修改
【云原生】开源数据分析 SPL 轻松应对 T+0
This in js points to the prototype object
Build vulhub vulnerability shooting range on kali
Year-end summary - the years are quiet~
计网 Packet Tracer仿真 | 简单易懂集线器和交换机对比(理论+仿真)
[swagger close] The production environment closes the swagger method
数据库 | SQL查询进阶语法
QT VS中双击ui文件无法打开的问题
this points to the problem
js中的全局作用域与函数作用域