当前位置:网站首页>softmax函数详解
softmax函数详解
2022-07-31 05:15:00 【龙虾在剥我的壳】
softmax函数
1.softmax函数理解
我们知道Logistic回归只能进行二分类,因为它的随机变量的取值只能是0或者1,那么如果我们面对多分类问题怎么
办?比如要将一封新收到的邮件分为垃圾邮件,个人邮件,还是工作邮件;根据病人的病情预测病人属于哪种病;那么今天要说的softmax回归能解决这类分类的问题。
softmax它将多个神经元的输出,映射到(0,1)区间内,其输出向量其实就是概率,为样本在某个类的概率
如下图只需先了解左边输入,右边输出概率就行了

softmax直白来说就是将原来输出是3,1,-3通过softmax函数一作用,就映射成为(0,1)的值,而这些值的累和为1(满足概率的性质),那么我们就可以将它理解成概率,在最后选取输出结点的时候,我们就可以选取概率最大(也就是值对应最大的)结点,作为我们的预测目标!
假设我们有一个数组,V,Vi表示V中的第i个元素,那么这个元素的softmax值就是
2.求导

我们能得到下面公式:
z4 = w41o1+w42o2+w43*o3
z5 = w51o1+w52o2+w53*o3
z6 = w61o1+w62o2+w63*o3
z4,z5,z6分别代表结点4,5,6的输出,01,02,03代表是结点1,2,3往后传的输入.
那么我们可以经过softmax函数得到
3.softmax损失函数
根据求梯度,然后利用梯度下降方法更新梯度!
要使用梯度下降,肯定需要一个损失函数,这里我们使用交叉熵(称它为损失函数)作为我们的损失函数,为什么使用交叉熵损失函数,不是这篇文章重点(大家只要知道用这个就可以了)
公式
y:代表真实值
a:代表softmax求出的值
i:代表的是输出结点的标号!在上面例子,i就可以取值为4,5,6三个结点(当然我这里只是为了简单,真实应用中可能有很多结点)
由于 log 运算符不会影响函数的单调性,我们对 Si 进行 log 操作:
我们希望 Si 越大越好,即正确类别对应的相对概率越大越好,那么就可以对 Si 前面加个负号,来表示损失函数:

对上式进一步处理,把指数约去:
这样,Softmax 的损失函数就转换成了简单的形式。
4.softmax实际应用
使用 Softmax 线性分类器,对 图片集进行分类。
总结
其实说白了softmax函数就是处理多分类问题的。在左边输入值,出来的是概率。重头戏就是中间这个转换的过程
1.交叉熵(作为损失函数)
2.求导
边栏推荐
- Year-end summary - the years are quiet~
- cocoscreator 显示刘海内容
- Xiaobai learns reptiles - introduction to reptiles
- "limit" query in Oracle database
- 2021美赛C题M奖思路
- On the side of Ali, tell me what are the application scenarios of message middleware you know?
- [uiautomation] Get WeChat friend list (stored in txt)
- quick-3.5 ActionTimeline的setLastFrameCallFunc调用会崩溃问题
- For penetration testing methods where the output point is a timestamp (take Oracle database as an example)
- ERROR Error: No module factory availabl at Object.PROJECT_CONFIG_JSON_NOT_VALID_OR_NOT_EXIST ‘Error
猜你喜欢

MySQL高级SQL语句(二)

This in js points to the prototype object

Powershell中UTF-8环境中文乱码解决办法

Principle analysis of famous website msdn.itellyou.cn

著名网站msdn.itellyou.cn原理分析

【云原生】开源数据分析 SPL 轻松应对 T+0

对js的数组的理解

The server time zone value ‘й‘ is unrecognized or represents more than one time zone

DeFi Token in the project management

GUCCI, LV and other luxury giant universe how to layout yuan, other brands should keep up with?
随机推荐
为什么bash中的read要配合while才能读取/dev/stdin的内容
工件SSMwar exploded 部署工件时出错。请参阅服务器日志了解详细信息
quick-3.5 ActionTimeline的setLastFrameCallFunc调用会崩溃问题
unicloud 发布后小程序提示连接本地调试服务失败,请检查客户端是否和主机在同一局域网下
unicloud 云开发记录
Sqlite column A data is copied to column B
浅谈对分布式模式下CAP的理解
MYSQL事务与锁问题处理
浏览器查找js绑定或者监听的事件
Tencent Cloud GPU Desktop Server Driver Installation
使用ps | egrep时过滤排除掉egrep自身
cocos create EditBox 输入文字被刘海屏遮挡修改
understand js operators
ERROR Error: No module factory availabl at Object.PROJECT_CONFIG_JSON_NOT_VALID_OR_NOT_EXIST ‘Error
How MySQL - depots table?A look at will understand
WeChat applet source code acquisition and decompilation method
ERROR Error: No module factory availabl at Object.PROJECT_CONFIG_JSON_NOT_VALID_OR_NOT_EXIST ‘Error
Year-end summary - the years are quiet~
MySQL压缩包方式安装,傻瓜式教学
360 加固 file path not exists.