当前位置:网站首页>【过一下7】全连接神经网络视频第一节的笔记
【过一下7】全连接神经网络视频第一节的笔记
2022-08-05 05:12:00 【墨苏玩电脑】
力扣 今天是dp
2022年6月25日 过一下7
全连接神经网络
级联多个线性分类器
权值就是模板
如果在线性分类器里面,w行数就是固定的,就要和类别数一样。所以学马,学个两头的(显然是不对的)
但是如果在全连接里面,只要求,w2是固定的,w1随便,搞个100行,100个模板,里面分出来10几个用来学习马,学单头马,然后再用激活函数,选出来。就很对了。
命名
一般说前者
激活函数
sigmoid 归到0-1之间
tanh归到-1~1之间,而且对称
softmax
我们可以根据最后值最大的设定为输出的类,但如果我们需要知道预测的概率为多大的时候,就需要softmax
就e的指数次方,然后归一化一下
交叉熵损失
交叉熵损失使用来比较分布之间的不相似性的,不能说距离,距离是AB BA是一样的,具有交换性,但熵就不一定了
而且H[p]就是ground truth ,它反映的信息一点都不混乱,所以熵为0。交叉熵也就是0+相对熵。简化之后,也就是正确分类得分的-log。
但是在H[p]标答不为独热编码的时候,就需要老老实实用相对熵(KL散度)了。
老师在这里提到:可能会在训练的时候,出现“损失没有下降,但是精度在上升”的情况。就像上图右下角举的例子(假设第三列是正确的分类),
0.35 0.33 0.32(显然没分对)
0.333 0.332 0.334 (分对了)
对于正确分类的 -log 0.35 和 -log0.333 其实差不了多少,但是他的概率变大了,以微小的进步脱颖而出了 (0.334>0.333)
计算图
正着算是数值,逆着算是梯度,链式求导可以相乘
计算图的每个节点都存储前向传播值和反向雅可比矩阵,用于前向传播和反向传播
颗粒度
可以把一系列的门连在一起,组成像sigmoid这样的函数门,这样颗粒度大,但是计算步骤少,运算快。
caffe有人写这些函数,所以快;TensorFlow都是小门,所以参数回传,慢(后面改进了)
常见的门单元
max则是那个数大,就传给谁。
今天 就把第三节的视频过了一下,可惜之前看pdf的笔记被挤掉了。没有留下来,要不然可以比对着,补充一下。
寄
今天早上没睡好,起来金铲铲,然后吃饭,淋雨勇闯自习室,在这里快活,为所欲为,晚上要走了,来一个小时的快速学习。赶一下进度。
边栏推荐
- Day14 jenkins deployment
- 【学生毕业设计】基于web学生信息管理系统网站的设计与实现(13个页面)
- Difference between for..in and for..of
- 【解码工具】Bitcoin的一些在线工具
- 1068 Find More Coins
- Flutter learning - the beginning
- 【cesium】元素高亮显示
- C language - vernacular to understand the original code, inverse code and complement code
- 一篇博客通关Redis技术栈
- LeetCode:1403. 非递增顺序的最小子序列【贪心】
猜你喜欢
Redis哨兵模式配置文件详解
Error creating bean with name 'configDataContextRefresher' defined in class path resource
RL强化学习总结(一)
服务器磁盘阵列
[Student Graduation Project] Design and Implementation of the Website Based on the Web Student Information Management System (13 pages)
[cesium] 3D Tileset model is loaded and associated with the model tree
MySQL基础(一)---基础认知及操作
结构光三维重建(二)线结构光三维重建
Algorithms - ones and zeros (Kotlin)
OFDM Lecture 16 5 -Discrete Convolution, ISI and ICI on DMT/OFDM Systems
随机推荐
entry point injection
dedecms dream weaving tag tag does not support capital letters fix
[Study Notes Dish Dog Learning C] Classic Written Exam Questions of Dynamic Memory Management
Mesos学习
[cesium] 3D Tileset model is loaded and associated with the model tree
[cesium] element highlighting
shell函数
Flutter learning 2-dart learning
Redis哨兵模式配置文件详解
Multi-threaded query results, add List collection
分布式和集群
coppercam入门手册[6]
Flutter学习-开篇
redis复制机制
How does the Flutter TapGestureRecognizer work
Flutter学习4-基本UI组件
开发一套高容错分布式系统
RL强化学习总结(一)
【读书】长期更新
一篇博客通关Redis技术栈