当前位置:网站首页>李宏毅《机器学习》丨4. Deep Learning(深度学习)
李宏毅《机器学习》丨4. Deep Learning(深度学习)
2022-07-28 15:08:00 【华为云】
一、深度学习发展历史
- 1958: Perceptron (linear model)
- 1969: Perceptron has limitation
- 1980s: Multi-layer perceptron
Do not have significant difference from DNN today - 1986: Backpropagation
Usually more than 3 hidden layers is not helpful - 1989: 1 hidden layer is “good enough”, why deep?
- 2006: RBM initialization (breakthrough)
- 2009: GPU
- 2011: Start to be popular in speech recognition
- 2012: win ILSVRC image competition
二、深度学习三个步骤
2.1 Step1:神经网络(Neural network)
以神经元(neuron)为基本单位,通过神经元之间的互相连接,建立神经网络。
神经元之间有很多不同的连接方式,这样就会产生不同的结构(structure)。
- 完全连接前馈神经网络:相邻层神经元之间都有连接,而且传递的方向是由后往前传。

▲ 完全连接前馈神经网络
深度(Deep)的理解
Deep = Many hidden layer
- 2012 AlexNet:8层
- 2014 VGG:19层
- 2014 GoogleNet:22层
- 2015 Residual Net:152层
- 101 Taipei:101层

▲ 深度层数的发展
矩阵计算(Matrix Operation)
随着层数变多,错误率降低,随之运算量增大,通常都是超过亿万级的计算。对于这样复杂的结构,我们一定不会一个一个的计算,对于亿万级的计算,使用loop循环效率很低。因此,利用矩阵计算(Matrix Operation)提高运算的速度以及效率。

▲ 矩阵计算(Matrix Operation)
FAQ(Frequently Asked Questions)
- 多少层? 每层有多少神经元?
- 结构可以自动确定吗?
- 我们可以设计网络结构吗?

▲ FAQ
2.2 Step2:模型评估(Goodness of function)
对于模型的评估,我们一般采用损失函数来反应模型的好差,所以对于神经网络来说,我们采用交叉熵(cross entropy)函数来对损失进行计算,通过调整参数,让交叉熵误差越来越小。

▲ 损失示例
2.3 Step3:选择最优函数(Pick best function)
梯度下降(Gradient Descent): 3. Gradient Descent(梯度下降)
反向传播(Backpropagation):BP(Back Propagation)神经网络——原理篇
三、深度学习思考
为什么要用深度学习,深层架构带来哪些好处?那是不是隐藏层越多越好?

▲ 隐藏层越多越好?

▲ 普遍性定理
四、总结
Datawhale组队学习,李宏毅《机器学习》Task4. Deep Learning(深度学习)。主要包括深度学习发展历史、深度学习三个步骤:神经网络 模型评估 选择最优函数、深度学习思考。
——END——
边栏推荐
- ffmpeg获取首帧
- Pyqt5 rapid development and practice 5.1 tables and trees
- js 链表 02
- JS linked list 01
- R language uses file of FS package_ Delete function deletes the specified file under the specified folder, draw inferences from one instance, dir_ Delete function, link_ The delete function can be use
- 2021 肯特面试题1
- 2021 Yahong pen test question 2
- 比例电磁阀控制阀4-20mA转0-165mA/330mA信号隔离放大器
- 食品安全 | 这两类瓜果宜改善便秘 孕妇人群尤其建议
- NTC,PT100热电阻转4-20mA温度信号转换器
猜你喜欢

两种特殊函数(箭头函数和方法)

js 数组(总结)

Redis series 4: sentinel (sentinel mode) with high availability

A tour of grp:05 - GRP server streaming service end stream

MicTR01 Tester 开发套件(振弦采集读数仪)使用说明

Pyqt5 rapid development and practice 5.1 tables and trees

2021 Kent interview question 1

Summary of for loop in JS

How to effectively conduct the review meeting (Part 1)?

2021 Yahong pen test question 2
随机推荐
The deep displacement monitoring system wk813 is used to measure the deep displacement of slopes, dams, embankments, railways and building foundation pit excavation
js 链表 01
Note: numerical accumulation animation
How to measure the vibrating wire sensor by vibrating wire acquisition module?
Mlx90640 infrared thermal imager temperature sensor module development notes (VIII)
Shell programming specifications and variables
12V脉冲转速测量转24V电平信号转换变送器
仅需三步 轻松实现远程办公
A tour of grp:05 - GRP server streaming service end stream
分体式测斜探头安装要点及注意事项
IFD-x 微型红外成像仪(模块)的温度测量和成像精度
Record Clearfix clear float
How to quickly access the unified authentication system
12V pulse speed measurement to 24V level signal conversion transmitter
[live broadcast reservation] a new challenge under the evolution of data architecture - Shanghai railway station
热敏电阻PT100,NTC转0-10V/4-20mA转换器
深部位移监测系统wk813应用边坡、大坝、堤防、铁路和建筑基坑开挖等深部位移测量
RF module wireless transceiver rf63u chip application data transmission and infrastructure network
Use py to automatically generate weekly reports based on log records
记项目 常用js方法