当前位置:网站首页>李宏毅《机器学习》丨4. Deep Learning(深度学习)
李宏毅《机器学习》丨4. Deep Learning(深度学习)
2022-07-28 15:08:00 【华为云】
一、深度学习发展历史
- 1958: Perceptron (linear model)
- 1969: Perceptron has limitation
- 1980s: Multi-layer perceptron
Do not have significant difference from DNN today - 1986: Backpropagation
Usually more than 3 hidden layers is not helpful - 1989: 1 hidden layer is “good enough”, why deep?
- 2006: RBM initialization (breakthrough)
- 2009: GPU
- 2011: Start to be popular in speech recognition
- 2012: win ILSVRC image competition
二、深度学习三个步骤
2.1 Step1:神经网络(Neural network)
以神经元(neuron)为基本单位,通过神经元之间的互相连接,建立神经网络。
神经元之间有很多不同的连接方式,这样就会产生不同的结构(structure)。
- 完全连接前馈神经网络:相邻层神经元之间都有连接,而且传递的方向是由后往前传。

▲ 完全连接前馈神经网络
深度(Deep)的理解
Deep = Many hidden layer
- 2012 AlexNet:8层
- 2014 VGG:19层
- 2014 GoogleNet:22层
- 2015 Residual Net:152层
- 101 Taipei:101层

▲ 深度层数的发展
矩阵计算(Matrix Operation)
随着层数变多,错误率降低,随之运算量增大,通常都是超过亿万级的计算。对于这样复杂的结构,我们一定不会一个一个的计算,对于亿万级的计算,使用loop循环效率很低。因此,利用矩阵计算(Matrix Operation)提高运算的速度以及效率。

▲ 矩阵计算(Matrix Operation)
FAQ(Frequently Asked Questions)
- 多少层? 每层有多少神经元?
- 结构可以自动确定吗?
- 我们可以设计网络结构吗?

▲ FAQ
2.2 Step2:模型评估(Goodness of function)
对于模型的评估,我们一般采用损失函数来反应模型的好差,所以对于神经网络来说,我们采用交叉熵(cross entropy)函数来对损失进行计算,通过调整参数,让交叉熵误差越来越小。

▲ 损失示例
2.3 Step3:选择最优函数(Pick best function)
梯度下降(Gradient Descent): 3. Gradient Descent(梯度下降)
反向传播(Backpropagation):BP(Back Propagation)神经网络——原理篇
三、深度学习思考
为什么要用深度学习,深层架构带来哪些好处?那是不是隐藏层越多越好?

▲ 隐藏层越多越好?

▲ 普遍性定理
四、总结
Datawhale组队学习,李宏毅《机器学习》Task4. Deep Learning(深度学习)。主要包括深度学习发展历史、深度学习三个步骤:神经网络 模型评估 选择最优函数、深度学习思考。
——END——
边栏推荐
- 记录一下 clearfix 清除浮动
- Set static IP in NAT mode of virtual machine
- 以太网转RS485串口计数器WiFI模块 LED灯光控制器IBF165
- 光学雨量计对比翻斗式雨量计的优势
- Knowledge points qwer
- 为什么学编程的人大多数都去了深圳和北京?
- [live broadcast reservation] a new challenge under the evolution of data architecture - Shanghai railway station
- RF module wireless transceiver rf63u chip application data transmission and infrastructure network
- 使用systemd管理服务
- Rust Getting Started Guide (rustup, cargo)
猜你喜欢

MicTR01 Tester 开发套件(振弦采集读数仪)使用说明

Set static IP in NAT mode of virtual machine

The deep displacement monitoring system wk813 is used to measure the deep displacement of slopes, dams, embankments, railways and building foundation pit excavation

多用型混合信号8AI/4DI/DO转串口RS485/232MODBUS采集模块IBF30

Installation points and precautions of split angle probe

Temperature measurement and imaging accuracy of ifd-x micro infrared imager (module)

不懂就问,快速成为容器服务进阶玩家!

高速计数器转RS485Modbus RTU模块IBF150

动态规划 --- 数位统计DP

Rust 入门指南(crate 管理)
随机推荐
两种特殊函数(箭头函数和方法)
便携式钻孔测斜仪数据采集仪测量原理与测斜探头的连接及使用方法
Thermistor PT100, NTC to 0-10v/4-20ma converter
多功能混合信号AI采集/开关量DI/DO采集转RS485/232/MODBUS模块
2-channel Di high-speed pulse counter, 1-channel encoder to Modbus TCP wired wireless module ibf161
Multipurpose mixed signal 8ai/4di/do to serial port rs485/232modbus acquisition module ibf30
比例电磁阀控制阀4-20mA转0-165mA/330mA信号隔离放大器
Data real-time feedback technology
js 栈
2.855 billion yuan! Qingdao Xinen completed the capital increase: Xingcheng Jidian became the largest shareholder, holding 57.10%
Connection and application of portable borehole inclinometer data acquisition instrument and inclinometer probe
食品安全 | 这两类瓜果宜改善便秘 孕妇人群尤其建议
Two special functions (arrow function and method)
Rust 入门指南(crate 管理)
R language uses file of FS package_ Delete function deletes the specified file under the specified folder, draw inferences from one instance, dir_ Delete function, link_ The delete function can be use
0-75mV/0-100mV转RS485/232通讯接口MODBUS RTU采集模块IBF8
JS array (summary)
R language ggplot2 visually draws line plots, and uses gghighlight package to highlight the lines that meet the combination judgment conditions in the line graphs (satisfies both condition a and b)
远距离串口服务器( 适配器)UART/I2C/1-Wire/SPI PS304常见问题及注意事项
One channel encoder, two channels Di speed measurement, RS485 serial port connected to one channel do alarm module ibf151