当前位置:网站首页>机器学习基本概念
机器学习基本概念
2022-07-31 11:53:00 【sweetheart7-7】
文章目录
基本概念
机器学习就是去寻找一个复杂的函数
深度学习:找一个函数,这个函数用类神经网络表示
函数的输入可以是一个向量、矩阵(images)、序列(语音)
输出可以是一个数(regression)、可以是一个类别(分类)、文本、画图等
课程任务
- Supervised Learning (监督学习)
- Self-supervised Learning (自监督学习)
- Generative Adversarial Network (生成对抗网络)
- Reinforcement Learning (强化学习)
- Anomaly Detection (异常检测)
- Explainable AI (可解释性 AI)
- Model Attack (模型攻击)
- Domain Adaptation (域自适应)
- Network Compression (让模型变小)
- Life-long Learning (终身学习)
- Meta learning (学习如何学习)
机器学习的步骤
1. Function with Unknown Parameters
y = b + w x 1 y = b + wx_1 y=b+wx1
y y y:预测的值
x x x:feature
w w w:weight
b b b:bias
Model:在机器学习里面就是指带参数的函数
2. Define Loss from Training Data
Loss:是一个带参函数
输入: b b b 和 w w w
输出:代表某一组 b b b 和 w w w 好还是不好
L ( b , w ) L(b, w) L(b,w)
例:求 L ( 0.5 k , 1 ) L(0.5k, 1) L(0.5k,1)
y = b + w x 1 y = b + wx_1 y=b+wx1 = = > ==> ==> y = 0.5 k + 1 x 1 y = 0.5k + 1x_1 y=0.5k+1x1
假如带入后求得的 y = 5.3 k y=5.3k y=5.3k 而实际的 y ^ = 4.9 k \hat{y} = 4.9k y^=4.9k (label)
e 1 = ∣ y − y ^ ∣ = 0.4 k e_1 = |y - \hat{y}| = 0.4k e1=∣y−y^∣=0.4k
e 2 , e 3 , . . . e n e_2, e_3,...e_n e2,e3,...en都可以这样计算
Loss: L = 1 N ∑ n e n L = \frac{1}{N}\sum_{n}e_n L=N1n∑en
越小代表这一组参数越好。
有多种计算方式:
MAE(mean absolute error): e = ∣ y − y ^ ∣ e = |y - \hat{y}| e=∣y−y^∣
MSE(mean square error): e = ( y − y ^ ) 2 e = (y - \hat{y})^2 e=(y−y^)2
cross-entropy
根据 w w w 和 b b b 画出的 L o s s Loss Loss 的等高线图叫做 Error Surface(二维)
3. Optimization
目的:找最好的 w w w 和 b b b
Optimization的方法:Gradient Descent
先给出 L o s s Loss Loss 与 w w w 的变化图 (Error Surface 一维)
步骤:
- Pick an initial value W 0 W^0 W0
- 对此时的 w w w 求导(算微分):计算切线斜率
- 更新 w w w
- 反复上面的操作
可能出现局部最优解(Local minima)
切线斜率负的:切线左高右低,所以如果应该向右边前进(w = w - 学习率 * 斜率)
决定步长的因素有两个:
- 斜率(斜率越大步长越大)
- 学习率(自己设置的一个参数)
hyperparameters:需要自己设定的参数

推广到 w w w 和 b b b

二维图上:

可以发现 点击量 y y y 的波动具有周期性,所以可以对函数进行推广

上面这些模型统称为 Linear models
边栏推荐
- DCM 中间件家族迎来新成员
- CWE4.8 -- The 25 most damaging software security issues in 2022
- 瑞吉外卖项目:新增菜品与菜品分页查询
- Cloudera Manager —— 端到端的企业数据中心管理工具
- JVS应用中心
- 关于==和equals的区别和联系,面试这么回答就可以
- 给你一个大厂面试的机会,你能面试上吗?进来看看!
- 学习爬虫之Scrapy框架学习(1)---Scrapy框架初学习及豆瓣top250电影信息获取的实战!
- The most complete phpmyadmin vulnerability summary
- 「R」使用ggpolar绘制生存关联网络图
猜你喜欢

The latest MySql installation teaching, very detailed

Summary of several defragmentation schemes for MySQL (to solve the problem of not releasing space after deleting a large amount of data)

AWS亚马逊云账号注册,免费申请12个月亚马逊云服务器详细教程

下课看着文档走回实验室,我重新拾起了遗忘的SQL运算符

Power BI----几个常用的分析方法和相适应的视觉对象

普林斯顿微积分读本03第二章--编程实现函数图像绘制、三角学回顾

DCM 中间件家族迎来新成员

Docker实践经验:Docker 上部署 mysql8 主从复制

ApiPost is really fragrant and powerful, it's time to throw away Postman and Swagger

若枚举映射的值不存在,则不进行反序列化
随机推荐
学自动化测试哪个培训机构好 试听课程后就选了这个地方学习
MySQL limit paging query and performance issues
mysql 自动添加创建时间、更新时间
WebGL给Unity传递参数问题1: Cannot read properties of undefined (reading ‘SendMessage‘)
In PLC communication error or timeout or download the prompt solution of the model
ESP8266-Arduino编程实例-MCP9808数字温度传感器驱动
A Week of Wonderful Content Sharing (Issue 14)
分布式id解决方案
Service discovery of kubernetes
CoCube群机器人预览→资讯剧透←
St. Regis Takeaway Project: New dishes and dishes paged query
若枚举映射的值不存在,则不进行反序列化
ESP8266-Arduino编程实例-HDC1008温度湿度传感器驱动
Yarn安装配置(vsftpd安装配置)
矩形脉冲波形的占空比及脉冲和瞬态特征的测量
JVS函数公式使用场景介绍
Redis学习笔记-3.慢查询和其他高级数据结构
MySQL index usage and optimization
Caused by: 类找不到: org.apache.flink.table.planner.delegation.ParserFactory或者ExecutorFactory
MySql模糊查询大全