当前位置:网站首页>机器学习基本概念
机器学习基本概念
2022-07-31 11:53:00 【sweetheart7-7】
文章目录
基本概念
机器学习就是去寻找一个复杂的函数
深度学习:找一个函数,这个函数用类神经网络表示
函数的输入可以是一个向量、矩阵(images)、序列(语音)
输出可以是一个数(regression)、可以是一个类别(分类)、文本、画图等
课程任务
- Supervised Learning (监督学习)
- Self-supervised Learning (自监督学习)
- Generative Adversarial Network (生成对抗网络)
- Reinforcement Learning (强化学习)
- Anomaly Detection (异常检测)
- Explainable AI (可解释性 AI)
- Model Attack (模型攻击)
- Domain Adaptation (域自适应)
- Network Compression (让模型变小)
- Life-long Learning (终身学习)
- Meta learning (学习如何学习)
机器学习的步骤
1. Function with Unknown Parameters
y = b + w x 1 y = b + wx_1 y=b+wx1
y y y:预测的值
x x x:feature
w w w:weight
b b b:bias
Model:在机器学习里面就是指带参数的函数
2. Define Loss from Training Data
Loss:是一个带参函数
输入: b b b 和 w w w
输出:代表某一组 b b b 和 w w w 好还是不好
L ( b , w ) L(b, w) L(b,w)
例:求 L ( 0.5 k , 1 ) L(0.5k, 1) L(0.5k,1)
y = b + w x 1 y = b + wx_1 y=b+wx1 = = > ==> ==> y = 0.5 k + 1 x 1 y = 0.5k + 1x_1 y=0.5k+1x1
假如带入后求得的 y = 5.3 k y=5.3k y=5.3k 而实际的 y ^ = 4.9 k \hat{y} = 4.9k y^=4.9k (label)
e 1 = ∣ y − y ^ ∣ = 0.4 k e_1 = |y - \hat{y}| = 0.4k e1=∣y−y^∣=0.4k
e 2 , e 3 , . . . e n e_2, e_3,...e_n e2,e3,...en都可以这样计算
Loss: L = 1 N ∑ n e n L = \frac{1}{N}\sum_{n}e_n L=N1n∑en
越小代表这一组参数越好。
有多种计算方式:
MAE(mean absolute error): e = ∣ y − y ^ ∣ e = |y - \hat{y}| e=∣y−y^∣
MSE(mean square error): e = ( y − y ^ ) 2 e = (y - \hat{y})^2 e=(y−y^)2
cross-entropy
根据 w w w 和 b b b 画出的 L o s s Loss Loss 的等高线图叫做 Error Surface(二维)
3. Optimization
目的:找最好的 w w w 和 b b b
Optimization的方法:Gradient Descent
先给出 L o s s Loss Loss 与 w w w 的变化图 (Error Surface 一维)
步骤:
- Pick an initial value W 0 W^0 W0
- 对此时的 w w w 求导(算微分):计算切线斜率
- 更新 w w w
- 反复上面的操作
可能出现局部最优解(Local minima)
切线斜率负的:切线左高右低,所以如果应该向右边前进(w = w - 学习率 * 斜率)
决定步长的因素有两个:
- 斜率(斜率越大步长越大)
- 学习率(自己设置的一个参数)
hyperparameters:需要自己设定的参数
推广到 w w w 和 b b b
二维图上:
可以发现 点击量
y y y 的波动具有周期性,所以可以对函数进行推广
上面这些模型统称为 Linear models
边栏推荐
- 5 个开源的 Rust Web 开发框架,你选择哪个?
- Distributed id solution
- Cloudera Manager —— 端到端的企业数据中心管理工具
- Docker installs canal and mysql for simple testing and achieves cache consistency between redis and mysql
- LeetCode - 025. 链表中的两数相加
- MySQL百万数据优化总结 一
- file contains vulnerabilities
- Data Lake (19): SQL API reads Kafka data and writes it to Iceberg table in real time
- Acwing第 62 场周赛【未完结】
- Docker实践经验:Docker 上部署 mysql8 主从复制
猜你喜欢
WebGL给Unity传递参数问题1: Cannot read properties of undefined (reading ‘SendMessage‘)
The most complete phpmyadmin vulnerability summary
给你一个大厂面试的机会,你能面试上吗?进来看看!
一文带你了解redux的工作流程——actionreducerstore
A Week of Wonderful Content Sharing (Issue 14)
mysql 索引使用与优化
Initial JDBC programming
Power BI----几个常用的分析方法和相适应的视觉对象
安装MYSQL遇到问题:write configuration file卡主
Acwing第 62 场周赛【未完结】
随机推荐
【虚拟化生态平台】平台架构图&思路和实现细节
透过开发抽奖小程序,体会创新与迭代
Shengxin Weekly Issue 38
拥抱趋势!阿里这套微服务开源框架权威手册,实战到底层细致清晰
After class, watching the documentation and walking back to the lab, I picked up the forgotten SQL operators again
After Effects 教程,如何在 After Effects 中修复曝光不足的镜头?
St. Regis Takeaway Project: New dishes and dishes paged query
结构化查询语言SQL-关系数据库标准语言
学习笔记 Golang 写入文件(io.WriteString、ioutil.WriteFile、file.Write、write.WriteString)
学自动化测试哪个培训机构好 试听课程后就选了这个地方学习
矩形脉冲波形的占空比及脉冲和瞬态特征的测量
Android studio连接MySQL并完成简单的登录注册功能
MySQL日志中“binlog”的三种格式玩起来真爽
mysql根据多字段分组——group by带两个或多个参数
CWE4.8 -- The 25 most damaging software security issues in 2022
Use jOOQ to write vendor-agnostic SQL with JPA's native query or @Formula.
DCM 中间件家族迎来新成员
R语言:文本(字符串)处理与正则表达式
分布式事务——分布式事务简介、分布式事务框架 Seata(AT模式、Tcc模式、Tcc Vs AT)、分布式事务—MQ
5 个开源的 Rust Web 开发框架,你选择哪个?