当前位置:网站首页>11.机器学习基础:机器学习的四个分支
11.机器学习基础:机器学习的四个分支
2022-08-03 04:05:00 【好名字能更容易让朋友记住】
机器学习的四个分支
在前面的例子中,已经熟悉了三种类型的机器学习问题:二分类问题、多分类问题和标量回归问题。这三者都是属于监督学习的例子,其目标是学习训练输入与训练目标之间的关系。
机器学习的四个分支:
- 监督学习
- 无监督学习
- 自监督学习
- 强化学习
监督学习
给定一组样本(通常由人工标注),它可以学会将输入数据映射到已知目标(也叫标注),如光学字符识别、语音识别、图像分类和语言翻译。虽然监督学习主要包括分类和回归,但还是由更多的奇特变体,主要包括以下几种:
- 序列生成(sequence generation)。给定一张图像,预测描述图像的文字。序列生成有时可以被重新表示为一系列分类问题,比如反复预测序列中的单词或标记。
- 语法树预测(syntax tree prediction)。给定一个句子,预测其分解生成的语法树。
- 目标检测(object detection)。给定一个图像,在图中特定目标的周围画一个边界框。这个问题也可以表示为分类问题(给定多个候选边界框,对每个框内的目标进行分类)或分类与回归联合问题(用向量回归来预测边界框的坐标)。
- 图像分割(image segmentation)。给定一张图像,在特定物体上画一个像素的掩膜(mask)。
无监督学习
无监督学习是指**在没有目标的情况下寻找输入数据的有趣变换,其目的在于数据可视化、数据压缩、数据去噪或更好地理解数据中的相关性。**无监督学习是数据分析的必备技能,在解决监督学习问题之前,为了更好地了解数据集,它通常是一个必要步骤。**降维(dimensionality reductiuon)和聚类(clustering)**都是卓索州之的无监督学习方法。
自监督学习
自监督学习是监督学习的一种特例,它与众不同。自监督学习是没有人工标注的标签的监督学习,你可以将它看作没有人类参与的监督学习。标签仍然存在(因为总要有什么东西来监督学习过程),但它们是从输入数据中生成的,通常是使用启发式算法生成的。
举例,自编码器(auto encoder)是有名的自监督学习的例子,其生成的目标就是未经修改的输入。同样,给定视频中过去的帧来预测下一帧,或者给定文本中前面的词来预测下一个词,都是自监督学习的例子(这两个例子也属于时序监督学习(temporally sypervised learning,即用未来的输入数据作为监督)。值得注意的是,监督学习、自监督学习和无监督学习之间的区别有时很模糊,这三个类别更像是没有明确界限的连续体。自监督学习可以被重新解释为监督学习或无监督学习,这取决于你关注的是学习机制和应用场景。
强化学习
强化学习一直以来被人们所忽视,但随着Google的DeepMind公司将其成功用于学习玩Atari游戏(以及后来学习下围棋并达到最高水平),机器学习的这一分支开始受到大量关注。在强化学习中,**智能体(agent)**接收有关其环境的信息,并学会选择使某种奖励最大化的行动。例如,神经网络会“观察”视频游戏的屏幕并输出游戏操作,目的是尽可能获得高分,这种神经网络可以通过强化游戏学习来训练。
分类和回顾术语表
- 样本(sample)或输入(input):进入模型的数据点。
- 预测(prediction)或输出(outpu):从模型出来的结果。
- 目标(target):真实值。对于外部数据源,理想情况下,模型应该能够预测出目标。
- 预测误差(prediction error)或损失值(loss value):模型预测与目标之间的距离。
- 类别(class):分类问题中供选择的一组标签。例如,对猫狗图像进行分类时,“狗”和“猫”就是两个类别。
- 标签(label):分类问题中类别标注的具体例子。比如,如果1234号图象被标注为包含类别“狗”,那么“狗”就是1234号图像的标签。
- 真值(ground-truth)或标注(annotation):数据集的所有目标,通常由人工收集。
- 二分类(binary classification):一种分类任务,每个输入样本都应被划分到两个互斥的类别中。
- 多分类(multiclass classification):一种分类任务,每个输入样本都应被划分到两个以上的类别中,比如手写数字分类。
- 多标签分类(multialabel classification):一种分类任务,每个输入样本都可以分配多个标签。举例,如果一幅图像里既有猫也有狗,那么应该同时标注“猫”和“狗”标签。每幅图像的标签个数通常是可变的。
- 标量回归(scalar regression):目标是连续标量值的任务。预测房价就是一个很好的例子,不同的目标价格形成一个连续的空间。
- 向量回归(vector regression):目标是一组连续值(比如一个连续向量)的任务。如果对多个值(比如图像边界框的坐标)进行回归,那就是向量回归。
- 小批量(mini-batch)或批量(batch):模型同时处理的一小部分样本(样本数通常为8~128)。样本数通常取2的幂,这样便于CPU上的内存分配。训练时,小批量用来为模型权重计算一次梯度下降更新。
边栏推荐
- Dynamically modify the title of the navigation bar in uniapp
- Problems that need to be solved for interrupting the system
- LeetCode算法日记:面试题 03.04. 化栈为队
- OneNote 教程,如何在 OneNote 中设置笔记格式?
- 数字3d虚拟交互展厅顺应时代发展需求和趋势
- Linux-Docker-Redis安装
- Chapter 8 Character Input Output and Input Validation
- 安装ambari
- 正则表达式与绕过案例
- SkiaSharp 之 WPF 自绘 五环弹动球(案例版)
猜你喜欢
shell之条件语句(条件测试、if语句,case语句)
再讲Promise
ESP8266-Arduino编程实例-MCP3008-ADC转换器驱动
肖sir ——自动化讲解
DOM破环和两个实验的复现
WinForm(二):WinFrom中Main函数的入参和出参
Best Practices for Migration from Jincang Database from MySQL to KingbaseES (3. MySQL Database Migration Practice)
Assembly answers
"Obs" start pushing flow failure: the Output. The StartStreamFailed call process
【leetcode热题Hot100】——LRU缓存
随机推荐
Chinese valentine's day??To the liver is the way!!!!!Auto. Js special position control method
道通转债,微芯转债,博22转债上市价格预测
【笔记】混淆矩阵和ROC曲线
浅谈用KUSTO查询语言(KQL)在Azure Synapse Analytics(Azure SQL DW)审计某DB账号的操作记录
计组错题集
【剑指offer】——16.数值的整数次方
urlencode 和rawurlencode的区别
深圳线下报名|StarRocks on AWS:如何对实时数仓进行极速统一分析
安装ambari
富瑞宣布战略交易,以简化运营,持续专注于打造领先的独立全服务型全球投行公司
stdio.h(本机代码)
Auto. Js scripts run time calculated Pro
js的组成及js样式
【leetcode热题Hot100】——任务调度器
leetcode刷题学习之路
9 椭圆曲线密码体制
利用索引机制进行绕过
CyberArk被评为2022年Gartner特权访问管理魔力象限领导者
工程制图第九章作业
Best Practices for Migration from Jincang Database from MySQL to KingbaseES (3. MySQL Database Migration Practice)