当前位置:网站首页>机器学习术语
机器学习术语
2022-07-03 00:46:00 【The code family】
1) 模型
模型这一词语将会贯穿整个教程的始末,它是机器学习中的核心概念。你可以把它看做一个“魔法盒”,你向它许愿(输入数据),它就会帮你实现愿望(输出预测结果)。整个机器学习的过程都将围绕模型展开,训练出一个最优质的“魔法盒”,它可以尽量精准的实现你许的“愿望”,这就是机器学习的目标。
2) 数据集
数据集,从字面意思很容易理解,它表示一个承载数据的集合,如果说“模型”是“魔法盒”的话,那么数据集就是负责给它充能的“能量电池”,简单地说,如果缺少了数据集,那么模型就没有存在的意义了。数据集可划分为“训练集”和“测试集”,它们分别在机器学习的“训练阶段”和“预测输出阶段”起着重要的作用。
3) 样本&特征
样本指的是数据集中的数据,一条数据被称为“一个样本”,通常情况下,样本会包含多个特征值用来描述数据,比如现在有一组描述人形态的数据“180 70 25”如果单看数据你会非常茫然,但是用“特征”描述后就会变得容易理解,如下所示:
| 身高(cm) | 体重(kg) | 年龄 |
| 180 | 70 | 25 |
图1:样本&特征
由上图可知数据集的构成是“一行一样本,一列一特征”。特征值也可以理解为数据的相关性,每一列的数据都与这一列的特征值相关。
4) 向量
任何一门算法都会涉及到许多数学上的术语或者公式。在本教程写作的过程中也会涉及到很多数学公式,以及专业的术语,在这里我们先对常用的基本术语做一下简单讲解。
第一个常用术语就是“向量”,向量是机器学习的关键术语。向量在线性代数中有着严格的定义。向量也称欧几里得向量、几何向量、矢量,指具有大小和方向的量。您可以形象地把它的理解为带箭头的线段。箭头所指:代表向量的方向;线段长度:代表向量的大小。与向量对应的量叫做数量(物理学中称标量),数量只有大小,没有方向。数据集中的每一个样本都是一条具有向量形式的数据。
5) 矩阵
矩阵也是一个常用的数学术语,你可以把矩阵看成由向量组成的二维数组,数据集就是以二维矩阵的形式存储数据的,你可以把它形象的理解为电子表格“一行一样本,一列一特征”表现形式如下:

边栏推荐
- lex && yacc && bison && flex 配置的问题
- RISA rz/g2l processor introduction | frame diagram | power consumption | schematic diagram and hardware design guide
- 【AutoSAR 六 描述文件】
- [applet project development -- JD mall] user defined search component of uni app (middle) -- search suggestions
- [AUTOSAR + IO Architecture]
- leetcode-871:最低加油次数
- Thread start and priority
- 世平信息首席科学家吕喆:构建以数据和人员为中心的安全能力
- Cordova plugin device obtains the device information plug-in, which causes Huawei to fail the audit
- Linear programming of mathematical modeling (including Matlab code)
猜你喜欢

FPGA - 7系列 FPGA内部结构之Clocking -04- 多区域时钟

【AutoSAR 二 AppL概述】

How to convert Quanzhi a40i/t3 to can through SPI

1.12 - Instructions

1.11 - bus

Rk3568 development board evaluation (II): development environment construction

Leetcode-2280: represents the minimum number of line segments of a line graph

研发一款国产ARM智能边缘计算网关需要什么

Arduino开发之按键检测与正弦信号输出

指针进阶(一)
随机推荐
Leetcode-1964: find the longest effective obstacle race route to each position
用Go+绘制爱心给心爱的她表白
Win10 多种方式解决无法安装.Net3.5的问题
Infrared thermography temperature detection system based on arm rk3568
合并K个已排序的链表
瑞萨RZ/G2L 处理器简介|框架图|功耗|原理图及硬件设计指南
【AutoSAR 十三 NVM】
excel去除小数点后面的数据,将数字取整
Lu Zhe, chief scientist of Shiping information: building data and personnel centered security capabilities
指针初阶(基础)
KingbaseES ALTER TABLE 中 USING 子句的用法
Linear programming of mathematical modeling (including Matlab code)
【AutoSAR 七 工具链简介】
基于ARM RK3568的红外热成像体温检测系统
Liad: the consumer end of micro LED products is first targeted at TVs above 100 inches. At this stage, it is still difficult to enter a smaller size
18_微信小程序之微信视频号滚动自动播放视频效果实现2.0
Basic use of sringcloud & use of component Nacos
Foundations of data science is free to download
1.11 - 总线
Reading and writing speed of Reza rz/g2l arm development board storage and network measurement