当前位置:网站首页>机器学习术语
机器学习术语
2022-07-03 00:46:00 【The code family】
1) 模型
模型这一词语将会贯穿整个教程的始末,它是机器学习中的核心概念。你可以把它看做一个“魔法盒”,你向它许愿(输入数据),它就会帮你实现愿望(输出预测结果)。整个机器学习的过程都将围绕模型展开,训练出一个最优质的“魔法盒”,它可以尽量精准的实现你许的“愿望”,这就是机器学习的目标。
2) 数据集
数据集,从字面意思很容易理解,它表示一个承载数据的集合,如果说“模型”是“魔法盒”的话,那么数据集就是负责给它充能的“能量电池”,简单地说,如果缺少了数据集,那么模型就没有存在的意义了。数据集可划分为“训练集”和“测试集”,它们分别在机器学习的“训练阶段”和“预测输出阶段”起着重要的作用。
3) 样本&特征
样本指的是数据集中的数据,一条数据被称为“一个样本”,通常情况下,样本会包含多个特征值用来描述数据,比如现在有一组描述人形态的数据“180 70 25”如果单看数据你会非常茫然,但是用“特征”描述后就会变得容易理解,如下所示:
身高(cm) | 体重(kg) | 年龄 |
180 | 70 | 25 |
图1:样本&特征
由上图可知数据集的构成是“一行一样本,一列一特征”。特征值也可以理解为数据的相关性,每一列的数据都与这一列的特征值相关。
4) 向量
任何一门算法都会涉及到许多数学上的术语或者公式。在本教程写作的过程中也会涉及到很多数学公式,以及专业的术语,在这里我们先对常用的基本术语做一下简单讲解。
第一个常用术语就是“向量”,向量是机器学习的关键术语。向量在线性代数中有着严格的定义。向量也称欧几里得向量、几何向量、矢量,指具有大小和方向的量。您可以形象地把它的理解为带箭头的线段。箭头所指:代表向量的方向;线段长度:代表向量的大小。与向量对应的量叫做数量(物理学中称标量),数量只有大小,没有方向。数据集中的每一个样本都是一条具有向量形式的数据。
5) 矩阵
矩阵也是一个常用的数学术语,你可以把矩阵看成由向量组成的二维数组,数据集就是以二维矩阵的形式存储数据的,你可以把它形象的理解为电子表格“一行一样本,一列一特征”表现形式如下:
边栏推荐
- [AUTOSAR eight OS]
- 瑞萨电子RZ/G2L开发板上手评测
- Embrace the safety concept of platform delivery
- Illustrated network: what is virtual router redundancy protocol VRRP?
- Lu Zhe, chief scientist of Shiping information: building data and personnel centered security capabilities
- Compare version number
- 全志A40i/T3如何通过SPI转CAN
- 正确甄别API、REST API、RESTful API和Web Service之间的异同
- Win10 多种方式解决无法安装.Net3.5的问题
- 瑞萨RZ/G2L ARM开发板存储读写速度与网络实测
猜你喜欢
随机推荐
KingbaseES ALTER TABLE 中 USING 子句的用法
The difference between tail -f, tail -f and tail
ROS2之ESP32简单速度消息测试(极限频率)
Leetcode-849: maximum distance to the nearest person
How to convert Quanzhi a40i/t3 to can through SPI
世平信息首席科学家吕喆:构建以数据和人员为中心的安全能力
leetcode-2280:表示一个折线图的最少线段数
瑞萨RZ/G2L ARM开发板存储读写速度与网络实测
[shutter] image component (cached_network_image network image caching plug-in)
leetcode-934:最短的桥
1.12 - Instructions
Solve the cache problem of reactnative using WebView
有向图的强连通分量
(C语言)数据的存储
Lu Zhe, chief scientist of Shiping information: building data and personnel centered security capabilities
2022 list of manufacturers of Chinese 3D vision enterprises (guided positioning and sorting scenes)
Problèmes de configuration lex & yacc & Bison & Flex
[shutter] image component (configure local GIF image resources | load placeholder with local resources)
MySQL multi table joint deletion
FPGA - 7系列 FPGA内部结构之Clocking -04- 多区域时钟