当前位置:网站首页>机器学习术语
机器学习术语
2022-07-03 00:46:00 【The code family】
1) 模型
模型这一词语将会贯穿整个教程的始末,它是机器学习中的核心概念。你可以把它看做一个“魔法盒”,你向它许愿(输入数据),它就会帮你实现愿望(输出预测结果)。整个机器学习的过程都将围绕模型展开,训练出一个最优质的“魔法盒”,它可以尽量精准的实现你许的“愿望”,这就是机器学习的目标。
2) 数据集
数据集,从字面意思很容易理解,它表示一个承载数据的集合,如果说“模型”是“魔法盒”的话,那么数据集就是负责给它充能的“能量电池”,简单地说,如果缺少了数据集,那么模型就没有存在的意义了。数据集可划分为“训练集”和“测试集”,它们分别在机器学习的“训练阶段”和“预测输出阶段”起着重要的作用。
3) 样本&特征
样本指的是数据集中的数据,一条数据被称为“一个样本”,通常情况下,样本会包含多个特征值用来描述数据,比如现在有一组描述人形态的数据“180 70 25”如果单看数据你会非常茫然,但是用“特征”描述后就会变得容易理解,如下所示:
| 身高(cm) | 体重(kg) | 年龄 |
| 180 | 70 | 25 |
图1:样本&特征
由上图可知数据集的构成是“一行一样本,一列一特征”。特征值也可以理解为数据的相关性,每一列的数据都与这一列的特征值相关。
4) 向量
任何一门算法都会涉及到许多数学上的术语或者公式。在本教程写作的过程中也会涉及到很多数学公式,以及专业的术语,在这里我们先对常用的基本术语做一下简单讲解。
第一个常用术语就是“向量”,向量是机器学习的关键术语。向量在线性代数中有着严格的定义。向量也称欧几里得向量、几何向量、矢量,指具有大小和方向的量。您可以形象地把它的理解为带箭头的线段。箭头所指:代表向量的方向;线段长度:代表向量的大小。与向量对应的量叫做数量(物理学中称标量),数量只有大小,没有方向。数据集中的每一个样本都是一条具有向量形式的数据。
5) 矩阵
矩阵也是一个常用的数学术语,你可以把矩阵看成由向量组成的二维数组,数据集就是以二维矩阵的形式存储数据的,你可以把它形象的理解为电子表格“一行一样本,一列一特征”表现形式如下:

边栏推荐
- leetcode-224:基本计算器
- Delete duplicate elements in the ordered linked list -ii
- Test shift right: Elk practice of online quality monitoring
- 【C语言】分支和循环语句(上)
- RK3568开发板评测篇(二):开发环境搭建
- Leetcode-224: basic calculator
- 1038 Recover the Smallest Number
- 研发一款国产ARM智能边缘计算网关需要什么
- Initial order of pointer (basic)
- Leetcode-871: minimum refueling times
猜你喜欢

Vulkan practice first bullet
![[applet project development -- JD mall] user defined search component of uni app (middle) -- search suggestions](/img/ea/ee1ad50a497478b9d080bb5e4bdfb5.png)
[applet project development -- JD mall] user defined search component of uni app (middle) -- search suggestions

Sentry developer contribution Guide - configure pycharm

拥抱平台化交付的安全理念
![[C language] branch and loop statements (Part 1)](/img/47/6efcc59bd26e26f66c698635c26c8b.png)
[C language] branch and loop statements (Part 1)

Deep analysis of data storage in memory

Data analysis, thinking, law breaking and professional knowledge -- analysis method (I)

寻找标杆战友 | 百万级实时数据平台,终身免费使用

指针初阶(基础)

研发一款国产ARM智能边缘计算网关需要什么
随机推荐
这不平凡的两年,感谢我们一直在一起!
Linear programming of mathematical modeling (including Matlab code)
Array and collection performance comparison
深度剖析数据在内存中的存储
[love crash] neglected details of gibaro
Kubernetes resource object introduction and common commands (V) - (NFS & PV & PVC)
Leetcode-224: basic calculator
Teach you JDBC hand in hand -- structure separation
excel表格计算时间日期的差值,并转化为分钟数
Data analysis, thinking, law breaking and professional knowledge -- analysis method (I)
[AUTOSAR II appl overview]
Web2.0 giants have deployed VC, and tiger Dao VC may become a shortcut to Web3
leetcode-2115:从给定原材料中找到所有可以做出的菜
Explain the basic concepts and five attributes of RDD in detail
指针初阶(基础)
安全运营四要素之资产、脆弱性、威胁和事件
2022 list of manufacturers of Chinese 3D vision enterprises (guided positioning and sorting scenes)
【AutoSAR 六 描述文件】
1696C. Fishingprince Plays With Array【思维题 + 中间状态 + 优化存储】
鏈錶內指定區間反轉