当前位置:网站首页>机器学习术语
机器学习术语
2022-07-03 00:46:00 【The code family】
1) 模型
模型这一词语将会贯穿整个教程的始末,它是机器学习中的核心概念。你可以把它看做一个“魔法盒”,你向它许愿(输入数据),它就会帮你实现愿望(输出预测结果)。整个机器学习的过程都将围绕模型展开,训练出一个最优质的“魔法盒”,它可以尽量精准的实现你许的“愿望”,这就是机器学习的目标。
2) 数据集
数据集,从字面意思很容易理解,它表示一个承载数据的集合,如果说“模型”是“魔法盒”的话,那么数据集就是负责给它充能的“能量电池”,简单地说,如果缺少了数据集,那么模型就没有存在的意义了。数据集可划分为“训练集”和“测试集”,它们分别在机器学习的“训练阶段”和“预测输出阶段”起着重要的作用。
3) 样本&特征
样本指的是数据集中的数据,一条数据被称为“一个样本”,通常情况下,样本会包含多个特征值用来描述数据,比如现在有一组描述人形态的数据“180 70 25”如果单看数据你会非常茫然,但是用“特征”描述后就会变得容易理解,如下所示:
| 身高(cm) | 体重(kg) | 年龄 |
| 180 | 70 | 25 |
图1:样本&特征
由上图可知数据集的构成是“一行一样本,一列一特征”。特征值也可以理解为数据的相关性,每一列的数据都与这一列的特征值相关。
4) 向量
任何一门算法都会涉及到许多数学上的术语或者公式。在本教程写作的过程中也会涉及到很多数学公式,以及专业的术语,在这里我们先对常用的基本术语做一下简单讲解。
第一个常用术语就是“向量”,向量是机器学习的关键术语。向量在线性代数中有着严格的定义。向量也称欧几里得向量、几何向量、矢量,指具有大小和方向的量。您可以形象地把它的理解为带箭头的线段。箭头所指:代表向量的方向;线段长度:代表向量的大小。与向量对应的量叫做数量(物理学中称标量),数量只有大小,没有方向。数据集中的每一个样本都是一条具有向量形式的数据。
5) 矩阵
矩阵也是一个常用的数学术语,你可以把矩阵看成由向量组成的二维数组,数据集就是以二维矩阵的形式存储数据的,你可以把它形象的理解为电子表格“一行一样本,一列一特征”表现形式如下:

边栏推荐
- leetcode-934:最短的桥
- How to systematically learn machine learning
- Tensorflow 2. Chapter 15 of X (keras) source code explanation: migration learning and fine tuning
- 比较版本号
- 详解RDD基本概念、RDD五大属性
- matlab查找某一行或者某一列在矩阵中的位置
- Key detection and sinusoidal signal output developed by Arduino
- Linear programming of mathematical modeling (including Matlab code)
- [overview of AUTOSAR three RTE]
- Assets, vulnerabilities, threats and events of the four elements of safe operation
猜你喜欢

【AutoSAR 二 AppL概述】

【C语言】分支和循环语句(上)

Vulkan performance and refinement

Basic use of sringcloud & use of component Nacos

Sentry developer contribution Guide - configure pycharm

Lu Zhe, chief scientist of Shiping information: building data and personnel centered security capabilities

RISA rz/g2l processor introduction | frame diagram | power consumption | schematic diagram and hardware design guide

FPGA - 7系列 FPGA内部结构之Clocking -04- 多区域时钟

Correctly distinguish the similarities and differences among API, rest API, restful API and web service

Illustrated network: what is virtual router redundancy protocol VRRP?
随机推荐
Test shift right: Elk practice of online quality monitoring
(C language) data storage
1038 Recover the Smallest Number
leetcode:871. 最低加油次数【以前pat做过 + 最大堆 +贪心】
2022.2.14 resumption
Machine learning: numpy version linear regression predicts Boston house prices
Matlab saves the digital matrix as geospatial data, and the display subscript index must be of positive integer type or logical type. Solve the problem
【C语言】分支和循环语句(上)
Leetcode-2280: represents the minimum number of line segments of a line graph
1.12 - 指令
【AutoSAR 七 工具链简介】
[AUTOSAR II appl overview]
leetcode-2280:表示一个折线图的最少线段数
Understanding and distinguishing of some noun concepts in adjustment / filtering
无向图的割点
matlab将数字矩阵保存为地理空间数据出错,显示下标索引必须为正整数类型或逻辑类型,解决
[AUTOSAR + IO Architecture]
瑞萨RZ/G2L ARM开发板存储读写速度与网络实测
465. DFS backtracking of optimal bill balance
【AutoSAR 十二 模式管理】