当前位置:网站首页>Machine Learning Overview
Machine Learning Overview
2022-08-05 04:11:00 【Mika grains】
1.1人工智能概述
达特茅斯会议-人工智能的起点
机器学习是人工智能的一个实现途径
深度学习是机器学习的一个方法发展而来
1.1.2机器学习、深度学习能做些什么
传统预测
图像识别
自然语言处理
1.2什么是机器学习
数据、模型、预测
从历史数据中获得规律?这些历史数据是怎么的格式?
1.2.3数据集构成
特征值+目标值
1.3机器学习算法分类
监督学习
目标值:类别——分类问题
k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归
目标值:连续型的数据-回归问题
线性回归、岭回归
目标值:无-无监督学习
聚类 k-means
1、Predict what the temperature will be tomorrow? 回归
2、预测明天是阴、晴、雨? 分类
3、Face age prediction? 回归/分类
4、人脸识别 ? 分类
2.1数据集
2.1.1可用数据集
公司内部 百度
数据接口 花钱
数据集
学习阶段可以用的数据集:
1、sklearn
2、kaggle
3、UCI
1 Scikit-learn工具介绍
2.1.2sklearn数据集
sklearn.datasets
load_* 获取小规模数据集
from sklearn.datasets import load_iris
def datasets_demo():
"""
sklearn数据集使用
:return:
"""
# 获取数据集
iris = load_iris()
print("鸢尾花数据集:\n",iris)
print("鸢尾花数据集描述:\n", iris["DESCR"])
print("The name of the iris eigenvalue:\n", iris.feature_names)
print("Iris eigenvalues:\n", iris.data.shape)
return None
if __name__ == "__main__":
# 代码1:sklearn数据集使用
datasets_demo()运行如下(数据过多,展示部分)
fetch_* 获取大规模数据集
2 sklearn小数据集
sklearn.datasets.load_iris()
3 sklearn大数据集
sklearn.datasets.fetch_20newsgroups(data_home=None)
4 数据集的返回值
datasets.base.Bunch(继承自字典)
dict["key"] = values
bunch.key = values
思考:Whether the obtained data is used to train a model?
2.1.3数据集的划分
训练数据集:用于训练、构建模型
测试数据:is used in model checking,用于评估模型是否有效
测试集 20%~30%
sklearn.model_selection.train_test_split(arrays,*options)
训练集特征值,测试集特征值,训练集目标值,测试集目标值
x_train, x_test, y_train, y_test
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
def datasets_demo():
"""
sklearn数据集使用
:return:
"""
# 获取数据集
iris = load_iris()
print("鸢尾花数据集:\n",iris)
print("鸢尾花数据集描述:\n", iris["DESCR"])
print("The name of the iris eigenvalue:\n", iris.feature_names)
print("Iris eigenvalues:\n", iris.data.shape)
# 数据集的划分
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=22)
print("Features of the training dataset:\n", x_train, x_train.shape)
return None
if __name__ == "__main__":
# 代码1:sklearn数据集使用
datasets_demo()部分运行结果如下

边栏推荐
- UE4 后期处理体积 (角色受到伤害场景颜色变淡案例)
- bytebuffer 内部结构
- UE4 第一人称角色模板 添加冲刺(加速)功能
- flink reads mongodb data source
- No regrets, the appium automation environment is perfectly built
- Redis1: Introduction to Redis, basic features of Redis, relational database, non-relational database, database development stage
- 大佬们,我注意到mysql cdc connector有参数scan.incremental.sna
- [BJDCTF2020]EasySearch
- cross domain solution
- Getting Started with Kubernetes Networking
猜你喜欢
![[GYCTF2020]EasyThinking](/img/40/973411c69d1e4766d22f6a4a7c7c01.png)
[GYCTF2020]EasyThinking

Acid (ACID) Base (BASE) Principles for Database Design

35岁的软件测试工程师,月薪不足2W,辞职又怕找不到工作,该何去何从?

No regrets, the appium automation environment is perfectly built

商业智能BI业务分析思维:现金流量风控分析(一)营运资金风险

七夕节代码表白

MySql的索引学习和使用;(本人觉得足够详细)

36-Jenkins-Job Migration
![[MRCTF2020] Ezpop (detailed)](/img/19/920877ca36d1eda8d118637388ab05.png)
[MRCTF2020] Ezpop (detailed)

Index Mysql in order to optimize paper 02 】 【 10 kinds of circumstances and the principle of failure
随机推荐
2022-08-04T17:50:58.296+0800 ERROR Announcer-3 io.airlift.discovery.client.Announcer appears after successful startup of presto
[MRCTF2020] PYWebsite
[Paper Notes] MapReduce: Simplified Data Processing on Large Clusters
什么是ASEMI光伏二极管,光伏二极管的作用
数据库设计的酸(ACID)碱(BASE)原则
SkiaSharp 之 WPF 自绘 粒子花园(案例版)
概率论的学习和整理8: 几何分布和超几何分布
XMjs cross-domain problem solving
Redis key basic commands
UE4 opens doors with overlapping events
【8.4】代码源 - 【数学】【历法】【删库】【不朴素的数列(Bonus)】
BI业务分析思维:现金流量风控分析(二)信用、流动和投资风险
[极客大挑战 2019]FinalSQL
[MRCTF2020]Ezpop(详解)
DEJA_VU3D - Cesium功能集 之 056-智图Arcgis地图纠偏
Defect detection (image processing part)
bytebuffer use demo
【Mysql进阶优化篇02】索引失效的10种情况及原理
机器学习概述
905. Interval selection