当前位置:网站首页>机器学习概述
机器学习概述
2022-08-05 04:08:00 【米卡粒】
1.1人工智能概述
达特茅斯会议-人工智能的起点
机器学习是人工智能的一个实现途径
深度学习是机器学习的一个方法发展而来
1.1.2机器学习、深度学习能做些什么
传统预测
图像识别
自然语言处理
1.2什么是机器学习
数据、模型、预测
从历史数据中获得规律?这些历史数据是怎么的格式?
1.2.3数据集构成
特征值+目标值
1.3机器学习算法分类
监督学习
目标值:类别——分类问题
k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归
目标值:连续型的数据-回归问题
线性回归、岭回归
目标值:无-无监督学习
聚类 k-means
1、预测明天的气温是多少? 回归
2、预测明天是阴、晴、雨? 分类
3、人脸年龄预测? 回归/分类
4、人脸识别 ? 分类
2.1数据集
2.1.1可用数据集
公司内部 百度
数据接口 花钱
数据集
学习阶段可以用的数据集:
1、sklearn
2、kaggle
3、UCI
1 Scikit-learn工具介绍
2.1.2sklearn数据集
sklearn.datasets
load_* 获取小规模数据集
from sklearn.datasets import load_iris
def datasets_demo():
"""
sklearn数据集使用
:return:
"""
# 获取数据集
iris = load_iris()
print("鸢尾花数据集:\n",iris)
print("鸢尾花数据集描述:\n", iris["DESCR"])
print("鸢尾花特征值的名字:\n", iris.feature_names)
print("鸢尾花特征值:\n", iris.data.shape)
return None
if __name__ == "__main__":
# 代码1:sklearn数据集使用
datasets_demo()
运行如下(数据过多,展示部分)
fetch_* 获取大规模数据集
2 sklearn小数据集
sklearn.datasets.load_iris()
3 sklearn大数据集
sklearn.datasets.fetch_20newsgroups(data_home=None)
4 数据集的返回值
datasets.base.Bunch(继承自字典)
dict["key"] = values
bunch.key = values
思考:拿到的数据是否都用来训练一个模型?
2.1.3数据集的划分
训练数据集:用于训练、构建模型
测试数据:在模型检验是使用,用于评估模型是否有效
测试集 20%~30%
sklearn.model_selection.train_test_split(arrays,*options)
训练集特征值,测试集特征值,训练集目标值,测试集目标值
x_train, x_test, y_train, y_test
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
def datasets_demo():
"""
sklearn数据集使用
:return:
"""
# 获取数据集
iris = load_iris()
print("鸢尾花数据集:\n",iris)
print("鸢尾花数据集描述:\n", iris["DESCR"])
print("鸢尾花特征值的名字:\n", iris.feature_names)
print("鸢尾花特征值:\n", iris.data.shape)
# 数据集的划分
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=22)
print("训练数据集的特征:\n", x_train, x_train.shape)
return None
if __name__ == "__main__":
# 代码1:sklearn数据集使用
datasets_demo()
部分运行结果如下
边栏推荐
- DEJA_VU3D - Cesium功能集 之 059-腾讯地图纠偏
- pyqt5 + socket 实现客户端A经socket服务器中转后主动向客户端B发送文件
- GC Gaode coordinate and Baidu coordinate conversion
- Call Alibaba Cloud oss and sms services
- Ice Scorpion V4.0 attack, security dog products can be fully detected
- Android interview question - how to write with his hands a non-blocking thread safe queue ConcurrentLinkedQueue?
- 【8.4】代码源 - 【数学】【历法】【删库】【不朴素的数列(Bonus)】
- [CISCN2019 华东南赛区]Web11
- bytebuffer put flip compact clear 方法演示
- Bosses, I noticed that a mysql CDC connector parameters scan. The incremental. Sna
猜你喜欢
UI自动化测试 App的WebView页面中,当搜索栏无搜索按钮时处理方法
开发属于自己的node包
Index Mysql in order to optimize paper 02 】 【 10 kinds of circumstances and the principle of failure
UE4 在游戏运行时更改变量 (通过鼠标滑轮来更改第一人称角色的最大行走速度)
In the WebView page of the UI automation test App, the processing method when the search bar has no search button
多列属性column元素的可见性:display、visibility、opacity、垂直对齐方式:vertical-align、z-index 越大越显示在上层
What is the function of industrial-grade remote wireless transmission device?
Initial solution of the structure
UE4 第一人称角色模板 添加生命值和调试伤害
炎炎夏日教你利用小米智能家居配件+树莓派4接入Apple HomeKit
随机推荐
Solana NFT开发指南
Based on holding YOLOv5 custom implementation of FacePose YOLO structure interpretation, YOLO data format conversion, YOLO process modification"
多御安全浏览器 V10.8.3.1 版正式发布,优化多项内容
[Paper Notes] MapReduce: Simplified Data Processing on Large Clusters
【 8.4 】 source code - [math] [calendar] [delete library 】 【 is not a simple sequence (Bonus) 】
Shell script: for loop and the while loop
YYGH-13-Customer Service Center
Growth-based checkerboard corner detection method
1007 Climb Stairs (greedy | C thinking)
Mysql's redo log detailed explanation
The first performance test practice, there are "100 million" a little nervous
Increasing leetcode - a daily topic 1403. The order of the boy sequence (greed)
bytebuffer internal structure
[MRCTF2020] PYWebsite
MySql的索引学习和使用;(本人觉得足够详细)
Fifteen. Actual combat - MySQL database building table character set and collation
DEJA_VU3D - Cesium功能集 之 058-高德地图纠偏
第一次性能测试实践,有“亿”点点紧张
SkiaSharp 之 WPF 自绘 粒子花园(案例版)
概率论的学习和整理8: 几何分布和超几何分布