当前位置:网站首页>Machine Learning Overview
Machine Learning Overview
2022-08-05 04:11:00 【Mika grains】
1.1人工智能概述
达特茅斯会议-人工智能的起点
机器学习是人工智能的一个实现途径
深度学习是机器学习的一个方法发展而来
1.1.2机器学习、深度学习能做些什么
传统预测
图像识别
自然语言处理
1.2什么是机器学习
数据、模型、预测
从历史数据中获得规律?这些历史数据是怎么的格式?
1.2.3数据集构成
特征值+目标值
1.3机器学习算法分类
监督学习
目标值:类别——分类问题
k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归
目标值:连续型的数据-回归问题
线性回归、岭回归
目标值:无-无监督学习
聚类 k-means
1、Predict what the temperature will be tomorrow? 回归
2、预测明天是阴、晴、雨? 分类
3、Face age prediction? 回归/分类
4、人脸识别 ? 分类
2.1数据集
2.1.1可用数据集
公司内部 百度
数据接口 花钱
数据集
学习阶段可以用的数据集:
1、sklearn
2、kaggle
3、UCI
1 Scikit-learn工具介绍
2.1.2sklearn数据集
sklearn.datasets
load_* 获取小规模数据集
from sklearn.datasets import load_iris
def datasets_demo():
"""
sklearn数据集使用
:return:
"""
# 获取数据集
iris = load_iris()
print("鸢尾花数据集:\n",iris)
print("鸢尾花数据集描述:\n", iris["DESCR"])
print("The name of the iris eigenvalue:\n", iris.feature_names)
print("Iris eigenvalues:\n", iris.data.shape)
return None
if __name__ == "__main__":
# 代码1:sklearn数据集使用
datasets_demo()运行如下(数据过多,展示部分)
fetch_* 获取大规模数据集
2 sklearn小数据集
sklearn.datasets.load_iris()
3 sklearn大数据集
sklearn.datasets.fetch_20newsgroups(data_home=None)
4 数据集的返回值
datasets.base.Bunch(继承自字典)
dict["key"] = values
bunch.key = values
思考:Whether the obtained data is used to train a model?
2.1.3数据集的划分
训练数据集:用于训练、构建模型
测试数据:is used in model checking,用于评估模型是否有效
测试集 20%~30%
sklearn.model_selection.train_test_split(arrays,*options)
训练集特征值,测试集特征值,训练集目标值,测试集目标值
x_train, x_test, y_train, y_test
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
def datasets_demo():
"""
sklearn数据集使用
:return:
"""
# 获取数据集
iris = load_iris()
print("鸢尾花数据集:\n",iris)
print("鸢尾花数据集描述:\n", iris["DESCR"])
print("The name of the iris eigenvalue:\n", iris.feature_names)
print("Iris eigenvalues:\n", iris.data.shape)
# 数据集的划分
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=22)
print("Features of the training dataset:\n", x_train, x_train.shape)
return None
if __name__ == "__main__":
# 代码1:sklearn数据集使用
datasets_demo()部分运行结果如下

边栏推荐
- 测试薪资这么高?刚毕业就20K
- In the WebView page of the UI automation test App, the processing method when the search bar has no search button
- Learning and finishing of probability theory 8: Geometric and hypergeometric distributions
- Index Mysql in order to optimize paper 02 】 【 10 kinds of circumstances and the principle of failure
- cross domain solution
- 【树莓派】树莓派调光
- UE4 opens doors with overlapping events
- 【8.2】代码源 - 【货币系统】【硬币】【新年的问题(数据加强版)】【三段式】
- 工业级远距离无线传输装置的功能有哪些?
- [8.3] Code Source - [meow ~ meow ~ meow~] [tree] [and]
猜你喜欢

【Mysql进阶优化篇02】索引失效的10种情况及原理

Solana NFT开发指南

flink reads mongodb data source
![Spark Basics [Introduction, Getting Started with WordCount Cases]](/img/90/ebe887db0f8c36895691dea05f62cf.png)
Spark Basics [Introduction, Getting Started with WordCount Cases]
![[MRCTF2020] Ezpop (detailed)](/img/19/920877ca36d1eda8d118637388ab05.png)
[MRCTF2020] Ezpop (detailed)

Use CH341A to program external Flash (W25Q16JV)

public static
List asList(T... a) What is the prototype? 
Event parse tree Drain3 usage and explanation

不看后悔,appium自动化环境完美搭建

UE4 通过与其它Actor互动开门
随机推荐
Based on holding YOLOv5 custom implementation of FacePose YOLO structure interpretation, YOLO data format conversion, YOLO process modification"
【树莓派】树莓派调光
4T硬盘剩余很多提示“No space left on device“磁盘空间不足
905. Interval selection
There are several common event handling methods in Swing?How to listen for events?
Redis key basic commands
iMedicalLIS监听程序(2)
什么是ASEMI光伏二极管,光伏二极管的作用
pyqt5 + socket 实现客户端A经socket服务器中转后主动向客户端B发送文件
Use Unity to publish APP to Hololens2 without pit tutorial
1007 Climb Stairs (greedy | C thinking)
Learning and finishing of probability theory 8: Geometric and hypergeometric distributions
重载运算符
Web3.0 Dapps - the road to the future financial world
Android interview question - how to write with his hands a non-blocking thread safe queue ConcurrentLinkedQueue?
36-Jenkins-Job迁移
mutillidae下载及安装
七夕节赚徽章拉
Cron(Crontab)--使用/教程/实例
BI业务分析思维:现金流量风控分析(二)信用、流动和投资风险