当前位置:网站首页>Machine Learning Overview
Machine Learning Overview
2022-08-05 04:11:00 【Mika grains】
1.1人工智能概述
达特茅斯会议-人工智能的起点
机器学习是人工智能的一个实现途径
深度学习是机器学习的一个方法发展而来
1.1.2机器学习、深度学习能做些什么
传统预测
图像识别
自然语言处理
1.2什么是机器学习
数据、模型、预测
从历史数据中获得规律?这些历史数据是怎么的格式?
1.2.3数据集构成
特征值+目标值
1.3机器学习算法分类
监督学习
目标值:类别——分类问题
k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归
目标值:连续型的数据-回归问题
线性回归、岭回归
目标值:无-无监督学习
聚类 k-means
1、Predict what the temperature will be tomorrow? 回归
2、预测明天是阴、晴、雨? 分类
3、Face age prediction? 回归/分类
4、人脸识别 ? 分类
2.1数据集
2.1.1可用数据集
公司内部 百度
数据接口 花钱
数据集
学习阶段可以用的数据集:
1、sklearn
2、kaggle
3、UCI
1 Scikit-learn工具介绍
2.1.2sklearn数据集
sklearn.datasets
load_* 获取小规模数据集
from sklearn.datasets import load_iris
def datasets_demo():
"""
sklearn数据集使用
:return:
"""
# 获取数据集
iris = load_iris()
print("鸢尾花数据集:\n",iris)
print("鸢尾花数据集描述:\n", iris["DESCR"])
print("The name of the iris eigenvalue:\n", iris.feature_names)
print("Iris eigenvalues:\n", iris.data.shape)
return None
if __name__ == "__main__":
# 代码1:sklearn数据集使用
datasets_demo()
运行如下(数据过多,展示部分)
fetch_* 获取大规模数据集
2 sklearn小数据集
sklearn.datasets.load_iris()
3 sklearn大数据集
sklearn.datasets.fetch_20newsgroups(data_home=None)
4 数据集的返回值
datasets.base.Bunch(继承自字典)
dict["key"] = values
bunch.key = values
思考:Whether the obtained data is used to train a model?
2.1.3数据集的划分
训练数据集:用于训练、构建模型
测试数据:is used in model checking,用于评估模型是否有效
测试集 20%~30%
sklearn.model_selection.train_test_split(arrays,*options)
训练集特征值,测试集特征值,训练集目标值,测试集目标值
x_train, x_test, y_train, y_test
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
def datasets_demo():
"""
sklearn数据集使用
:return:
"""
# 获取数据集
iris = load_iris()
print("鸢尾花数据集:\n",iris)
print("鸢尾花数据集描述:\n", iris["DESCR"])
print("The name of the iris eigenvalue:\n", iris.feature_names)
print("Iris eigenvalues:\n", iris.data.shape)
# 数据集的划分
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=22)
print("Features of the training dataset:\n", x_train, x_train.shape)
return None
if __name__ == "__main__":
# 代码1:sklearn数据集使用
datasets_demo()
部分运行结果如下
边栏推荐
- 905. Interval selection
- 开发属于自己的node包
- 不看后悔,appium自动化环境完美搭建
- Some conventional routines of program development (1)
- 大佬们,我注意到mysql cdc connector有参数scan.incremental.sna
- A 35-year-old software testing engineer with a monthly salary of less than 2W, resigns and is afraid of not finding a job, what should he do?
- 数组常用方法总结
- 【Mysql进阶优化篇02】索引失效的10种情况及原理
- Hard power or soft power, which is more important to testers?
- JeeSite新建报表
猜你喜欢
概率论的学习和整理8: 几何分布和超几何分布
36-Jenkins-Job迁移
UE4 第一人称角色模板 添加冲刺(加速)功能
测试薪资这么高?刚毕业就20K
[Software testing] unittest framework for automated testing
[MRCTF2020] Ezpop (detailed)
UE4 通过互动(键盘按键)开门
如何解决复杂的分销分账问题?
There are several common event handling methods in Swing?How to listen for events?
The most effective seven performance testing techniques of software testing techniques
随机推荐
Walter talked little knowledge | "remote passthrough" that something
How to wrap markdown - md file
【8.4】代码源 - 【数学】【历法】【删库】【不朴素的数列(Bonus)】
Mysql's redo log detailed explanation
Slapped in the face: there are so many testers in a certain department of byte
2022 Hangzhou Electric Multi-School 1st Game
[BSidesCF 2019]Kookie
Learning and finishing of probability theory 8: Geometric and hypergeometric distributions
[Software testing] unittest framework for automated testing
Redis key basic commands
特征预处理
The first performance test practice, there are "100 million" a little nervous
C+ +核心编程
Shell script: for loop and the while loop
UE4 第一人称角色模板 添加蹲伏功能
Hard power or soft power, which is more important to testers?
包拉链不可用,但是是被另一个包。
In the WebView page of the UI automation test App, the processing method when the search bar has no search button
BI业务分析思维:现金流量风控分析(二)信用、流动和投资风险
Mathematics - Properties of Summation Symbols