当前位置:网站首页>MNIST是什么(plist是什么意思)
MNIST是什么(plist是什么意思)
2022-08-01 11:07:00 【全栈程序员站长】
大家好,又见面了,我是你们的朋友全栈君。
初始的迷茫
我想很多菜鸟和我一样,开始零基础学习机器学习,没办法火啊,为了钱大家都是冲呀。估计很多人开始学习ML,就一头雾水,完全不知道在说什么。因为学习模式和学习其他语言完全不同,我们知道学习其他语言的时候,第一个程序就是打印“Hello World”。
其实机器学习是在某个框架下,使用某种语言,来解决问题。因此对于零基础的菜鸟而言,我们需要先学习好某种语言,可以推荐Python,因为功能强大,而且语法相对简单,也可以使用C++。框架呢,个人推荐是TensorFlow2,因为google的大腿粗啊。
什么是MNIST
建议在了解Python后,开始在TF2的框架下进行。
机器学习的入门就是MNIST。MNIST 数据集来自美国国家标准与技术研究所,是NIST(National Institute of Standards and Technology)的缩小版,训练集(training set)由来自 250 个不同人手写的数字构成,其中 50% 是高中学生,50% 来自人口普查局(the Census Bureau)的工作人员,测试集(test set)也是同样比例的手写数字数据。
获取MNIST
MNIST 数据集可在http://yann.lecun.com/exdb/mnist/获取,图片是以字节的形式进行存储,它包含了四个部分:
- Training set images: train-images-idx3-ubyte.gz (9.9 MB, 解压后 47 MB, 包含 60,000 个样本)
- Training set labels: train-labels-idx1-ubyte.gz (29 KB, 解压后 60 KB, 包含 60,000 个标签)
- Test set images: t10k-images-idx3-ubyte.gz (1.6 MB, 解压后 7.8 MB, 包含 10,000 个样本)
- Test set labels: t10k-labels-idx1-ubyte.gz (5KB, 解压后 10 KB, 包含 10,000 个标签)
此数据集中,训练样本:共60000个,其中55000个用于训练,另外5000个用于验证。测试样本:共10000个,验证数据比例相同。
数据集中像素值:
a)使用python读取二进制文件方法读取mnist数据集,则读进来的图像像素值为0-255之间;标签是0-9的数值。
b)采用TensorFlow的封装的函数读取mnist,则读进来的图像像素值为0-1之间;标签是0-1值组成的大小为1*10的行向量。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/126875.html原文链接:https://javaforall.cn
边栏推荐
猜你喜欢
大众碰到点评的一个字体反爬,落地技术也是绝了
C#/VB.NET 将PPT或PPTX转换为图像
OpenHarmony高校技术俱乐部计划发布
稀疏表示--学习笔记
.NET深入解析LINQ框架(三:LINQ优雅的前奏)
回归预测 | MATLAB实现TPA-LSTM(时间注意力注意力机制长短期记忆神经网络)多输入单输出
博弈论(Depu)与孙子兵法(42/100)
Mini Program Graduation Works WeChat Food Recipes Mini Program Graduation Design Finished Products (3) Background Functions
Why Metropolis–Hastings Works
Flutter Widget 如何启用和屏蔽点击事件
随机推荐
Guangyu Mingdao was selected into the list of pilot demonstration projects for the development of digital economy industry in Chongqing in 2022
Promise learning (2) An article takes you to quickly understand the common APIs in Promise
The use of Ts - Map type
activiti工作流的分页查询避坑
深度学习 | MATLAB实现GRU门控循环单元gruLayer参数设定
利用正则表达式的回溯实现绕过
[Nodejs] node的fs模块
shell--第九章练习
R语言检验时间序列的平稳性:使用tseries包的adf.test函数实现增强的Dickey-Fuller(ADF)检验、检验时序数据是否具有均值回归特性(平稳性)、具有均值回归特性的案例
在线GC日志分析工具——GCeasy
退役划水
小程序毕设作品之微信美食菜谱小程序毕业设计成品(1)开发概要
MFC implementation road map navigation system
jmeter
我是如何保护 70000 ETH 并赢得 600 万漏洞赏金的
R语言ggplot2可视化:使用ggpubr包的ggdensity函数可视化密度图、使用stat_central_tendency函数在密度中添加均值竖线并自定义线条类型
Kaitian aPaaS mobile phone number empty number detection [Kaitian aPaaS battle]
The difference between undefined and null in JS
复现assert和eval成功连接或失败连接蚁剑的原因
pgAdmin 4 v6.12 发布,PostgreSQL 开源图形化管理工具