当前位置:网站首页>MNIST是什么(plist是什么意思)
MNIST是什么(plist是什么意思)
2022-08-01 11:07:00 【全栈程序员站长】
大家好,又见面了,我是你们的朋友全栈君。
初始的迷茫
我想很多菜鸟和我一样,开始零基础学习机器学习,没办法火啊,为了钱大家都是冲呀。估计很多人开始学习ML,就一头雾水,完全不知道在说什么。因为学习模式和学习其他语言完全不同,我们知道学习其他语言的时候,第一个程序就是打印“Hello World”。
其实机器学习是在某个框架下,使用某种语言,来解决问题。因此对于零基础的菜鸟而言,我们需要先学习好某种语言,可以推荐Python,因为功能强大,而且语法相对简单,也可以使用C++。框架呢,个人推荐是TensorFlow2,因为google的大腿粗啊。
什么是MNIST
建议在了解Python后,开始在TF2的框架下进行。
机器学习的入门就是MNIST。MNIST 数据集来自美国国家标准与技术研究所,是NIST(National Institute of Standards and Technology)的缩小版,训练集(training set)由来自 250 个不同人手写的数字构成,其中 50% 是高中学生,50% 来自人口普查局(the Census Bureau)的工作人员,测试集(test set)也是同样比例的手写数字数据。
获取MNIST
MNIST 数据集可在http://yann.lecun.com/exdb/mnist/获取,图片是以字节的形式进行存储,它包含了四个部分:
- Training set images: train-images-idx3-ubyte.gz (9.9 MB, 解压后 47 MB, 包含 60,000 个样本)
- Training set labels: train-labels-idx1-ubyte.gz (29 KB, 解压后 60 KB, 包含 60,000 个标签)
- Test set images: t10k-images-idx3-ubyte.gz (1.6 MB, 解压后 7.8 MB, 包含 10,000 个样本)
- Test set labels: t10k-labels-idx1-ubyte.gz (5KB, 解压后 10 KB, 包含 10,000 个标签)
此数据集中,训练样本:共60000个,其中55000个用于训练,另外5000个用于验证。测试样本:共10000个,验证数据比例相同。
数据集中像素值:
a)使用python读取二进制文件方法读取mnist数据集,则读进来的图像像素值为0-255之间;标签是0-9的数值。
b)采用TensorFlow的封装的函数读取mnist,则读进来的图像像素值为0-1之间;标签是0-1值组成的大小为1*10的行向量。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/126875.html原文链接:https://javaforall.cn
边栏推荐
- 4种常见的鉴权方式及说明
- [Cloud Residency Co-Creation] Huawei Cloud Global Scheduling Technology and Practice of Distributed Technology
- 开天aPaaS之移动手机号码空号检测【开天aPaaS大作战】
- The first experience of Shengsi large model experience platform——Take the small model LeNet as an example
- 在线GC日志分析工具——GCeasy
- Pve delete virtual machine "for a collection"
- leetcode/子矩阵元素和
- retired paddling
- 数字化转型实践:世界级2B数字化营销的方法框架
- 基于ModelArts的物体检测YOLOv3实践【玩转华为云】
猜你喜欢
随机推荐
The meaning and trigger conditions of gc
Hot review last week (7.25 7.31)
WPF 截图控件之绘制箭头(五)「仿微信」
Small application project works WeChat gourmet recipes applet graduation design of finished product (1) the development profile
Introduction to data warehouse layering (real-time data warehouse architecture)
Ts-Map 类的使用
在线GC日志分析工具——GCeasy
上周热点回顾(7.25-7.31)
Glassmorphism design style
mysql进阶(二十二)MySQL错误之Incorrect string value中文字符输入错误问题分析
Push the local project to the remote repository
利用正则表达式的回溯实现绕过
EasyRecovery热门免费数据检测修复软件
.NET analyzes the LINQ framework in depth (three: the elegant prelude of LINQ)
大众碰到点评的一个字体反爬,落地技术也是绝了
Dapr 与 NestJs ,实战编写一个 Pub & Sub 装饰器
Jenkins安装插件遇到的问题
深度学习 | MATLAB实现一维卷积神经网络convolution1dLayer参数设定
DBPack SQL Tracing 功能及数据加密功能详解
昇思大模型体验平台初体验——以小模型LeNet为例