当前位置:网站首页>ImageNet下载及处理
ImageNet下载及处理
2022-08-02 19:42:00 【harry_tea】
数据集下载
进入官网https://www.image-net.org/,点击Download(注意ImageNet的下载是需要注册的,这里自行注册即可)。我们要下载的ImageNet其实都是12年的版本,在下面找到ImageNet Large-scale Visual Recognition Challenge (ILSVRC)点击2012进入下载
当时用来比赛的ImageNet是用来做多个任务的,但是我们预训练只需要分类的那个任务,所以找到下面的Images,训练集找到138GB的那个(task1 & 2),验证集是6.3GB的那个,测试集是13GB的那个。然后等待下载即可
数据集处理
下载完后我们有三个压缩文件,ImageNet有1000个类别,我们最后要处理成什么形式呢。就是下面这种train,val然后训练和验证集里面都有100类的文件夹形式
# imagenet/train/
# ├── n01440764
# │ ├── n01440764_10026.JPEG
# │ ├── n01440764_10027.JPEG
# │ ├── ......
# ├── ......
# imagenet/val/
# ├── n01440764
# │ ├── ILSVRC2012_val_00000293.JPEG
# │ ├── ILSVRC2012_val_00002138.JPEG
# │ ├── ......
# ├── ......
这个pytorch已经有shell脚本可以自动处理了
按照说明运行即可extract_ILSVRC.sh
这里处理的时候遇到一个问题,服务器没法上网,所以其中的62行wget那个命令无法使用,这里我直接在本地新建了一个sh文件,然后把对应链接的内容复制进去了,然后传到服务器val文件夹下,运行bash xx.sh即可
注意: 如果实在win下写的sh文件在linux上是无法直接运行的,会报这样一个错误line 2: $‘\r’: command not found。这是因为win写脚本时每一行后面会加\r\n,而linux是\n
解决
- sed -i ‘s/\r//’ test.sh
- sudo apt install dos2unix,运行dos2unix xx.sh修复
边栏推荐
- golang刷leetcode 经典(13) 最小高度树
- Leetcode刷题——单调栈问题(739每日温度问题、496下一个更大元素I、503下一个更大元素 II)
- 译出我精彩 | 7月墨力翻译计划获奖名单公布
- Redis cluster configuration
- SQL-UDT是什么功能?
- Geoserver+mysql+openlayers
- 网络协议介绍
- MaxCompute 近期发布上线的版本的 SQL 引擎新功能参数化视图有什么优势?
- Office2021 安装MathType
- Brain-computer interface 003 | Musk said that he has realized a virtual self-dialogue with the cloud, and related concept shares have risen sharply
猜你喜欢
随机推荐
译出我精彩 | 7月墨力翻译计划获奖名单公布
es DELETE index 源码分析
解析List接口中的常用的被实现子类重写的方法
You want the metagenomics - microbiome knowledge in all the (2022.8)
2022-07-26
OpenCV开发中的内存管理问题
PG 之 SQL执行计划
LeetCode:622. 设计循环队列【模拟循环队列】
Introduction of uncommon interfaces of openlayers
GNN教程:图神经网络基础知识!
笑话:如果你在河边等待得足够久,你会看到你的敌人的尸体漂过,是怎么翻译出来的?
服务器Centos7 静默安装Oracle Database 12.2
Caldera(二)高级实战
Electron使用指南之初体验
Geoserver+mysql+openlayers2
Caldera(一)配置完成的虚拟机镜像及admin身份简单使用
4 kmiles join YiSheng group, with more strong ability of digital business, accelerate China's cross-border electricity full domain full growth
What is a Field Service Management System (FSM)?what is the benefit?
Fiddle设置接口数据用指定工具查看;Sublime Text设置json数据格式化转换
程序员也许都缺一个“二舅”精神









