当前位置:网站首页>ImageNet下载及处理
ImageNet下载及处理
2022-08-02 19:42:00 【harry_tea】
数据集下载
进入官网https://www.image-net.org/,点击Download(注意ImageNet的下载是需要注册的,这里自行注册即可)。我们要下载的ImageNet其实都是12年的版本,在下面找到ImageNet Large-scale Visual Recognition Challenge (ILSVRC)点击2012进入下载
当时用来比赛的ImageNet是用来做多个任务的,但是我们预训练只需要分类的那个任务,所以找到下面的Images,训练集找到138GB的那个(task1 & 2),验证集是6.3GB的那个,测试集是13GB的那个。然后等待下载即可
数据集处理
下载完后我们有三个压缩文件,ImageNet有1000个类别,我们最后要处理成什么形式呢。就是下面这种train,val然后训练和验证集里面都有100类的文件夹形式
# imagenet/train/
# ├── n01440764
# │ ├── n01440764_10026.JPEG
# │ ├── n01440764_10027.JPEG
# │ ├── ......
# ├── ......
# imagenet/val/
# ├── n01440764
# │ ├── ILSVRC2012_val_00000293.JPEG
# │ ├── ILSVRC2012_val_00002138.JPEG
# │ ├── ......
# ├── ......
这个pytorch已经有shell脚本可以自动处理了
按照说明运行即可extract_ILSVRC.sh
这里处理的时候遇到一个问题,服务器没法上网,所以其中的62行wget那个命令无法使用,这里我直接在本地新建了一个sh文件,然后把对应链接的内容复制进去了,然后传到服务器val文件夹下,运行bash xx.sh即可
注意: 如果实在win下写的sh文件在linux上是无法直接运行的,会报这样一个错误line 2: $‘\r’: command not found。这是因为win写脚本时每一行后面会加\r\n,而linux是\n
解决
- sed -i ‘s/\r//’ test.sh
- sudo apt install dos2unix,运行dos2unix xx.sh修复
边栏推荐
- Caldera(二)高级实战
- 分享一个 web 应用版本监测 (更新) 的工具库
- [安洵杯 2019]easy_web
- LeetCode:622. 设计循环队列【模拟循环队列】
- 【 LeetCode 】 1374. Generate each character string is an odd number
- AI Scientist: Automatically discover hidden state variables of physical systems
- VMware虚拟机无法上网
- 如何解决图像分类中的类别不均衡问题?不妨试试分开学习表征和分类器
- 遇上Mysql亿级优化,怎么办
- Electron使用指南之初体验
猜你喜欢
磁盘分区的知识
Detailed explanation of common examples of dynamic programming
Office2021 安装MathType
实战:10 种实现延迟任务的方法,附代码!
译出我精彩 | 7月墨力翻译计划获奖名单公布
SQL Server安装教程
JWT学习
技术分享 | Apache Linkis 快速集成网页IDE工具 Scriptis
对话亚洲高校首个博士论文奖-裘捷中丨KDD2022
Based on OpenGL glaciers and firebird (illumination calculation model, visual, particle system)
随机推荐
Compose主题切换——让你的APP也能一键换肤
SQL server有什么认证吗?
健康报告-设计与实现
MySQL安装配置教程(超级详细)
A Review of Nature Microbiology: Focusing on the Algae--Ecological Interface of Phytoplankton-Bacteria Interactions
[AnXun cup 2019] easy_web
Redis集群配置
NC | Structure and function of soil microbiome reveal N2O release from global wetlands
es 官方诊断工具
一些不错的博主
Electron User Guide Beginning Experience
【StoneDB性能相关工具】内存监控
golang刷leetcode 经典(10) tire树与ac自动机
SQL 入门之第一讲——MySQL 8.0.29安装教程(windows 64位)
ECCV 2022 | 通往数据高效的Transformer目标检测器
4 kmiles join YiSheng group, with more strong ability of digital business, accelerate China's cross-border electricity full domain full growth
SQL 嵌套 N 层太长太难写怎么办?
线性表(顺序表和链表)
基于“无依赖绝对定位”实现的圣杯三栏布局
golang刷leetcode 经典(13) 最小高度树