当前位置:网站首页>CPU、内存、显卡等硬件因素也影响着你的深度学习模型性能
CPU、内存、显卡等硬件因素也影响着你的深度学习模型性能
2022-08-04 21:25:00 【愚昧之山绝望之谷开悟之坡】
参考:https://posts.careerengine.us/p/5dcb5f53bb8d8844ea19cd0f
数据流动路径
假设我们现在有一批图片集放在硬盘当中,待读取进内存送入GPU运算,那么一般会经历以下流程:
cpu发出读取指令,从硬盘中找到图片数据,并存到内存中;
cpu从内存中取出一批数据,转化为numpy array,并作数据预处理/增强操作,如翻转、平移、颜色变换等。处理完毕后送回内存。
cpu内存(后面简称内存)和gpu内存(后面简称显存)各开辟一块缓冲区,内存中的一个batch的数据通过PCIe通道传输到显存当中。
GPU核心从显存中获取数据进行并行计算,计算结果返回至显存中。
计算好的结果将从显存经过PCIe通道返回到内存。
这5个步骤涉及到几个影响数据传输速度的环节:
硬盘读取速度;
PCIe传输速度;
内存读写速度;
cpu频率。
我们首先来说说硬盘。
硬件的瓶颈之后就是软件层面的多线程
边栏推荐
猜你喜欢

Hands-on Deep Learning_NiN

How to understand the crawler's Scrapy framework in the simplest and most popular way?

mdk5.14无法烧录

buu web

如何为Web3.0世界启动完美的DAO

【PCBA program design】Grip dynamometer program

2、字符集-编码-解码

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd6 in position 120: invalid continuation byte

Android 面试——如何写一个又好又快的日志库?

Spss-一元回归实操
随机推荐
ue unreal 虚幻 高分辨率无缩放 编辑器字太小 调整编辑器整体缩放
laravel whereDoesntHave
matlab drawing
buu web
[Teach you to use the serial port idle interrupt of the STM32HAL library]
数电快速入门(三)(卡诺图化简法的介绍)
【编程思想】
SPSS-System Clustering Hand Calculation Practice
dotnet compress Stream or file using lz4net
数据仓库(1)什么是数据仓库,数仓有什么特点
开发deepstram的自定义插件,使用gst-dseaxmple插件进行扩充,实现deepstream图像输出前的预处理,实现图像自定义绘制图(精四)
web漏洞扫描器-awvs
SPSS-unary regression practice
PRIMAL: Pathfinding via Reinforcement and Imitation Multi-Agent Learning 代码解析
unity2D横版游戏教程8-音效
C语言知识大全(一)——C语言概述,数据类型
OD-Model [6]: YOLOv2
js data type, throttling/anti-shake, click event delegation optimization, transition animation
dotnet 删除只读文件
88. (the home of cesium) cesium polymerization figure