当前位置:网站首页>CPU、内存、显卡等硬件因素也影响着你的深度学习模型性能
CPU、内存、显卡等硬件因素也影响着你的深度学习模型性能
2022-08-04 21:25:00 【愚昧之山绝望之谷开悟之坡】
参考:https://posts.careerengine.us/p/5dcb5f53bb8d8844ea19cd0f
数据流动路径
假设我们现在有一批图片集放在硬盘当中,待读取进内存送入GPU运算,那么一般会经历以下流程:
cpu发出读取指令,从硬盘中找到图片数据,并存到内存中;
cpu从内存中取出一批数据,转化为numpy array,并作数据预处理/增强操作,如翻转、平移、颜色变换等。处理完毕后送回内存。
cpu内存(后面简称内存)和gpu内存(后面简称显存)各开辟一块缓冲区,内存中的一个batch的数据通过PCIe通道传输到显存当中。
GPU核心从显存中获取数据进行并行计算,计算结果返回至显存中。
计算好的结果将从显存经过PCIe通道返回到内存。
这5个步骤涉及到几个影响数据传输速度的环节:
硬盘读取速度;
PCIe传输速度;
内存读写速度;
cpu频率。
我们首先来说说硬盘。
硬件的瓶颈之后就是软件层面的多线程
边栏推荐
猜你喜欢
mdk5.14无法烧录
js data type, throttling/anti-shake, click event delegation optimization, transition animation
SAP ABAP OData 服务如何支持 $select 有选择性地仅读取部分模型字段值试读版
知识分享|如何设计有效的帮助中心,不妨来看看以下几点
Zynq Fpga图像处理之AXI接口应用——axi_lite接口使用
buu web
【uiautomation】微信好友列表获取(存储到txt中)
Android 面试——如何写一个又好又快的日志库?
SPSS-unary regression practice
【2022杭电多校5 1012题 Buy Figurines】STL的运用
随机推荐
JdbcTemplate概述和测试
链栈的应用
1319_STM32F103串口BootLoader移植
JWT主动校验Token是否过期
PowerCLi 批量配置NTP
C#之app.config、exe.config和vshost.exe.config作用区别
3. Byte stream and character stream of IO stream
NFT宝典:你需要知道NFT的术语和定义
Win11如何开启Telnet客户端?
搬走地下空间开发利用“绊脚石” 中地数码取得地下空间透明化技术突破
数电快速入门(二)(复合逻辑运算和逻辑代数的基本定律的介绍)
如何为Web3.0世界启动完美的DAO
mysql基础
ue unreal 虚幻 高分辨率无缩放 编辑器字太小 调整编辑器整体缩放
AXI interface application of Zynq Fpga image processing - the use of axi_lite interface
Moke, dynamic image resource package display
Pinduoduo open platform order information query interface [pdd.order.basic.list.get order basic information list query interface (according to transaction time)] code docking tutorial
adb控制常用命令
y87.第五章 分布式链路追踪系统 -- 分布式链路追踪系统起源(一)
Re24:读论文 IOT-Match Explainable Legal Case Matching via Inverse Optimal Transport-based Rationale Ext