当前位置:网站首页>CPU、内存、显卡等硬件因素也影响着你的深度学习模型性能
CPU、内存、显卡等硬件因素也影响着你的深度学习模型性能
2022-08-04 21:25:00 【愚昧之山绝望之谷开悟之坡】
参考:https://posts.careerengine.us/p/5dcb5f53bb8d8844ea19cd0f
数据流动路径
假设我们现在有一批图片集放在硬盘当中,待读取进内存送入GPU运算,那么一般会经历以下流程:
cpu发出读取指令,从硬盘中找到图片数据,并存到内存中;
cpu从内存中取出一批数据,转化为numpy array,并作数据预处理/增强操作,如翻转、平移、颜色变换等。处理完毕后送回内存。
cpu内存(后面简称内存)和gpu内存(后面简称显存)各开辟一块缓冲区,内存中的一个batch的数据通过PCIe通道传输到显存当中。
GPU核心从显存中获取数据进行并行计算,计算结果返回至显存中。
计算好的结果将从显存经过PCIe通道返回到内存。
这5个步骤涉及到几个影响数据传输速度的环节:
硬盘读取速度;
PCIe传输速度;
内存读写速度;
cpu频率。
我们首先来说说硬盘。
硬件的瓶颈之后就是软件层面的多线程
边栏推荐
猜你喜欢
随机推荐
后缀式的计算
[21 days learning challenge - kernel notes] (2), based in the device tree
实战:10 种实现延迟任务的方法,附代码!
链队
8 年产品经验,我总结了这些持续高效研发实践经验 · 协同篇
dotnet 使用 lz4net 压缩 Stream 或文件
stm32mp157系统移植 | 移植ST官方5.10内核到小熊派开发板
大势所趋之下的nft拍卖,未来艺术品的新赋能
Win11如何开启Telnet客户端?
【编程思想】
经验分享|盘点企业进行知识管理时的困惑类型
某男子因用本地虚拟机做压测,惨遭字节面试官当场嘲笑
How to understand the crawler's Scrapy framework in the simplest and most popular way?
PowerCLi batch configuration of NTP
如何一键重装win7系统?重装win7系统详细教程
3、IO流之字节流和字符流
使用堡塔应用管理器配置laravel队列方法
【1403. 非递增顺序的最小子序列】
LayaBox---TypeScript---结构
结构体小结









