当前位置:网站首页>Jetson XAVIER NX上ResUnet-TensorRT8.2速度与显存记录表(后续不断补充)
Jetson XAVIER NX上ResUnet-TensorRT8.2速度与显存记录表(后续不断补充)
2022-07-02 19:07:00 【少有人走的路_心智旅程】
ResUnet-TensorRT8.2速度与显存记录表
精度 | 模式 | 图像尺寸 | 类别数 | 批次 | 线程数 | 推理时间 | 完整处理时间 | 显存 |
---|---|---|---|---|---|---|---|---|
FP32 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 168ms | 179ms | 2.2G |
FP32 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 172ms | 184ms | 3.0G |
FP16 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 58ms | 68ms | 1.6G |
FP16 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 58ms | 68ms | 1.9G |
FP32 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 167ms | 209ms | 2.2G |
FP32 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 170ms | 234ms | 3.0G |
FP16 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 57ms | 97ms | 1.6G |
FP16 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 58ms | 106ms | 1.9G |
说明:
1.模式是指Jetson设备的功耗模式,对于本人的Jetson XAVIER NX来说,总共有8种模式,如果想达到最大推理速度的话,选择20W 2CORE模式。在主界面的右上角有个MODE的选择,选择20W 2CORE模式即可。
(本人选择20W 6CORE测试下来跟20W 2CORE差不多,只快了1ms,所以选择20W 2CORE即可)
2.推理时间是指平均每张图进行doInference(即执行cudaMemcpyAsync)所需要的推理时间。
完整处理时间推理时间加上前处理与后处理时间。
3.对于Jetson设备来说,CPU和GPU共用,所以显存就是内存。对于Jetson XAVIER NX来说内存总共8G。
而查看的方式不能直接使用nvidia-smi的命令行,必须安装jetson-stats。
具体操作方式可参考以下博客。
Jetson设备上查看显存(内存)——jetson-stats
4.为什么本人会有8个模式,而且这个系统下的TensorRT是8.2.1.8版本,不是7版本,猜测原因是在最初烧录系统的时候使用的镜像是比较新的。
而且相比TensorRT7版本,速度快了近20ms,具体可以看本人之前的博客。
Jetson XAVIER NX上ResUnet-TensorRT7速度与显存记录表(后续不断补充)
边栏推荐
- Implementation of 453 ATOI function
- Development skills of rxjs observable custom operator
- 台湾SSS鑫创SSS1700替代Cmedia CM6533 24bit 96KHZ USB音频编解码芯片
- Why do I have a passion for process?
- Kt148a voice chip IC user end self replacement voice method, upper computer
- burp 安装 license key not recognized
- KT148A语音芯片ic的开发常见问题以及描述
- 解决方案:VS2017 无法打开源文件 stdio.h main.h 等头文件[通俗易懂]
- 面试经验总结,为你的offer保驾护航,满满的知识点
- R语言使用econocharts包创建微观经济或宏观经济图、indifference函数可视化无差异曲线(indifference curve)
猜你喜欢
基于SSM实现网上购物商城系统
RPD出品:Superpower Squad 保姆级攻略
One side is volume, the other side is layoff. There are a lot of layoffs in byte commercialization department. What do you think of this wave?
【NLP】一文详解生成式文本摘要经典论文Pointer-Generator
Zabbix5 client installation and configuration
面试经验总结,为你的offer保驾护航,满满的知识点
Automatically generate VGg image annotation file
Conscience summary! Jupyter notebook from Xiaobai to master, the nanny tutorial is coming!
c语言链表--待补充
B端电商-订单逆向流程
随机推荐
Istio deployment: quickly start microservices,
c语言里怎么设立优先级,细说C语言优先级
【NLP】一文详解生成式文本摘要经典论文Pointer-Generator
sql-labs
JASMINER X4 1U deep disassembly reveals the secret behind high efficiency and power saving
分享几个图床网址,便于大家分享图片
【Hot100】22. bracket-generating
esp32c3 crash分析
功能、作用、效能、功用、效用、功效
How can testers do without missing tests? Seven o'clock is enough
Dictionaries
KT148A语音芯片ic的用户端自己更换语音的方法,上位机
Function, function, efficiency, function, utility, efficacy
ShardingSphere-JDBC5.1.2版本关于SELECT LAST_INSERT_ID()本人发现还是存在路由问题
AcWing 1127. Sweet butter solution (shortest path SPFA)
简书自动阅读
for(auto a : b)和for(auto &a : b)用法
《MongoDB入门教程》第03篇 MongoDB基本概念
Postman接口测试实战,这5个问题你一定要知道
面试经验总结,为你的offer保驾护航,满满的知识点