当前位置:网站首页>Jetson XAVIER NX上ResUnet-TensorRT8.2速度与显存记录表(后续不断补充)
Jetson XAVIER NX上ResUnet-TensorRT8.2速度与显存记录表(后续不断补充)
2022-07-02 19:07:00 【少有人走的路_心智旅程】
ResUnet-TensorRT8.2速度与显存记录表
| 精度 | 模式 | 图像尺寸 | 类别数 | 批次 | 线程数 | 推理时间 | 完整处理时间 | 显存 |
|---|---|---|---|---|---|---|---|---|
| FP32 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 168ms | 179ms | 2.2G |
| FP32 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 172ms | 184ms | 3.0G |
| FP16 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 58ms | 68ms | 1.6G |
| FP16 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 58ms | 68ms | 1.9G |
| FP32 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 167ms | 209ms | 2.2G |
| FP32 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 170ms | 234ms | 3.0G |
| FP16 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 57ms | 97ms | 1.6G |
| FP16 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 58ms | 106ms | 1.9G |
说明:
1.模式是指Jetson设备的功耗模式,对于本人的Jetson XAVIER NX来说,总共有8种模式,如果想达到最大推理速度的话,选择20W 2CORE模式。在主界面的右上角有个MODE的选择,选择20W 2CORE模式即可。
(本人选择20W 6CORE测试下来跟20W 2CORE差不多,只快了1ms,所以选择20W 2CORE即可)

2.推理时间是指平均每张图进行doInference(即执行cudaMemcpyAsync)所需要的推理时间。
完整处理时间推理时间加上前处理与后处理时间。
3.对于Jetson设备来说,CPU和GPU共用,所以显存就是内存。对于Jetson XAVIER NX来说内存总共8G。
而查看的方式不能直接使用nvidia-smi的命令行,必须安装jetson-stats。
具体操作方式可参考以下博客。
Jetson设备上查看显存(内存)——jetson-stats
4.为什么本人会有8个模式,而且这个系统下的TensorRT是8.2.1.8版本,不是7版本,猜测原因是在最初烧录系统的时候使用的镜像是比较新的。
而且相比TensorRT7版本,速度快了近20ms,具体可以看本人之前的博客。
Jetson XAVIER NX上ResUnet-TensorRT7速度与显存记录表(后续不断补充)
边栏推荐
- 蓝牙芯片ble是什么,以及该如何选型,后续技术发展的路径是什么
- 【每日一题】241. 为运算表达式设计优先级
- 接口测试到底怎么做?看完这篇文章就能清晰明了
- HDL design peripheral tools to reduce errors and help you take off!
- AcWing 1135. Happy New Year (shortest path + search)
- KT148A语音芯片ic的开发常见问题以及描述
- Use IDM to download Baidu online disk files (useful for personal testing) [easy to understand]
- pytorch 模型保存的完整例子+pytorch 模型保存只保存可训练参数吗?是(+解决方案)
- R语言使用econocharts包创建微观经济或宏观经济图、indifference函数可视化无差异曲线(indifference curve)
- 解决方案:VS2017 无法打开源文件 stdio.h main.h 等头文件[通俗易懂]
猜你喜欢

八年测开经验,面试28K公司后,吐血整理出高频面试题和答案

How can testers do without missing tests? Seven o'clock is enough

Implementation of online shopping mall system based on SSM

Génération automatique de fichiers d'annotation d'images vgg

Self-Improvement! Daliangshan boys all award Zhibo! Thank you for your paper

RPD出品:Superpower Squad 保姆级攻略

Postman interface test practice, these five questions you must know

Educational codeforces round 129 (rated for Div. 2) supplementary problem solution

蓝牙芯片ble是什么,以及该如何选型,后续技术发展的路径是什么

pytorch 模型保存的完整例子+pytorch 模型保存只保存可訓練參數嗎?是(+解决方案)
随机推荐
中缀表达式转换为后缀表达式(C语言代码+详解)
Kt148a voice chip instructions, hardware, protocols, common problems, and reference codes
RPD product: super power squad nanny strategy
KT148A语音芯片ic的用户端自己更换语音的方法,上位机
[JS] get the search parameters of URL in hash mode
c语言链表--待补充
Introduction to mongodb chapter 03 basic concepts of mongodb
Correspondence between pytoch version, CUDA version and graphics card driver version
Kt148a voice chip IC user end self replacement voice method, upper computer
SQLite 3.39.0 发布,支持右外连接和全外连接
AcWing 1126. Minimum cost solution (shortest path Dijkstra)
自动化制作视频
Istio1.12:安装和快速入门
KT148A语音芯片ic的软件参考代码C语言,一线串口
笔记本安装TIA博途V17后出现蓝屏的解决办法
Exemple complet d'enregistrement du modèle pytoch + enregistrement du modèle pytoch seuls les paramètres d'entraînement sont - ils enregistrés? Oui (+ Solution)
KT148A语音芯片使用说明、硬件、以及协议、以及常见问题,和参考代码
多端小程序开发有什么好处?覆盖百度小程序抖音小程序微信小程序开发,抢占多平台流量红利
R语言使用econocharts包创建微观经济或宏观经济图、indifference函数可视化无差异曲线(indifference curve)
ShardingSphere-JDBC5.1.2版本关于SELECT LAST_INSERT_ID()本人发现还是存在路由问题