当前位置:网站首页>Jetson XAVIER NX上ResUnet-TensorRT8.2速度与显存记录表(后续不断补充)
Jetson XAVIER NX上ResUnet-TensorRT8.2速度与显存记录表(后续不断补充)
2022-07-02 19:07:00 【少有人走的路_心智旅程】
ResUnet-TensorRT8.2速度与显存记录表
| 精度 | 模式 | 图像尺寸 | 类别数 | 批次 | 线程数 | 推理时间 | 完整处理时间 | 显存 |
|---|---|---|---|---|---|---|---|---|
| FP32 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 168ms | 179ms | 2.2G |
| FP32 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 172ms | 184ms | 3.0G |
| FP16 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 58ms | 68ms | 1.6G |
| FP16 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 58ms | 68ms | 1.9G |
| FP32 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 167ms | 209ms | 2.2G |
| FP32 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 170ms | 234ms | 3.0G |
| FP16 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 57ms | 97ms | 1.6G |
| FP16 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 58ms | 106ms | 1.9G |
说明:
1.模式是指Jetson设备的功耗模式,对于本人的Jetson XAVIER NX来说,总共有8种模式,如果想达到最大推理速度的话,选择20W 2CORE模式。在主界面的右上角有个MODE的选择,选择20W 2CORE模式即可。
(本人选择20W 6CORE测试下来跟20W 2CORE差不多,只快了1ms,所以选择20W 2CORE即可)

2.推理时间是指平均每张图进行doInference(即执行cudaMemcpyAsync)所需要的推理时间。
完整处理时间推理时间加上前处理与后处理时间。
3.对于Jetson设备来说,CPU和GPU共用,所以显存就是内存。对于Jetson XAVIER NX来说内存总共8G。
而查看的方式不能直接使用nvidia-smi的命令行,必须安装jetson-stats。
具体操作方式可参考以下博客。
Jetson设备上查看显存(内存)——jetson-stats
4.为什么本人会有8个模式,而且这个系统下的TensorRT是8.2.1.8版本,不是7版本,猜测原因是在最初烧录系统的时候使用的镜像是比较新的。
而且相比TensorRT7版本,速度快了近20ms,具体可以看本人之前的博客。
Jetson XAVIER NX上ResUnet-TensorRT7速度与显存记录表(后续不断补充)
边栏推荐
- One side is volume, the other side is layoff. There are a lot of layoffs in byte commercialization department. What do you think of this wave?
- rxjs Observable 自定义 Operator 的开发技巧
- Build a master-slave mode cluster redis
- 多端小程序开发有什么好处?覆盖百度小程序抖音小程序微信小程序开发,抢占多平台流量红利
- Conscience summary! Jupyter notebook from Xiaobai to master, the nanny tutorial is coming!
- B-end e-commerce - reverse order process
- AcWing 341. Optimal trade solution (shortest path, DP)
- KS004 基于SSH通讯录系统设计与实现
- SQLite 3.39.0 发布,支持右外连接和全外连接
- Educational codeforces round 129 (rated for Div. 2) supplementary problem solution
猜你喜欢

Attack and defense world PWN question: Echo

After eight years of test experience and interview with 28K company, hematemesis sorted out high-frequency interview questions and answers

Sometimes only one line of statements are queried, and the execution is slow

基于SSM实现网上购物商城系统

KT148A语音芯片ic的用户端自己更换语音的方法,上位机

Complete example of pytorch model saving +does pytorch model saving only save trainable parameters? Yes (+ solution)

Istio部署:快速上手微服务,

蓝牙芯片ble是什么,以及该如何选型,后续技术发展的路径是什么

Introduction to program ape (XII) -- data storage

《MongoDB入门教程》第03篇 MongoDB基本概念
随机推荐
测试人员如何做不漏测?这7点就够了
[译]深入了解现代web浏览器(一)
Introduction to program ape (XII) -- data storage
Introduction to mongodb chapter 03 basic concepts of mongodb
攻防世界pwn题:Recho
KT148A语音芯片ic的用户端自己更换语音的方法,上位机
Cuckoo filter
C language linked list -- to be added
Exemple complet d'enregistrement du modèle pytoch + enregistrement du modèle pytoch seuls les paramètres d'entraînement sont - ils enregistrés? Oui (+ Solution)
励志!大凉山小伙全奖直博!论文致谢看哭网友
Notes on hardware design of kt148a voice chip IC
KT148A语音芯片ic的开发常见问题以及描述
CheckListBox control usage summary
Automatically generate VGg image annotation file
Function, function, efficiency, function, utility, efficacy
Conscience summary! Jupyter notebook from Xiaobai to master, the nanny tutorial is coming!
At compilation environment setup -win
Implementation of 453 ATOI function
Cs5268 perfectly replaces ag9321mcq typec multi in one docking station solution
Detailed tutorial on installing stand-alone redis