当前位置:网站首页>Jetson XAVIER NX上ResUnet-TensorRT8.2速度与显存记录表(后续不断补充)
Jetson XAVIER NX上ResUnet-TensorRT8.2速度与显存记录表(后续不断补充)
2022-07-02 19:07:00 【少有人走的路_心智旅程】
ResUnet-TensorRT8.2速度与显存记录表
| 精度 | 模式 | 图像尺寸 | 类别数 | 批次 | 线程数 | 推理时间 | 完整处理时间 | 显存 |
|---|---|---|---|---|---|---|---|---|
| FP32 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 168ms | 179ms | 2.2G |
| FP32 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 172ms | 184ms | 3.0G |
| FP16 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 58ms | 68ms | 1.6G |
| FP16 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 58ms | 68ms | 1.9G |
| FP32 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 167ms | 209ms | 2.2G |
| FP32 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 170ms | 234ms | 3.0G |
| FP16 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 57ms | 97ms | 1.6G |
| FP16 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 58ms | 106ms | 1.9G |
说明:
1.模式是指Jetson设备的功耗模式,对于本人的Jetson XAVIER NX来说,总共有8种模式,如果想达到最大推理速度的话,选择20W 2CORE模式。在主界面的右上角有个MODE的选择,选择20W 2CORE模式即可。
(本人选择20W 6CORE测试下来跟20W 2CORE差不多,只快了1ms,所以选择20W 2CORE即可)

2.推理时间是指平均每张图进行doInference(即执行cudaMemcpyAsync)所需要的推理时间。
完整处理时间推理时间加上前处理与后处理时间。
3.对于Jetson设备来说,CPU和GPU共用,所以显存就是内存。对于Jetson XAVIER NX来说内存总共8G。
而查看的方式不能直接使用nvidia-smi的命令行,必须安装jetson-stats。
具体操作方式可参考以下博客。
Jetson设备上查看显存(内存)——jetson-stats
4.为什么本人会有8个模式,而且这个系统下的TensorRT是8.2.1.8版本,不是7版本,猜测原因是在最初烧录系统的时候使用的镜像是比较新的。
而且相比TensorRT7版本,速度快了近20ms,具体可以看本人之前的博客。
Jetson XAVIER NX上ResUnet-TensorRT7速度与显存记录表(后续不断补充)
边栏推荐
- R语言使用econocharts包创建微观经济或宏观经济图、indifference函数可视化无差异曲线(indifference curve)
- 为什么我对流程情有独钟?
- [NLP] a detailed generative text Abstract classic paper pointer generator
- 使用IDM下载百度网盘的文件(亲测有用)[通俗易懂]
- [ERP software] what are the dangers of the secondary development of ERP system?
- SQLite 3.39.0 release supports right external connection and all external connection
- Infix expression is converted to suffix expression (C language code + detailed explanation)
- esp32c3 crash分析
- Think about the huge changes caused by variables
- Detailed explanation of VBScript (I)
猜你喜欢

浏览器缓存机制概述

KT148A语音芯片ic的开发常见问题以及描述

C language linked list -- to be added

Design and implementation of ks004 based on SSH address book system

Py's interpret: a detailed introduction to interpret, installation, and case application

Embedded (PLD) series, epf10k50rc240-3n programmable logic device

KS004 基于SSH通讯录系统设计与实现

自動生成VGG圖像注釋文件

CRM Customer Relationship Management System

ShardingSphere-JDBC5.1.2版本关于SELECT LAST_INSERT_ID()本人发现还是存在路由问题
随机推荐
CS5268完美代替AG9321MCQ Typec多合一扩展坞方案
[NLP] a detailed generative text Abstract classic paper pointer generator
在消费互联网时代,诞生了为数不多的头部平台的话
从20s优化到500ms,我用了这三招
VBScript详解(一)
B-end e-commerce - reverse order process
Introduction to mongodb chapter 03 basic concepts of mongodb
KS004 基于SSH通讯录系统设计与实现
外包干了三年,废了...
为什么我对流程情有独钟?
【Hot100】23. Merge K ascending linked lists
esp32c3 crash分析
Data Lake (XII): integration of spark3.1.2 and iceberg0.12.1
Attack and defense world PWN question: Echo
Postman download and installation
【JS】获取hash模式下URL的搜索参数
Istio1.12:安装和快速入门
Kt148a voice chip instructions, hardware, protocols, common problems, and reference codes
基于SSM实现网上购物商城系统
MySQL function