当前位置:网站首页>Jetson XAVIER NX上ResUnet-TensorRT8.2速度与显存记录表(后续不断补充)
Jetson XAVIER NX上ResUnet-TensorRT8.2速度与显存记录表(后续不断补充)
2022-07-02 19:07:00 【少有人走的路_心智旅程】
ResUnet-TensorRT8.2速度与显存记录表
| 精度 | 模式 | 图像尺寸 | 类别数 | 批次 | 线程数 | 推理时间 | 完整处理时间 | 显存 |
|---|---|---|---|---|---|---|---|---|
| FP32 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 168ms | 179ms | 2.2G |
| FP32 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 172ms | 184ms | 3.0G |
| FP16 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 58ms | 68ms | 1.6G |
| FP16 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 58ms | 68ms | 1.9G |
| FP32 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 167ms | 209ms | 2.2G |
| FP32 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 170ms | 234ms | 3.0G |
| FP16 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 57ms | 97ms | 1.6G |
| FP16 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 58ms | 106ms | 1.9G |
说明:
1.模式是指Jetson设备的功耗模式,对于本人的Jetson XAVIER NX来说,总共有8种模式,如果想达到最大推理速度的话,选择20W 2CORE模式。在主界面的右上角有个MODE的选择,选择20W 2CORE模式即可。
(本人选择20W 6CORE测试下来跟20W 2CORE差不多,只快了1ms,所以选择20W 2CORE即可)

2.推理时间是指平均每张图进行doInference(即执行cudaMemcpyAsync)所需要的推理时间。
完整处理时间推理时间加上前处理与后处理时间。
3.对于Jetson设备来说,CPU和GPU共用,所以显存就是内存。对于Jetson XAVIER NX来说内存总共8G。
而查看的方式不能直接使用nvidia-smi的命令行,必须安装jetson-stats。
具体操作方式可参考以下博客。
Jetson设备上查看显存(内存)——jetson-stats
4.为什么本人会有8个模式,而且这个系统下的TensorRT是8.2.1.8版本,不是7版本,猜测原因是在最初烧录系统的时候使用的镜像是比较新的。
而且相比TensorRT7版本,速度快了近20ms,具体可以看本人之前的博客。
Jetson XAVIER NX上ResUnet-TensorRT7速度与显存记录表(后续不断补充)
边栏推荐
- 高并发下如何避免产生重复数据?
- Self-Improvement! Daliangshan boys all award Zhibo! Thank you for your paper
- 自动生成VGG图像注释文件
- 简书自动阅读
- checklistbox控件用法总结
- After 65 days of closure and control of the epidemic, my home office experience sharing | community essay solicitation
- SQLite 3.39.0 发布,支持右外连接和全外连接
- Understanding and function of polymorphism
- 【Hot100】23. Merge K ascending linked lists
- Development skills of rxjs observable custom operator
猜你喜欢

API文档工具knife4j使用详解

SQLite 3.39.0 发布,支持右外连接和全外连接
In depth understanding of modern web browsers (I)

接口测试到底怎么做?看完这篇文章就能清晰明了

Refactoring: improving the design of existing code (Part 2)

Burp install license key not recognized

Py's interpret: a detailed introduction to interpret, installation, and case application

勵志!大凉山小夥全獎直博!論文致謝看哭網友

基于SSM实现网上购物商城系统

AcWing 1126. Minimum cost solution (shortest path Dijkstra)
随机推荐
After writing 100000 lines of code, I sent a long article roast rust
Function, function, efficiency, function, utility, efficacy
Postman interface test practice, these five questions you must know
Istio1.12:安装和快速入门
疫情封控65天,我的居家办公心得分享 | 社区征文
Istio deployment: quickly start microservices,
Introduction to program ape (XII) -- data storage
NMF-matlab
B端电商-订单逆向流程
for(auto a : b)和for(auto &a : b)用法
测试人员如何做不漏测?这7点就够了
SQLite 3.39.0 发布,支持右外连接和全外连接
使用IDM下载百度网盘的文件(亲测有用)[通俗易懂]
VBScript详解(一)
RPD出品:Superpower Squad 保姆级攻略
《MongoDB入门教程》第03篇 MongoDB基本概念
AcWing 903. Expensive bride price solution (the shortest path - building map, Dijkstra)
R语言使用econocharts包创建微观经济或宏观经济图、indifference函数可视化无差异曲线(indifference curve)
Why do I have a passion for process?
at编译环境搭建-win