当前位置:网站首页>Jetson XAVIER NX上ResUnet-TensorRT8.2速度與顯存記錄錶(後續不斷補充)
Jetson XAVIER NX上ResUnet-TensorRT8.2速度與顯存記錄錶(後續不斷補充)
2022-07-02 19:59:00 【少有人走的路_心智旅程】
ResUnet-TensorRT8.2速度與顯存記錄錶
| 精度 | 模式 | 圖像尺寸 | 類別數 | 批次 | 線程數 | 推理時間 | 完整處理時間 | 顯存 |
|---|---|---|---|---|---|---|---|---|
| FP32 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 168ms | 179ms | 2.2G |
| FP32 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 172ms | 184ms | 3.0G |
| FP16 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 58ms | 68ms | 1.6G |
| FP16 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 58ms | 68ms | 1.9G |
| FP32 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 167ms | 209ms | 2.2G |
| FP32 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 170ms | 234ms | 3.0G |
| FP16 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 57ms | 97ms | 1.6G |
| FP16 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 58ms | 106ms | 1.9G |
說明:
1.模式是指Jetson設備的功耗模式,對於本人的Jetson XAVIER NX來說,總共有8種模式,如果想達到最大推理速度的話,選擇20W 2CORE模式。在主界面的右上角有個MODE的選擇,選擇20W 2CORE模式即可。
(本人選擇20W 6CORE測試下來跟20W 2CORE差不多,只快了1ms,所以選擇20W 2CORE即可)

2.推理時間是指平均每張圖進行doInference(即執行cudaMemcpyAsync)所需要的推理時間。
完整處理時間推理時間加上前處理與後處理時間。
3.對於Jetson設備來說,CPU和GPU共用,所以顯存就是內存。對於Jetson XAVIER NX來說內存總共8G。
而查看的方式不能直接使用nvidia-smi的命令行,必須安裝jetson-stats。
具體操作方式可參考以下博客。
Jetson設備上查看顯存(內存)——jetson-stats
4.為什麼本人會有8個模式,而且這個系統下的TensorRT是8.2.1.8版本,不是7版本,猜測原因是在最初燒錄系統的時候使用的鏡像是比較新的。
而且相比TensorRT7版本,速度快了近20ms,具體可以看本人之前的博客。
Jetson XAVIER NX上ResUnet-TensorRT7速度與顯存記錄錶(後續不斷補充)
边栏推荐
- [Chongqing Guangdong education] reference materials for labor education of college students in Nanjing University
- pytorch 模型保存的完整例子+pytorch 模型保存只保存可训练参数吗?是(+解决方案)
- JS how to get integer
- AcWing 1128. Messenger solution (shortest path Floyd)
- 自動生成VGG圖像注釋文件
- How to do interface testing? After reading this article, it will be clear
- Overview of browser caching mechanism
- For (Auto A: b) and for (Auto & A: b) usage
- 使用IDM下载百度网盘的文件(亲测有用)[通俗易懂]
- 良心总结!Jupyter Notebook 从小白到高手,保姆教程来了!
猜你喜欢

KT148A语音芯片使用说明、硬件、以及协议、以及常见问题,和参考代码

面试经验总结,为你的offer保驾护航,满满的知识点

How to do interface testing? After reading this article, it will be clear

Exemple complet d'enregistrement du modèle pytoch + enregistrement du modèle pytoch seuls les paramètres d'entraînement sont - ils enregistrés? Oui (+ Solution)

Notes on hardware design of kt148a voice chip IC

Introduction to mongodb chapter 03 basic concepts of mongodb

SBT tutorial

Postman interface test practice, these five questions you must know

浏览器缓存机制概述

GCC: Graph Contrastive Coding for Graph Neural NetworkPre-Training
随机推荐
Cron表达式(七子表达式)
Automatically generate VGg image annotation file
八年测开经验,面试28K公司后,吐血整理出高频面试题和答案
How to set priorities in C language? Elaborate on C language priorities
Postman download and installation
AcWing 181. Turnaround game solution (search ida* search)
高并发下如何避免产生重复数据?
From 20s to 500ms, I used these three methods
Génération automatique de fichiers d'annotation d'images vgg
Esp32c3 crash analysis
【JS】获取hash模式下URL的搜索参数
How to do interface testing? After reading this article, it will be clear
checklistbox控件用法总结
勵志!大凉山小夥全獎直博!論文致謝看哭網友
简书自动阅读
451 implementation of memcpy, memmove and memset
开始练习书法
Why do I have a passion for process?
What are the benefits of multi terminal applet development? Covering Baidu applet, Tiktok applet, wechat applet development, and seizing the multi platform traffic dividend
【Hot100】22. 括号生成