当前位置:网站首页>Jetson XAVIER NX上ResUnet-TensorRT8.2速度與顯存記錄錶(後續不斷補充)
Jetson XAVIER NX上ResUnet-TensorRT8.2速度與顯存記錄錶(後續不斷補充)
2022-07-02 19:59:00 【少有人走的路_心智旅程】
ResUnet-TensorRT8.2速度與顯存記錄錶
精度 | 模式 | 圖像尺寸 | 類別數 | 批次 | 線程數 | 推理時間 | 完整處理時間 | 顯存 |
---|---|---|---|---|---|---|---|---|
FP32 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 168ms | 179ms | 2.2G |
FP32 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 172ms | 184ms | 3.0G |
FP16 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 58ms | 68ms | 1.6G |
FP16 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 58ms | 68ms | 1.9G |
FP32 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 167ms | 209ms | 2.2G |
FP32 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 170ms | 234ms | 3.0G |
FP16 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 57ms | 97ms | 1.6G |
FP16 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 58ms | 106ms | 1.9G |
說明:
1.模式是指Jetson設備的功耗模式,對於本人的Jetson XAVIER NX來說,總共有8種模式,如果想達到最大推理速度的話,選擇20W 2CORE模式。在主界面的右上角有個MODE的選擇,選擇20W 2CORE模式即可。
(本人選擇20W 6CORE測試下來跟20W 2CORE差不多,只快了1ms,所以選擇20W 2CORE即可)
2.推理時間是指平均每張圖進行doInference(即執行cudaMemcpyAsync)所需要的推理時間。
完整處理時間推理時間加上前處理與後處理時間。
3.對於Jetson設備來說,CPU和GPU共用,所以顯存就是內存。對於Jetson XAVIER NX來說內存總共8G。
而查看的方式不能直接使用nvidia-smi的命令行,必須安裝jetson-stats。
具體操作方式可參考以下博客。
Jetson設備上查看顯存(內存)——jetson-stats
4.為什麼本人會有8個模式,而且這個系統下的TensorRT是8.2.1.8版本,不是7版本,猜測原因是在最初燒錄系統的時候使用的鏡像是比較新的。
而且相比TensorRT7版本,速度快了近20ms,具體可以看本人之前的博客。
Jetson XAVIER NX上ResUnet-TensorRT7速度與顯存記錄錶(後續不斷補充)
边栏推荐
- B-end e-commerce - reverse order process
- Cs5268 perfectly replaces ag9321mcq typec multi in one docking station solution
- 笔记本安装TIA博途V17后出现蓝屏的解决办法
- Common problems and description of kt148a voice chip IC development
- 450 Shenxin Mianjing 1
- [译]深入了解现代web浏览器(一)
- 浏览器缓存机制概述
- 通信人的经典语录,第一条就扎心了……
- pytorch 模型保存的完整例子+pytorch 模型保存只保存可训练参数吗?是(+解决方案)
- AcWing 1127. Sweet butter solution (shortest path SPFA)
猜你喜欢
Data Lake (XII): integration of spark3.1.2 and iceberg0.12.1
【Hot100】21. Merge two ordered linked lists
After writing 100000 lines of code, I sent a long article roast rust
【实习】解决请求参数过长问题
自動生成VGG圖像注釋文件
Istio1.12: installation and quick start
KT148A语音芯片ic的软件参考代码C语言,一线串口
RPD product: super power squad nanny strategy
JASMINER X4 1U deep disassembly reveals the secret behind high efficiency and power saving
Kt148a voice chip IC software reference code c language, first-line serial port
随机推荐
【Hot100】23. 合并K个升序链表
笔记本安装TIA博途V17后出现蓝屏的解决办法
Set up sentinel mode. Reids and redis leave the sentinel cluster from the node
Google Earth Engine(GEE)——Landsat 9影像全波段影像下载(北京市为例)
In the era of consumer Internet, a few head platforms have been born
sql-labs
burp 安装 license key not recognized
【Hot100】22. bracket-generating
Self-Improvement! Daliangshan boys all award Zhibo! Thank you for your paper
蓝牙芯片ble是什么,以及该如何选型,后续技术发展的路径是什么
AcWing 1129. Heat wave solution (shortest path SPFA)
How to avoid duplicate data in gaobingfa?
Function, function, efficiency, function, utility, efficacy
Cuckoo filter
KT148A语音芯片ic的开发常见问题以及描述
【JS】获取hash模式下URL的搜索参数
AcWing 1127. Sweet butter solution (shortest path SPFA)
AcWing 1126. Minimum cost solution (shortest path Dijkstra)
Zabbix5 client installation and configuration
JS how to get integer