当前位置:网站首页>Jetson XAVIER NX上ResUnet-TensorRT8.2速度與顯存記錄錶(後續不斷補充)
Jetson XAVIER NX上ResUnet-TensorRT8.2速度與顯存記錄錶(後續不斷補充)
2022-07-02 19:59:00 【少有人走的路_心智旅程】
ResUnet-TensorRT8.2速度與顯存記錄錶
| 精度 | 模式 | 圖像尺寸 | 類別數 | 批次 | 線程數 | 推理時間 | 完整處理時間 | 顯存 |
|---|---|---|---|---|---|---|---|---|
| FP32 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 168ms | 179ms | 2.2G |
| FP32 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 172ms | 184ms | 3.0G |
| FP16 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 58ms | 68ms | 1.6G |
| FP16 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 58ms | 68ms | 1.9G |
| FP32 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 167ms | 209ms | 2.2G |
| FP32 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 170ms | 234ms | 3.0G |
| FP16 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 57ms | 97ms | 1.6G |
| FP16 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 58ms | 106ms | 1.9G |
說明:
1.模式是指Jetson設備的功耗模式,對於本人的Jetson XAVIER NX來說,總共有8種模式,如果想達到最大推理速度的話,選擇20W 2CORE模式。在主界面的右上角有個MODE的選擇,選擇20W 2CORE模式即可。
(本人選擇20W 6CORE測試下來跟20W 2CORE差不多,只快了1ms,所以選擇20W 2CORE即可)

2.推理時間是指平均每張圖進行doInference(即執行cudaMemcpyAsync)所需要的推理時間。
完整處理時間推理時間加上前處理與後處理時間。
3.對於Jetson設備來說,CPU和GPU共用,所以顯存就是內存。對於Jetson XAVIER NX來說內存總共8G。
而查看的方式不能直接使用nvidia-smi的命令行,必須安裝jetson-stats。
具體操作方式可參考以下博客。
Jetson設備上查看顯存(內存)——jetson-stats
4.為什麼本人會有8個模式,而且這個系統下的TensorRT是8.2.1.8版本,不是7版本,猜測原因是在最初燒錄系統的時候使用的鏡像是比較新的。
而且相比TensorRT7版本,速度快了近20ms,具體可以看本人之前的博客。
Jetson XAVIER NX上ResUnet-TensorRT7速度與顯存記錄錶(後續不斷補充)
边栏推荐
- Automatic reading of simple books
- 接口测试到底怎么做?看完这篇文章就能清晰明了
- 职场四象限法则:时间管理四象限与职场沟通四象限「建议收藏」
- checklistbox控件用法总结
- Google Earth engine (GEE) - Landsat 9 image full band image download (Beijing as an example)
- Codeforces Round #771 (Div. 2)(A-C)
- API文档工具knife4j使用详解
- How to do interface testing? After reading this article, it will be clear
- 外包干了三年,废了...
- MySQL function
猜你喜欢

Kt148a voice chip instructions, hardware, protocols, common problems, and reference codes

Implementation of online shopping mall system based on SSM

B端电商-订单逆向流程

面试经验总结,为你的offer保驾护航,满满的知识点

测试人员如何做不漏测?这7点就够了

励志!大凉山小伙全奖直博!论文致谢看哭网友

After eight years of test experience and interview with 28K company, hematemesis sorted out high-frequency interview questions and answers

Postman接口测试实战,这5个问题你一定要知道

外包干了三年,废了...
![[source code analysis] model parallel distributed training Megatron (5) -- pipestream flush](/img/e9/f316d02c3cad226055dcdec6781436.jpg)
[source code analysis] model parallel distributed training Megatron (5) -- pipestream flush
随机推荐
NMF-matlab
451 implementation of memcpy, memmove and memset
Taiwan SSS Xinchuang sss1700 replaces cmmedia cm6533 24bit 96KHz USB audio codec chip
Solution: vs2017 cannot open the source file stdio h main. H header document [easy to understand]
Complete example of pytorch model saving +does pytorch model saving only save trainable parameters? Yes (+ solution)
Set up sentinel mode. Reids and redis leave the sentinel cluster from the node
职场四象限法则:时间管理四象限与职场沟通四象限「建议收藏」
Development skills of rxjs observable custom operator
Yes, that's it!
upload-labs
SBT tutorial
基于SSM实现网上购物商城系统
MySQL function
checklistbox控件用法总结
Google Earth engine (GEE) - Landsat 9 image full band image download (Beijing as an example)
使用IDM下载百度网盘的文件(亲测有用)[通俗易懂]
[internship] solve the problem of too long request parameters
Sometimes only one line of statements are queried, and the execution is slow
RPD product: super power squad nanny strategy
Overview of browser caching mechanism