当前位置:网站首页>Jetson XAVIER NX上ResUnet-TensorRT8.2速度與顯存記錄錶(後續不斷補充)
Jetson XAVIER NX上ResUnet-TensorRT8.2速度與顯存記錄錶(後續不斷補充)
2022-07-02 19:59:00 【少有人走的路_心智旅程】
ResUnet-TensorRT8.2速度與顯存記錄錶
精度 | 模式 | 圖像尺寸 | 類別數 | 批次 | 線程數 | 推理時間 | 完整處理時間 | 顯存 |
---|---|---|---|---|---|---|---|---|
FP32 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 168ms | 179ms | 2.2G |
FP32 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 172ms | 184ms | 3.0G |
FP16 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 58ms | 68ms | 1.6G |
FP16 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 58ms | 68ms | 1.9G |
FP32 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 167ms | 209ms | 2.2G |
FP32 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 170ms | 234ms | 3.0G |
FP16 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 57ms | 97ms | 1.6G |
FP16 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 58ms | 106ms | 1.9G |
說明:
1.模式是指Jetson設備的功耗模式,對於本人的Jetson XAVIER NX來說,總共有8種模式,如果想達到最大推理速度的話,選擇20W 2CORE模式。在主界面的右上角有個MODE的選擇,選擇20W 2CORE模式即可。
(本人選擇20W 6CORE測試下來跟20W 2CORE差不多,只快了1ms,所以選擇20W 2CORE即可)
2.推理時間是指平均每張圖進行doInference(即執行cudaMemcpyAsync)所需要的推理時間。
完整處理時間推理時間加上前處理與後處理時間。
3.對於Jetson設備來說,CPU和GPU共用,所以顯存就是內存。對於Jetson XAVIER NX來說內存總共8G。
而查看的方式不能直接使用nvidia-smi的命令行,必須安裝jetson-stats。
具體操作方式可參考以下博客。
Jetson設備上查看顯存(內存)——jetson-stats
4.為什麼本人會有8個模式,而且這個系統下的TensorRT是8.2.1.8版本,不是7版本,猜測原因是在最初燒錄系統的時候使用的鏡像是比較新的。
而且相比TensorRT7版本,速度快了近20ms,具體可以看本人之前的博客。
Jetson XAVIER NX上ResUnet-TensorRT7速度與顯存記錄錶(後續不斷補充)
边栏推荐
- How to avoid duplicate data in gaobingfa?
- Burp install license key not recognized
- KT148A语音芯片ic的开发常见问题以及描述
- AcWing 1128. Messenger solution (shortest path Floyd)
- 励志!大凉山小伙全奖直博!论文致谢看哭网友
- Automatically generate VGg image annotation file
- After 65 days of closure and control of the epidemic, my home office experience sharing | community essay solicitation
- 450 Shenxin Mianjing 1
- 使用IDM下载百度网盘的文件(亲测有用)[通俗易懂]
- 测试人员如何做不漏测?这7点就够了
猜你喜欢
基于SSM实现网上购物商城系统
Burp install license key not recognized
Basic concept of database, installation and configuration of database, basic use of MySQL, operation of database in the project
RPD product: super power squad nanny strategy
burp 安装 license key not recognized
Postman interface test practice, these five questions you must know
Istio1.12:安装和快速入门
RPD出品:Superpower Squad 保姆级攻略
What is the Bluetooth chip ble, how to select it, and what is the path of subsequent technology development
AcWing 903. Expensive bride price solution (the shortest path - building map, Dijkstra)
随机推荐
Complete example of pytorch model saving +does pytorch model saving only save trainable parameters? Yes (+ solution)
Istio部署:快速上手微服务,
外包干了三年,废了...
SBT tutorial
Overview of browser caching mechanism
Postman interface test practice, these five questions you must know
B端电商-订单逆向流程
for(auto a : b)和for(auto &a : b)用法
面试经验总结,为你的offer保驾护航,满满的知识点
C language linked list -- to be added
JS如何取整数
[daily question] 241 Design priorities for operational expressions
良心总结!Jupyter Notebook 从小白到高手,保姆教程来了!
How to set priorities in C language? Elaborate on C language priorities
多端小程序开发有什么好处?覆盖百度小程序抖音小程序微信小程序开发,抢占多平台流量红利
Istio1.12:安装和快速入门
【JS】获取hash模式下URL的搜索参数
From 20s to 500ms, I used these three methods
NMF-matlab
HDL design peripheral tools to reduce errors and help you take off!