当前位置:网站首页>Jetson XAVIER NX上ResUnet-TensorRT8.2速度與顯存記錄錶(後續不斷補充)
Jetson XAVIER NX上ResUnet-TensorRT8.2速度與顯存記錄錶(後續不斷補充)
2022-07-02 19:59:00 【少有人走的路_心智旅程】
ResUnet-TensorRT8.2速度與顯存記錄錶
| 精度 | 模式 | 圖像尺寸 | 類別數 | 批次 | 線程數 | 推理時間 | 完整處理時間 | 顯存 |
|---|---|---|---|---|---|---|---|---|
| FP32 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 168ms | 179ms | 2.2G |
| FP32 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 172ms | 184ms | 3.0G |
| FP16 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 58ms | 68ms | 1.6G |
| FP16 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 58ms | 68ms | 1.9G |
| FP32 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 167ms | 209ms | 2.2G |
| FP32 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 170ms | 234ms | 3.0G |
| FP16 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 57ms | 97ms | 1.6G |
| FP16 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 58ms | 106ms | 1.9G |
說明:
1.模式是指Jetson設備的功耗模式,對於本人的Jetson XAVIER NX來說,總共有8種模式,如果想達到最大推理速度的話,選擇20W 2CORE模式。在主界面的右上角有個MODE的選擇,選擇20W 2CORE模式即可。
(本人選擇20W 6CORE測試下來跟20W 2CORE差不多,只快了1ms,所以選擇20W 2CORE即可)

2.推理時間是指平均每張圖進行doInference(即執行cudaMemcpyAsync)所需要的推理時間。
完整處理時間推理時間加上前處理與後處理時間。
3.對於Jetson設備來說,CPU和GPU共用,所以顯存就是內存。對於Jetson XAVIER NX來說內存總共8G。
而查看的方式不能直接使用nvidia-smi的命令行,必須安裝jetson-stats。
具體操作方式可參考以下博客。
Jetson設備上查看顯存(內存)——jetson-stats
4.為什麼本人會有8個模式,而且這個系統下的TensorRT是8.2.1.8版本,不是7版本,猜測原因是在最初燒錄系統的時候使用的鏡像是比較新的。
而且相比TensorRT7版本,速度快了近20ms,具體可以看本人之前的博客。
Jetson XAVIER NX上ResUnet-TensorRT7速度與顯存記錄錶(後續不斷補充)
边栏推荐
- 自动化制作视频
- Educational codeforces round 129 (rated for Div. 2) supplementary problem solution
- 外包干了三年,废了...
- Codeforces Round #771 (Div. 2)(A-C)
- HDL design peripheral tools to reduce errors and help you take off!
- [Chongqing Guangdong education] reference materials for labor education of college students in Nanjing University
- API documentation tool knife4j usage details
- 【Hot100】21. 合并两个有序链表
- CRM Customer Relationship Management System
- Solution to blue screen after installing TIA botu V17 in notebook
猜你喜欢

【NLP】一文详解生成式文本摘要经典论文Pointer-Generator

台湾SSS鑫创SSS1700替代Cmedia CM6533 24bit 96KHZ USB音频编解码芯片

Py's interpret: a detailed introduction to interpret, installation, and case application

【实习】解决请求参数过长问题

AcWing 903. Expensive bride price solution (the shortest path - building map, Dijkstra)

KT148A语音芯片ic的开发常见问题以及描述

After eight years of test experience and interview with 28K company, hematemesis sorted out high-frequency interview questions and answers

Shardingsphere jdbc5.1.2 about select last_ INSERT_ ID () I found that there was still a routing problem

GCC: Graph Contrastive Coding for Graph Neural NetworkPre-Training

疫情封控65天,我的居家办公心得分享 | 社区征文
随机推荐
Embedded (PLD) series, epf10k50rc240-3n programmable logic device
[daily question] 241 Design priorities for operational expressions
AcWing 1128. Messenger solution (shortest path Floyd)
Introduction to program ape (XII) -- data storage
Infix expression is converted to suffix expression (C language code + detailed explanation)
RPD出品:Superpower Squad 保姆级攻略
Sometimes only one line of statements are queried, and the execution is slow
AcWing 1127. Sweet butter solution (shortest path SPFA)
checklistbox控件用法总结
for(auto a : b)和for(auto &a : b)用法
esp32c3 crash分析
KT148A语音芯片ic的开发常见问题以及描述
【Hot100】23. Merge K ascending linked lists
Automated video production
职场四象限法则:时间管理四象限与职场沟通四象限「建议收藏」
有时候只查询一行语句,执行也慢
Spark source code compilation, cluster deployment and SBT development environment integration in idea
测试人员如何做不漏测?这7点就够了
【NLP】一文详解生成式文本摘要经典论文Pointer-Generator
Why do I have a passion for process?