当前位置:网站首页>Jetson XAVIER NX上ResUnet-TensorRT8.2速度与显存记录表(后续不断补充)
Jetson XAVIER NX上ResUnet-TensorRT8.2速度与显存记录表(后续不断补充)
2022-07-02 19:07:00 【少有人走的路_心智旅程】
ResUnet-TensorRT8.2速度与显存记录表
精度 | 模式 | 图像尺寸 | 类别数 | 批次 | 线程数 | 推理时间 | 完整处理时间 | 显存 |
---|---|---|---|---|---|---|---|---|
FP32 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 168ms | 179ms | 2.2G |
FP32 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 172ms | 184ms | 3.0G |
FP16 | 20W 2CORE | 512*640 | 2 | 1 | 1 | 58ms | 68ms | 1.6G |
FP16 | 20W 2CORE | 512*640 | 2 | 1 | 2 | 58ms | 68ms | 1.9G |
FP32 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 167ms | 209ms | 2.2G |
FP32 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 170ms | 234ms | 3.0G |
FP16 | 20W 2CORE | 512*612 | 6 | 1 | 1 | 57ms | 97ms | 1.6G |
FP16 | 20W 2CORE | 512*612 | 6 | 1 | 2 | 58ms | 106ms | 1.9G |
说明:
1.模式是指Jetson设备的功耗模式,对于本人的Jetson XAVIER NX来说,总共有8种模式,如果想达到最大推理速度的话,选择20W 2CORE模式。在主界面的右上角有个MODE的选择,选择20W 2CORE模式即可。
(本人选择20W 6CORE测试下来跟20W 2CORE差不多,只快了1ms,所以选择20W 2CORE即可)
2.推理时间是指平均每张图进行doInference(即执行cudaMemcpyAsync)所需要的推理时间。
完整处理时间推理时间加上前处理与后处理时间。
3.对于Jetson设备来说,CPU和GPU共用,所以显存就是内存。对于Jetson XAVIER NX来说内存总共8G。
而查看的方式不能直接使用nvidia-smi的命令行,必须安装jetson-stats。
具体操作方式可参考以下博客。
Jetson设备上查看显存(内存)——jetson-stats
4.为什么本人会有8个模式,而且这个系统下的TensorRT是8.2.1.8版本,不是7版本,猜测原因是在最初烧录系统的时候使用的镜像是比较新的。
而且相比TensorRT7版本,速度快了近20ms,具体可以看本人之前的博客。
Jetson XAVIER NX上ResUnet-TensorRT7速度与显存记录表(后续不断补充)
边栏推荐
- R language uses econcharts package to create microeconomic or macroeconomic maps, and indifference function to visualize indifference curve
- Shardingsphere jdbc5.1.2 about select last_ INSERT_ ID () I found that there was still a routing problem
- Implementation of online shopping mall system based on SSM
- Detailed tutorial on installing stand-alone redis
- Conscience summary! Jupyter notebook from Xiaobai to master, the nanny tutorial is coming!
- Istio部署:快速上手微服务,
- Automatic reading of simple books
- KT148A语音芯片使用说明、硬件、以及协议、以及常见问题,和参考代码
- Common problems and description of kt148a voice chip IC development
- Google Earth engine (GEE) - Landsat 9 image full band image download (Beijing as an example)
猜你喜欢
字典
Burp install license key not recognized
Overview of browser caching mechanism
API documentation tool knife4j usage details
HDL design peripheral tools to reduce errors and help you take off!
API文档工具knife4j使用详解
[NLP] a detailed generative text Abstract classic paper pointer generator
接口测试到底怎么做?看完这篇文章就能清晰明了
自動生成VGG圖像注釋文件
upload-labs
随机推荐
Automated video production
笔记本安装TIA博途V17后出现蓝屏的解决办法
rxjs Observable 自定义 Operator 的开发技巧
Automatic reading of simple books
浏览器缓存机制概述
Conscience summary! Jupyter notebook from Xiaobai to master, the nanny tutorial is coming!
Infix expression is converted to suffix expression (C language code + detailed explanation)
Postman接口测试实战,这5个问题你一定要知道
From 20s to 500ms, I used these three methods
简书自动阅读
职场四象限法则:时间管理四象限与职场沟通四象限「建议收藏」
Workplace four quadrant rule: time management four quadrant and workplace communication four quadrant "suggestions collection"
Complete example of pytorch model saving +does pytorch model saving only save trainable parameters? Yes (+ solution)
Exemple complet d'enregistrement du modèle pytoch + enregistrement du modèle pytoch seuls les paramètres d'entraînement sont - ils enregistrés? Oui (+ Solution)
Design and implementation of ks004 based on SSH address book system
Yes, that's it!
ShardingSphere-JDBC5.1.2版本关于SELECT LAST_INSERT_ID()本人发现还是存在路由问题
B-end e-commerce - reverse order process
After 65 days of closure and control of the epidemic, my home office experience sharing | community essay solicitation
pytorch 模型保存的完整例子+pytorch 模型保存只保存可訓練參數嗎?是(+解决方案)