当前位置:网站首页>TensorRT的数据格式定义详解
TensorRT的数据格式定义详解
2022-07-02 06:12:00 【扫地的小何尚】
TensorRT的数据格式定义详解
TensorRT 支持不同的数据格式。有两个方面需要考虑:数据类型和布局。
数据类型格式
数据类型是每个单独值的表示。它的大小决定了取值范围和表示的精度,分别是FP32
(32位浮点,或单精度),FP16
(16位浮点或半精度),INT32
(32位整数表示),和 INT8
(8 位表示)。
布局格式
布局格式确定存储值的顺序。通常,batch 维度是最左边的维度,其他维度指的是每个数据项的方面,例如图像中的C是通道, H是高度, W是宽度。忽略总是在这些之前的批量大小, C 、 H和W通常被排序为CHW (参见图 1 )或HWC (参见图 2 )。
图1. CHW的布局格式:图像分为HxW矩阵,每个通道一个,矩阵按顺序存储;通道的所有值都是连续存储的。
图2. HWC的布局格式:图像存储为单个HxW矩阵,其值实际上是 C 元组,每个通道都有一个值;一个点(像素)的所有值都是连续存储的。
为了实现更快的计算,定义了更多格式以将通道值打包在一起并使用降低的精度。因此,TensorRT 还支持NC / 2HW2
和NHWC8
等格式。
在NC / 2HW2 ( TensorFormat::kCHW2 )
中,通道值对在每个HxW矩阵中打包在一起(在奇数通道的情况下为空值)。结果是一种格式,其中⌈ C/2 ⌉ HxW
矩阵的值是两个连续通道的值对(参见图 3 );请注意,如果它们在同一对中,则此排序将维度交错为具有步长1的通道的值,否则将步长为 2xHxW 。
下图一对通道值在每个HxW矩阵中打包在一起。结果是一种格式,其中[C/2] HxW
矩阵的值是两个连续通道的值对
在NHWC8 ( TensorFormat::kHWC8 )
中, HxW矩阵的条目包括所有通道的值(参见图 4 )。此外,这些值被打包在⌈ C/8 ⌉
8 元组中,并且C向上舍入到最接近的 8 倍数。
下图在这种NHWC8
格式中, HxW矩阵的条目包括所有通道的值。
其他TensorFormat遵循与前面提到的TensorFormat::kCHW2
和TensorFormat::kHWC8
类似的规则。
边栏推荐
- Current situation analysis of Devops and noops
- LeetCode 90. Subset II
- 社区说|Kotlin Flow 的原理与设计哲学
- Shenji Bailian 3.54-dichotomy of dyeing judgment
- 日期时间API详解
- Web page user step-by-step operation guide plug-in driver js
- Golang--map扩容机制(含源码)
- LeetCode 40. 组合总和 II
- The official zero foundation introduction jetpack compose Chinese course is coming!
- Community theory | kotlin flow's principle and design philosophy
猜你喜欢
日期时间API详解
LeetCode 78. subset
Contest3147 - game 38 of 2021 Freshmen's personal training match_ G: Flower bed
找到页面当前元素z-index最高的数值
Shenji Bailian 3.53-kruskal
官方零基础入门 Jetpack Compose 的中文课程来啦!
栈(线性结构)
Contest3147 - game 38 of 2021 Freshmen's personal training match_ F: Polyhedral dice
CNN visualization technology -- detailed explanation of cam & grad cam and concise implementation of pytorch
Deep learning classification network -- alexnet
随机推荐
Use of Arduino wire Library
Singleton mode compilation
Generic classes and parameterized classes of SystemVerilog
Step by step | help you easily submit Google play data security form
Google Play Academy 组队 PK 赛,正式开赛!
Contest3145 - the 37th game of 2021 freshman individual training match_ H: Eat fish
穀歌出海創業加速器報名倒計時 3 天,創業人闖關指南提前收藏!
经典文献阅读之--SuMa++
TensorRT的功能
Replace Django database with MySQL (attributeerror: 'STR' object has no attribute 'decode')
LeetCode 90. Subset II
社区说|Kotlin Flow 的原理与设计哲学
CUDA中的异步数据拷贝
State machine in BGP
日期时间API详解
官方零基础入门 Jetpack Compose 的中文课程来啦!
Sudo right raising
Golang--map扩容机制(含源码)
Detailed notes of ES6
Deep learning classification network -- alexnet