当前位置:网站首页>TensorRT的数据格式定义详解
TensorRT的数据格式定义详解
2022-07-02 06:12:00 【扫地的小何尚】
TensorRT的数据格式定义详解
TensorRT 支持不同的数据格式。有两个方面需要考虑:数据类型和布局。
数据类型格式
数据类型是每个单独值的表示。它的大小决定了取值范围和表示的精度,分别是FP32
(32位浮点,或单精度),FP16
(16位浮点或半精度),INT32
(32位整数表示),和 INT8
(8 位表示)。
布局格式
布局格式确定存储值的顺序。通常,batch 维度是最左边的维度,其他维度指的是每个数据项的方面,例如图像中的C是通道, H是高度, W是宽度。忽略总是在这些之前的批量大小, C 、 H和W通常被排序为CHW (参见图 1 )或HWC (参见图 2 )。
图1. CHW的布局格式:图像分为HxW矩阵,每个通道一个,矩阵按顺序存储;通道的所有值都是连续存储的。
图2. HWC的布局格式:图像存储为单个HxW矩阵,其值实际上是 C 元组,每个通道都有一个值;一个点(像素)的所有值都是连续存储的。
为了实现更快的计算,定义了更多格式以将通道值打包在一起并使用降低的精度。因此,TensorRT 还支持NC / 2HW2
和NHWC8
等格式。
在NC / 2HW2 ( TensorFormat::kCHW2 )
中,通道值对在每个HxW矩阵中打包在一起(在奇数通道的情况下为空值)。结果是一种格式,其中⌈ C/2 ⌉ HxW
矩阵的值是两个连续通道的值对(参见图 3 );请注意,如果它们在同一对中,则此排序将维度交错为具有步长1的通道的值,否则将步长为 2xHxW 。
下图一对通道值在每个HxW矩阵中打包在一起。结果是一种格式,其中[C/2] HxW
矩阵的值是两个连续通道的值对
在NHWC8 ( TensorFormat::kHWC8 )
中, HxW矩阵的条目包括所有通道的值(参见图 4 )。此外,这些值被打包在⌈ C/8 ⌉
8 元组中,并且C向上舍入到最接近的 8 倍数。
下图在这种NHWC8
格式中, HxW矩阵的条目包括所有通道的值。
其他TensorFormat遵循与前面提到的TensorFormat::kCHW2
和TensorFormat::kHWC8
类似的规则。
边栏推荐
- The Chinese word segmentation task is realized by using traditional methods (n-gram, HMM, etc.), neural network methods (CNN, LSTM, etc.) and pre training methods (Bert, etc.)
- 复杂 json数据 js前台解析 详细步骤《案例:一》
- Shenji Bailian 3.53-kruskal
- AttributeError: ‘str‘ object has no attribute ‘decode‘
- 注解和反射详解以及运用
- Golang--map扩容机制(含源码)
- 如何使用MITMPROXy
- Frequently asked questions about jetpack compose and material you
- 找到页面当前元素z-index最高的数值
- Spark overview
猜你喜欢
深入学习JVM底层(三):垃圾回收器与内存分配策略
锐捷EBGP 配置案例
来自读者们的 I/O 观后感|有奖征集获奖名单
Support new and old imperial CMS collection and warehousing tutorials
最新CUDA环境配置(Win10 + CUDA 11.6 + VS2019)
Contest3147 - game 38 of 2021 Freshmen's personal training match_ G: Flower bed
Linear DP (split)
Contest3147 - game 38 of 2021 Freshmen's personal training match_ 1: Maximum palindromes
递归(迷宫问题、8皇后问题)
Shenji Bailian 3.53-kruskal
随机推荐
Generic classes and parameterized classes of SystemVerilog
On Web server
Deep learning classification network -- alexnet
Codeforces Round #797 (Div. 3) A—E
Shenji Bailian 3.53-kruskal
LeetCode 283. 移动零
Sudo right raising
Google play academy team PK competition, official start!
Ruijie ebgp configuration case
Singleton mode compilation
注解和反射详解以及运用
MySQL的10大經典錯誤
Database learning summary 5
标签属性disabled selected checked等布尔类型赋值不生效?
官方零基础入门 Jetpack Compose 的中文课程来啦!
Contest3147 - game 38 of 2021 Freshmen's personal training match_ E: Listen to songs and know music
Flutter hybrid development: develop a simple quick start framework | developers say · dtalk
RestTemplate请求时设置请求头,请求参数,请求体。
经典文献阅读之--Deformable DETR
ROS create workspace