当前位置:网站首页>tensorRT教程——tensor RT OP理解(实现自定义层,搭建网络)
tensorRT教程——tensor RT OP理解(实现自定义层,搭建网络)
2022-08-04 05:29:00 【TigerZ*】
首先如果你的自定义操作可以通过一些矩阵操作来实现,那么你大可不必自己去通过plug in的方式实现,可以使用tensor RT 的OP来组合实现。
他的OP极其类似tensor flow的操作,如果看到不理解,那就去谷歌tensor flow的操作,触类旁通即可,但仍有一些文档描述错误。
一些我使用过典型的OP备注如下,并附上一个测试OP的脚本,按需修改即可:
1、reduce层的理解:
reduce主要是在各个轴上进行对应的操作。

axes,注意官方说的是bit。可以组合然后对应到int,比如对于NCHW要进行全局平均池化,那么此时的axes对应的轴应该是H和W组合起来就是bit1+bit2对应int的6。
keep_dim就是reduce后对应轴压缩为一个数,如果为false则维度降低1(或者N,看对几个轴进行操作,比如前面的全局平均池化,就是对两个维度操作,降低2维);如果为True则对应轴置为1,如NCHW全局平均池化后变为NC11。
2、constant层理解:
主要是提供了一种从外界输入数据的方法。

权重的参数类型为weight,weight可以冲numpy直接自动转换,所以可以直接载入numpy对象,通过get_output返回itensor。
用途:比如gather操作的index要求为itensor类型,itensor类型并没有构造函数,所以可以通过constant layer来返回itensor。
3、shuffle层理解:

shuffle层完成了转置和reshape的功能。
需要通过建立层后对该层的后面三个参数进行赋值。

4、gather层的理解:

对于NCHW,axis 0、1、2分别代表C、H、W轴。indices设置[x]对应取batch size的x层、x行、x列,但要注意当x为列表多个值时返回值的顺序按照行列通道顺序。
5、unarry层的理解:

主要用于对每个元素进行同样的一元操作,可以进行的运算如下,要注意:
平方不是exp,exp是以e为底数的对应元素值次方,平方需要使用
传递参数的时候,传递的是(两个tensorrt,不是字符串)tensorrt.tensorrt.UnaryOperation.SUM

6、network.mark_output


注意:
当需要在passer网络后面加东西时,需要将结果unmark;
在网络最后需要使用mark标注网络,再调试网络输出时,可以不注释调试层后面的层,只需要使用mark_output该层就可以。
7、view的处理
View的参数要在size后面加item。
8、他们的全连接层中得bias如果没有,要自定义一个0矩阵,而不是API说的可选。
边栏推荐
- 【CV-Learning】线性分类器(SVM基础)
- (十)树的基础部分(一)
- 动手学深度学习_softmax回归
- (TensorFlow) - detailed explanation of tf.variable_scope and tf.name_scope
- pytorch学习-没掌握的点
- 动手学深度学习_多层感知机
- Pytorch语义分割理解
- thymeleaf中 th:href使用笔记
- [Deep Learning 21 Days Learning Challenge] Memo: What does our neural network model look like? - detailed explanation of model.summary()
- with recursive用法
猜你喜欢
随机推荐
AIDL communication between two APPs
Introduction of linear regression 01 - API use cases
thymeleaf中 th:href使用笔记
Polynomial Regression (PolynomialFeatures)
(十)树的基础部分(一)
剑指 Offer 20226/30
动手学深度学习_多层感知机
MySQL leftmost prefix principle [I understand hh]
空洞卷积
【CV-Learning】卷积神经网络
WARNING: sql version 9.2, server version 11.0. Some psql features might not work.
TensorFlow2学习笔记:5、常用激活函数
【CV-Learning】Image Classification
简单说Q-Q图;stats.probplot(QQ图)
Usage of Thread, Handler and IntentService
【论文阅读】Anchor-Free Person Search
PyTorch
TensorFlow2学习笔记:7、优化器
TensorFlow2 study notes: 7. Optimizer
TypeError: load() missing 1 required positional argument: ‘Loader‘





![[Deep Learning 21-Day Learning Challenge] 3. Use a self-made dataset - Convolutional Neural Network (CNN) Weather Recognition](/img/d0/3b8549b9704278e8ec1df03a90f80e.png)



