当前位置:网站首页>pytorch_YOLOX剪枝【附代码】
pytorch_YOLOX剪枝【附代码】
2022-07-06 14:32:00 【爱吃肉的鹏】
目录
环境
pytorch 1.7
loguru 0.5.3
NVIDIA 1650 4G
intel i5-9th
torch-pruning 0.2.7
安装包
pip install torch_pruning
Note:本项目是在b站up主Bubbliiiing和原YOLOX官方代码进行了整合。
1.添加了feature可视化功能
2.训练中可开启EMA功能
3.网络剪枝(支持s,m,l,x)
3.1支持单个卷积剪枝
3.2支持网络层剪枝
4.剪枝后微调训练
5.Conv与BN层的融合推理加速
6.保存log信息
数据集格式:采用voc数据集格式
feature视化
在tools/Net_Vision.py为可视化代码实现。可以通过在网络层导入NV函数,实现通道可视化。
eg:
features = [out_features[f] for f in self.in_features]
[x2, x1, x0] = features # shape is (batch_size,channels,w,h)
NV(x2)

网络剪枝
参考论文:Pruning Filters for Efficient ConvNets
导入剪枝工具
import torch_pruning as tp
如果需要看yolov4的,可以看:YOLOv4剪枝【附代码】_爱吃肉的鹏的博客-CSDN博客_yolov4剪枝
采用通道剪枝,而不是权重剪枝。
在剪枝之前需要通过tools/prunmodel.py save_whole_model(weights_path, num_classes) 函数将模型的权重和结构都保存下来。
weights_path:权重路径
num_classes:自己类别数量
model = YOLOX(num_classes, 's') # 这里需要根据自己的类数量修改 s指yolox-s
支持对某个卷积的剪枝:调用Conv_pruning(whole_model_weights):
pruning_idxs = strategy(v, amount=0.4) # 0.4是剪枝率 根据需要自己修改,数越大剪的越多
对于单独一个卷积的剪枝,需要修改两个地方值,这里的卷积层需要打印模型获得,不要自己盲目瞎猜:
if k == 'backbone.backbone.dark2.0.conv.weight'pruning_plan = DG.get_pruning_plan((model.backbone.backbone.dark2)[0].conv, tp.prune_conv, idxs=pruning_idxs)
支持网络层的剪枝:调用layer_pruning(whole_model_weights):
included_layers = list((model.backbone.backbone.dark2.modules())) # 针对某层剪枝
Note:剪枝成功以后,会打印模型的参数变化量!如果没有打印,说明你剪的不对,好好检查一下!
剪枝以后的log日志文件会保存在logs文件下
剪枝后的微调训练
将train.py中的pruned_train设置为True.
False为正常训练,然后自己修改batch_size。
注意修改model_path和classes_path,不然会报错!
剪枝前的网络输入大小和微调训练以及推理时的大小必须一致!
训练自己的数据集
如果你有用过Bubbliiiing up主的代码,你将很快就能上手。数据集采用的是VOC的形式
VOCdevkit/ `-- VOC2007 |-- Annotations (存放xml标签文件) |-- ImageSets | `-- Main `-- JPEGImages (存放图像)
在model_data中新建一个new_classes.txt,里面写入自己的类。运行voc_annotation.py,会在当前目录生成2007_train.txt文件和2007_val.txt文件。(可以检查一下里面有没有生成成功)
在train.py中,将classes_path修改为model_data/new_classes.txt【等预测的时候,也是需要在yolo.py中修改这里】
然后根据需要修改其他超参即可训练,训练权重会保存在logs文件中(默认保存权值,不含网络结构)
预测

参数说明:下面终端的输入都是可选的
--predict:预测模式
--pruned:开启剪枝预测或训练
--image:图像检测
--video:开始视频检测
--video_path:视频路径
--camid:摄像头id 默认0
--fps:FPS测试
--dir_predict:对一个文件夹下图像进行预测
--phi:可以选择s,m,l,x等
--input_shape:网络输入大小,默认640
--confidence:置信度阈值
--nms_iou:iou阈值
--num_classes:类别数量,默认80
--fuse:是否开启卷积层和BN层融合加速,默认False
终端输入:
# 图像预测 python demo.py --predict --image
# 视频预测 python demo.py --predict --video --camdi 0
# fps测试 python demo.py --predict --fps
默认预测都为yolox_s,如果要指定其他网络,输入:(需要注意的是在yolo.py修改权重路径,如果是自己数据集,还需要修改classes_path)
# 使用yolox_l预测 python demo.py --predict --image --phi l
Conv与BN层的融合推理加速
其他命令可以搭配使用,比如采用conv和bn融合的方式进行推理
python demo.py --predict --image --fuse
通过测试发现FPS提升了3帧/s左右(我的GPU是1650)
日志文件的保存
本项目采用loguru工具捕获日志,检测和训练中的一些日志记录会自动记录,保存在logs文件下,一个log文件的大小我设置的上限大小为1 MB,如果超过该范围,会自动生成一个新的.log文件,可以自己修改这个值,或者修改日志保存时间(以免保存了太多的日志)。如果不想要这个功能,可以找到相应的位置注释掉即可。
这里只是帮助大家造轮子,用尽可能简单的代码实现一些功能,不用大家再去看复杂的工程代码,最终的效果需要自己耐心调试,慢慢“炼丹”!
权重
链接:百度网盘 请输入提取码
https://pan.baidu.com/s/1Jbq8dCv893rZ7RkaANUZgQ 提取码:yypn
代码(如果有帮助,麻烦点个star呗~):
边栏推荐
- Daily question 1: force deduction: 225: realize stack with queue
- 硬件開發筆記(十): 硬件開發基本流程,制作一個USB轉RS232的模塊(九):創建CH340G/MAX232封裝庫sop-16並關聯原理圖元器件
- Hardware development notes (10): basic process of hardware development, making a USB to RS232 module (9): create ch340g/max232 package library sop-16 and associate principle primitive devices
- Chapter 3: detailed explanation of class loading process (class life cycle)
- 十二、启动流程
- Mongodb (III) - CRUD
- 小程序系统更新提示,并强制小程序重启并使用新版本
- GPS从入门到放弃(十一)、差分GPS
- 数据处理技巧(7):MATLAB 读取数字字符串混杂的文本文件txt中的数据
- 硬件开发笔记(十): 硬件开发基本流程,制作一个USB转RS232的模块(九):创建CH340G/MAX232封装库sop-16并关联原理图元器件
猜你喜欢

2020 Bioinformatics | GraphDTA: predicting drug target binding affinity with graph neural networks

UNI-Admin基础框架怎么关闭创建超级管理员入口?

Oracle control file and log file management

Common sense: what is "preservation" in insurance?

Xiaoman network model & http1-http2 & browser cache
![[线性代数] 1.3 n阶行列式](/img/6e/54f3a994fc4c2c10c1036bee6715e8.gif)
[线性代数] 1.3 n阶行列式

ResNet-RS:谷歌领衔调优ResNet,性能全面超越EfficientNet系列 | 2021 arxiv

GPS du début à l'abandon (XIII), surveillance autonome de l'intégrité du récepteur (raim)

BarcodeX(ActiveX打印控件) v5.3.0.80 免费版使用

2021 geometry deep learning master Michael Bronstein long article analysis
随机推荐
GPS from getting started to giving up (XIII), receiver autonomous integrity monitoring (RAIM)
GPS从入门到放弃(十八)、多路径效应
Anaconda installs third-party packages
Hardware development notes (10): basic process of hardware development, making a USB to RS232 module (9): create ch340g/max232 package library sop-16 and associate principle primitive devices
NetXpert XG2帮您解决“布线安装与维护”难题
LeetCode刷题(十一)——顺序刷题51至55
[Digital IC hand tearing code] Verilog burr free clock switching circuit | topic | principle | design | simulation
0 basic learning C language - digital tube
0 basic learning C language - interrupt
Search element topic (DFS)
硬件開發筆記(十): 硬件開發基本流程,制作一個USB轉RS232的模塊(九):創建CH340G/MAX232封裝庫sop-16並關聯原理圖元器件
Mongodb (III) - CRUD
OpenCV VideoCapture. Get() parameter details
labelimg的安装与使用
BarcodeX(ActiveX打印控件) v5.3.0.80 免费版使用
VIP case introduction and in-depth analysis of brokerage XX system node exceptions
墨西哥一架飞往美国的客机起飞后遭雷击 随后安全返航
Insert sort and Hill sort
2020 Bioinformatics | GraphDTA: predicting drug target binding affinity with graph neural networks
【数字IC手撕代码】Verilog无毛刺时钟切换电路|题目|原理|设计|仿真
https://github.com/YINYIPENG-EN/Pruning_for_YOLOX