当前位置:网站首页>基于Caffe ResNet-50网络实现图片分类(仅推理)的实验复现
基于Caffe ResNet-50网络实现图片分类(仅推理)的实验复现
2022-07-25 15:38:00 【51CTO】
摘要:本实验主要是以基于Caffe ResNet-50网络实现图片分类(仅推理)为例,学习如何在已经具备预训练模型的情况下,将该模型部署到昇腾AI处理器上进行推理。
本文分享自华为云社区《 【CANN训练营】【2022第二季】【新手班】基于Caffe ResNet-50网络实现图片分类(仅推理)的实验复现》,作者: StarTrek 。
本实验主要是以基于Caffe ResNet-50网络实现图片分类(仅推理)为例,学习如何在已经具备预训练模型的情况下,将该模型部署到昇腾AI处理器上进行推理。该实验的主要任务有:
1、将Caffe ResNet-50网络的模型文件转换为适配昇腾AI处理器的离线模型( * .om文件);
2、加载该om文件,对2张 * .jpg图片进行同步推理,分别得到推理结果后,再对推理结果进行处理,输出top5置信度的类别标识;
3、将测试的图片替换为自己的图片并重新编译运行。
一、云服务器的使用
首先为了更好的让我们能够了解并学习昇腾的相关知识,华为CANN训练营为每一位学员都给予了一定的云服务器资源,关于云服务器的使用简单总结如下:
本次提供的共享镜像是:Ubuntu 18.04(系统) + 5.1.RC2.alpha005(CANN环境版本)
登陆华为云->进入控制台->申请ESC弹性云服务器->获取弹性公网IP->运用SSH远程访问云服务器->正常按照ubuntu系统的终端命令来操作使用服务器
资源链接:
远程终端软件推荐MobaXterm: https://mobaxterm.mobatek.net/
软件使用方法: https://blog.csdn.net/xuanying_china/article/details/120080644
进入终端后为root用户,需要进入HwHiAiUser用户
指令:
可以使用ls或者ll指令随意浏览系统中已有的文件情况。

二、基于Caffe ResNet-50网络实现图片分类(仅推理)实验
准备工作完成之后,下面就可以开始正式的实验之旅啦!可以按照仓库里的readme文件所述步骤一步步操作,此处也仅仅只是简单的给出实验的步骤和实验图。
仓库资源链接: https://gitee.com/ascend/samples/tree/master/cplusplus/level2_simple_inference/1_classification/resnet50_imagenet_classification
1、下载样例代码
克隆sample仓里的代码

进入到resnet50_imagenet_classification样例的文件夹中

2、获取ResNet-50预训练模型
先创建一个用来存储该模型的文件夹,并打开该文件夹
从网页直接通过命令下载预训练模型:权重文件(resnet50.caffemodel)和模型文件(resnet50.prototxt)

3、模型转换
上述下载的预训练模型需要首先运用ATC模型转换工具将该模型转换成昇腾AI处理器支持的离线模型(.om)
官方文档ATC工具学习资源: https://www.hiascend.com/document/detail/zh/CANNCommunityEdition/51RC2alpha005/infacldevg/atctool
流程:
首先先切换到样例目录下(接着上面的操作就是上一级目录)
然后运行模型转换工具

打开model文件夹可以看到resnet50.om已经转换完成了

4、下载测试图片
进入data文件夹,并下载两张ImageNet数据集中存在类别的图片

测试的两张图


5、图片格式转换
下载的图片是JPEG格式的,需要转换成适合模型输入要求格式的二进制文件(.bin)
在data目录下,执行transferPic.py脚本,将*.jpg转换为*.bin,同时将图片从1024 * 683的分辨率缩放为224 * 224。

6、编译运行
进入“cplusplus/level2_simple_inference/1_classification/resnet50_imagenet_classification”样例目录
设置临时的环境变量,配置程序编译依赖的头文件与库文件路径

建立build文件夹,准备编译代码文件

进入build文件夹,编译.cpp文件


可以在样例目录(cplusplus/level2_simple_inference/1_classification/resnet50_imagenet_classification)下的out文件夹中找到编译好的可执行main文件,接下来我们直接运行main文件

三、替换图片数据进行测试
这里在网上随便找了两张图(一张金鱼label-1,一张金毛犬label-207),可以随意找几张图,只要是JPG格式的图片即可,图片中的事物类型最好是ImageNet数据集标签中的类型。
1、添加图片并转换格式
可以直接下载到本地电脑中,然后直接将文件拖到MobaXterm软件的云服务器文件列表中,为了方便直接先在列表中找到前面的data文件夹,然后直接拖拽到该文件夹下即可。


按照前面的操作(5、图片格式转换)重新进行图片文件格式的转换,在data目录下运行

2、修改sample_process.cpp源码,添加新增的两张图片的路径
在testFile列表中增加前面新添加的并转换好的那两张bin格式的文件路径,路径仿照前两个写即可,不过别忘记不同文件路径间的逗号分隔哦

3、重新编译源码
按照前面的步骤进行即可(6、编译运行),需要注意的是,如果重启过服务器,之前设置的编译临时环境会丢失,需要再次设置临时的环境变量(配置程序编译依赖的头文件与库文件路径),然后可以在build/intermediates/host文件下直接运行make编译即可,编译器会自动编译修改过的源文件并覆盖。

4、推理
按照前面的步骤重新运行编译好的main文件即可(6、编译运行中的最后一步),注意文件的路径,需要在out文件夹下运行,因为main文件是被保存在这里的。

最后我们可以看到
标签为1是金鱼,第一张图是金鱼的概率为99.7070%
标签为207是金毛犬,第二张图是金毛犬的概率为99.5605%
边栏推荐
- 2600 pages in total! Another divine interview manual is available~
- 兆骑科创海内外高层次创新创业人才服务平台,双创成果转化平台
- Flink-1.13.6版本的 Flink sql以yarn session 模式运行,怎么禁用托管
- Get the ask code corresponding to the key pressed by the keyboard
- 2021 Shanghai match-b-ranked DP
- 谷歌博客:采用多重游戏决策Transformer训练通用智能体
- 共2600页!又一份神级的面试手册面世~
- 2021上海市赛-B-排序后dp
- LeetCode - 225 用队列实现栈
- Data system partition design - Request Routing
猜你喜欢

Pytorch学习笔记-刘二老师RNN高级篇-代码注释及结果

Get the ask code corresponding to the key pressed by the keyboard

GAMES101复习:线性代数

JVM—类加载器和双亲委派模型

MySQL—用户和权限管控

Take you to create your first C program (recommended Collection)

P4552 differential

Why is preparestatement better and safer?

LeetCode - 622 设计循环队列 (设计)

Leetcode - 707 design linked list (Design)
随机推荐
2019 Shaanxi provincial competition j-bit operation + greed
2021上海市赛-D-卡特兰数变种,dp
2021 Shanghai sai-d-cartland number variant, DP
JVM—类加载器和双亲委派模型
如何实现页面包含
兆骑科创海内外高层次创新创业人才服务平台,双创成果转化平台
2022-07-25日报:微软提出CodeT:代码生成新SOTA,20个点的性能提升
Window system black window redis error 20creating server TCP listening socket *: 6379: listen: unknown error19-07-28
Icpc2021 Kunming m-violence + chairman tree
Matlab simulation of BPSK modulation system (1)
PAT甲级1153 Decode Registration Card of PAT (25 分)
2021HNCPC-E-差分,思维
Where is there a demo to set up the flex CDC to draw the number of MySQL?
「数字安全」警惕 NFT的七大骗局
Gary Marcus: 学习语言比你想象的更难
Leetcode - 362 knock counter (Design)
Cf750f1 thinking DP
Take you to create your first C program (recommended Collection)
Seata中jdbc下只有一个lib嘛?
Understand "average load"