当前位置:网站首页>六、基于深度学习关键点的指针式表计识别
六、基于深度学习关键点的指针式表计识别
2022-07-29 05:22:00 【MY头发乱了】
基于深度学习关键点的指针式表计识别
提示:网上有太多的方案都是分割思路,思路很好,但是在制作数据的时候太费时间,据统计:分割数据标注一张需要180s-360s;而关键点标注控制在30s-90s。
文章目录
具体实现流程
提示:算法是基于deeplabv3语义分割模型和openpose姿态估计模型模改成多任务学习模型,包括关键点检测+指针分割两个并行任务,是整个算法的核心中的核心。
- yolov5表计检测
- 表盘关键点检测和指针检测
- 表计矫正以及坐标的变换
- 拟合出表盘弧形结构,并计算比值
- 根据比值、量程计算出读数
提示:以下是本篇文章正文内容,下面案例可供参考
一、 yolov5表计检测
目标检测就不用多说。该步骤最主要有两个任务,第一,将图像中的表计检测出来;第二,并将每个表计进行分类,为了后面能根据类别配置表盘中的量程。

二、表盘关键点检测和指针检测
该部分是整个算法的核心,需要将关键点检测和分割整合为一个多任务学习模型。关键点检测参考openpose,分割网络参考deeplabv3等主流网络即可。这套算法相较百度的算法(分割刻度和指针)数据标注任务量减轻60%以上,更加的省事,便于优化。
下图是百度的方案:
想知道我的方案吗?那你想象成将刻度变为关键点即可,指针分割道理是一样的。
三、表计矫正以及坐标的变换
将倾斜的表计采用透视变换矫正,并对坐标进行变换。
三、拟合出表盘的弧形结构,并计算比值
根据矫正后的表计所得到的信息,并拟合出表盘结构
三、根据比值、量程计算出读数
最后根据比值、量程计算出具体读数,下图给出的是百分比,没时间转化了,将就用这个图了。
总结
本方案实现:
环境:pytorch、python=3.7、c++
数据标注时间:本方案60s VS 百度方案360s
提示:所以你还愿意采用标注1张图片需要6分钟的方案吗?
一套可靠的方案,让开发、优化、部署、落地都省事。
边栏推荐
- DataX installation
- [semantic segmentation] full attention network for semantic segmentation
- 迁移学习——Transitive Transfer Learning
- 五、图像像素统计
- 引入Spacy模块出错—OSError: [E941] Can‘t find model ‘en‘.
- [convolution kernel design] scaling up your kernels to 31x31: revising large kernel design in CNN
- 并发编程学习笔记 之 Lock锁及其实现类ReentrantLock、ReentrantReadWriteLock和StampedLock的基本用法
- PyTorch基础知识(可入门)
- FFmpeg创作GIF表情包教程来了!赶紧说声多谢乌蝇哥?
- 微信小程序源码获取(附工具的下载)
猜你喜欢

【语义分割】Mapillary 数据集简介

虚假新闻检测论文阅读(一):Fake News Detection using Semi-Supervised Graph Convolutional Network

【卷积核设计】Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs

The third week of postgraduate freshman training: resnet+resnext
![[convolution kernel design] scaling up your kernels to 31x31: revising large kernel design in CNN](/img/71/f3fdf677cd5fddefffd4715e747297.png)
[convolution kernel design] scaling up your kernels to 31x31: revising large kernel design in CNN

迁移学习——Transfer Joint Matching for Unsupervised Domain Adaptation

简单聊聊 PendingIntent 与 Intent 的区别
![[image classification] how to use mmclassification to train your classification model](/img/98/f8536bc4c6a291a028a0c4227653ee.png)
[image classification] how to use mmclassification to train your classification model

【Transformer】SOFT: Softmax-free Transformer with Linear Complexity

Flink connector Oracle CDC synchronizes data to MySQL in real time (oracle19c)
随机推荐
Tear the ORM framework by hand (generic + annotation + reflection)
并发编程学习笔记 之 Lock锁及其实现类ReentrantLock、ReentrantReadWriteLock和StampedLock的基本用法
Are you sure you know the interaction problem of activity?
【Transformer】ACMix:On the Integration of Self-Attention and Convolution
【Transformer】TransMix: Attend to Mix for Vision Transformers
mysql 的show profiles 使用。
Nifi changed UTC time to CST time
【Transformer】ACMix:On the Integration of Self-Attention and Convolution
ASM插桩:学完ASM Tree api,再也不用怕hook了
Markdown syntax
How to obtain openid of wechat applet in uni app project
微信小程序源码获取(附工具的下载)
【CV】请问卷积核(滤波器)3*3、5*5、7*7、11*11 都是具体什么数?
[convolution kernel design] scaling up your kernels to 31x31: revising large kernel design in CNN
pip安装后仍有解决ImportError: No module named XX
[semantic segmentation] setr_ Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformer
Configuration and use of Nacos external database
研究生新生培训第三周:ResNet+ResNeXt
神经网络相关知识回顾(PyTorch篇)
迁移学习—— Transfer Feature Learning with Joint Distribution Adaptation