当前位置:网站首页>基于YOLOv5的口罩佩戴检测方法
基于YOLOv5的口罩佩戴检测方法
2022-07-01 19:40:00 【小段学长】
摘 要
正确的佩戴口罩对现阶段有效减低人员之间感染新型冠状病毒具有重要意义。基于YOLOv5在图像识别检测领域的优异性能,本文研究基于基于YOLOv5的口罩佩自动戴检测方法。首先从网络和真实生活中中寻找并采集不同场景人群口罩佩戴的图片约500张并自建数据集,然后利用YOLOv5模型框架,修改其相关配置文件和检测参数,并采用数据增强和Dropout技术防止过拟合。实验结果验证了YOLOv5模型人群口罩佩戴图像识别任务上的优越性能,测试集上的YOLOv5s模型识别准确率高达85.45%。
关键词 图像识别;口罩佩戴检测;YOLOv5;特征学习;
引言
自2019年以来,新型冠状病毒肺炎袭击全球,影响着人们的生命安全,我国采取了强有效的防控措施,在抗击新冠肺炎方面取得了较大的成功,但我们依然不能松懈,在人流量密集的机场,车站和市场等,稍有不慎就有传播风险。正确的佩戴口罩是现阶段有效减低人员之间感染的有效措施之一,而佩戴口罩进行检测也是需要一定的检测技术,目前口罩佩戴检测存在着因周围复杂环境影响从而出现效率低,导致漏检等情况。为了达到更好的检测效果,本文主要是利用YOLOv5网络模型在轻量化口罩佩戴检测算法的研究。
1 数据预处理
1.1 数据采集
人群口罩佩戴图像是2022年5月23日,由本组三名同学分别在网络上以及在真实场景中用手机拍摄所得,共计1027张图片。不同采集设备获取的原始图像分辨率不同,在数据建模时统一缩放至324×324大小的规格
表1 数据采集信息
编号 相机分辨率 手机型号 图像数目
1 2532 x 1170 Iphone12 250
2 2532 x 1170 IPhone13 325
3 4000 x 3000 Xiaomi 10S 301
(a) 口罩佩戴样式
(b) 口罩种类
图1. 口罩佩戴样式数据展示
1.2 数据增强
为了提高卷积神经网络模型的泛化能力,对每幅口罩佩戴图像通过旋转、平移、扭曲、缩放、翻转等传统数字图像处理方法进行随机变换以扩充样本个数。某幅口罩图像进行数据增强后的部分样本如图2所示,通过随机变换生成的口罩佩戴图像大量扩充了数据集,使样本分布更广泛。
图 2 数据增强后的部分图像样本
2 检测模型
本文采用YOLOv5构建目标口罩检测模型,其御用多个残差组件使得网络模型网络的不断加深,直接增加网络特征提取和特征融合的能力。
2.1 网络结构
本文构建的识别模型主要是YOLOv5s,其具有小型轻量,快速的特点,适合于快速准确的识别任务。模型如图3-1。
模型输入图像设定为324×324 的三通道彩色图像,残差结构中依次包含瓶颈残差模块、常规残差模块×2、瓶颈残差模块、常规残差模块×3、瓶颈残差模块、常规残差模块×22、瓶颈残差模块、常规残差模块×2。其内部卷积核设置略有调整。最后,在网络全连接层之后采用Softmax分类器输出每个类别的分类概率。
图3-1YOLOv5识别网络图示
3 实验
3.1 实验设置
在图像检测实验中,测试了不同的网络架构在不同的参数下表现出来的效果。改造模型结构的方法:改变YOLOv5中自带三种模型,观察在相同参数下三种模型检测的准确率。
实验编程开发环境为PyCharm Community Edition 2021.1, 计算设备为个人计算机, CPU为Intel Core i7-1065G7,主频为1.30GHz,内为8GB,显卡为NVIDIA GeForce MX230,显存为4GB。训练数据和测试数据的划分比例为9:1。
3.2 实验结果
3.2.1 最佳实验结果
首先,将全部人群口罩图像数据集合并在一起,随机分层抽样90%作为训练集,其余10%作为测试机,随机打乱顺序读入,训练过程中每次迭代随机打乱一次,训练5次,每次训练后验证一次,数据增强方法是上下左右随机移动20个像素,x轴随机反射。识别准确率如表3所示。其中YOLOv5x训练集准确率最高但训练耗时132分51秒, YOLOv5l训练耗时105分43秒,YOLOv5s训练耗时78分34秒。从资源消耗与收益比来看,YOLOv5s性能较强。YOLOv5x泛化能力较差,存在过拟合的问题且训练过程振荡较为严重。
表3. 最佳的识别结果
算法名称 训练准确率 测试准确率
YOLOv5x 100 97.87
YOLOv5l 99.87 95.55
YOLOv5s 98.32 94.68
4 结论
本文采用YOLOv5检测网络模型建立人群口罩佩戴检测模型,用于自动检测不同场景中流动人群口罩佩戴情况。首先,在互联网百度图库中共找151张人群口罩佩戴情况图像,接着从身边不同场景中拍摄人群口罩佩戴情况图像共计876张。总计1027张。并人工标注人群口罩佩戴情况;随后YOLOv5模型架构,迁移学习了一种卷积神经网络,测试集上的识别准确率可达98%,在不同场景中,对不同角度,不同口罩类型有极高的识别准确率,整体表现较好,对于新冠疫情防控具有一定的实际意义。
为了提高大场景下大规模人群口罩佩戴检测的准确率、时效性和鲁棒性,下一步工作将继续优化网络结构和参数,加入卷积模型,提升整体精度,改造数据集内容,结合特征学习的层次化表示思想,将特征迁移、特征学习和人工特征相结合来构建易于训练的深度学习模型。
参 考 文 献
[1] 王莉茹.基于YOLOv5s的口罩佩戴检测[J]. 西藏科技,2022(05):65-67.
[2] 张路遥,韩华.基于YOLOv5s的人脸是否佩戴口罩检测[J].智能计算机与应用,2021,11(09):196-199.
[3] 谈世磊,别雄波,卢功林,谈小虎.基于YOLOv5网络模型的人员口罩佩戴实时监测[J].激光杂志,2021,42(02):147-150.
[4] 王沣.改进yolov5的口罩和安全帽佩戴人工智能检测识别算法[J].建筑与预算,2020(11):67-69.
[5] 王欣然,田启川,张东.人脸口罩佩戴检测研究综述[J].计算机工程
欢迎大家加我微信交流讨论(请备注csdn上添加)
边栏推荐
猜你喜欢
RichView TRVDocParameters 页面参数设置
leetcode刷题:栈与队列01(用栈实现队列)
2022年低压电工考试试题及答案
Uniapp uses Tencent map to select points without window monitoring to return users' location information. How to deal with it
What if the win11 shortcut key switching input method doesn't respond? Shortcut key switching input method does not respond
Past and present life of product modular design
leetcode刷题:栈与队列06(前 K 个高频元素)
目标检测——Yolo系列
Test of NSI script
开环和闭环是什么意思?
随机推荐
4. 对象映射 - Mapping.Mapstercover
On the usage of a magic function
【mysql 07】GPG key retrieval failed: “Couldn‘t open file /etc/pki/rpm-gpg/RPM-GPG-KEY-mysql-2022“
深度学习 神经网络基础
Comprehensive evaluation and detailed inventory of high-quality note taking software (I) note, obsedian, remnote, flowus
王者战力查询改名工具箱小程序源码-带流量主激励广告
在技术升级中迎合消费者需求,安吉尔净水器“价值战”的竞争之道
RichView TRVDocParameters 页面参数设置
cocoaPods 添加成功后,导入不了头文件或者not found file 报错
cmake工程化相关
走进如心小镇,数智化变革连接“未来社区”
Win11 how to hide the taskbar? Win11 method to hide the taskbar
leetcode刷题:栈与队列07(滑动窗口最大值)
[C language] explain the usage of memset() function in detail
架构师毕业总结
想请教一下,券商选哪个比较好尼?本人小白不懂,现在网上开户安全么?
以飞地园区为样本,看雨花与韶山如何奏响长株潭一体化发展高歌
关于new Set( )还有哪些是你不知道的
leetcode刷题:二叉树03(二叉树的后序遍历)
杰理之烧录都使用 VBAT 供电,供电电压 4.2V【篇】