当前位置:网站首页>【CV-Learning】图像分类

【CV-Learning】图像分类

2022-08-04 05:29:00 小梁要努力哟

什么是图像分类任务?

图像分类任务是计算机视觉中的核心任务,其目标是根据图像信息中所反映的不同特征,把不同类别的图像区分开来。
具体来说,就是从已知的类别标签集合中为给定的输入图片选定一个类别标签。

图像分类的难点

跨越“语义鸿沟”,建立像素语义的映射。
在这里插入图片描述

图像处理的方法

基于规则的分类方法

硬编码:将输入给到函数的参数,经过函数的处理,返回结果。

特点:这种方法适用于物体形态相对固定,但是仍需要其他方法的辅助。通过边缘检测和角点分析,识别一件具有多种形态的物体是很困难的,故不适应于不同光照、有遮挡等比较难识别的物体。

数据驱动的图像分类方法

图像分类方法
数据集构建
分类器的设计与学习
分类器决策

数据集构建

监督机器学习和无监督机器学习,分别对应有标签和无标签。

分类器的设计与学习

从数据集中归纳出规律,找出数学模型及其参数。

在这里插入图片描述

图像表示

1.像素表示
目前主流的表示方法,适用于神经网络(结构化),将特征和分类结合在一起进行处理。
2.全局特征表示(如GIST)
从图像抽出一个全局特征向量来描述图像。适用于风景类、室内场景、建筑等大场景类的分类。不适合有遮挡等细致问题。
3.局部特征表示(如:SIFT,特征+词袋模型)
从图像中抽取若干有典型意义的区块,用这些区块表示整图,即使部分区块被遮挡,影响也不大。

分类器

学习各个分类器都是在学习各个分类器的强项、弱项以及原理。
1.近邻分类器
2.贝叶斯分类器
3.线性分类器
4.支撑向量机分类器(线性分类器的拓展)
5.神经网络分类器
6.随机森林
7.Adaboost
···

损失函数

1.0-1损失
2.多类支撑向量机损失
3.交叉熵损失
4.L1损失
5.L2损失
···

优化算法

以下方法均为迭代优化法:

1.一阶方法
1)梯度下降
2)随机梯度下降
3)小批量随机梯度下降

2.二阶方法
1)牛顿法
2)BFGS
3)L-BFGS

训练过程

1.数据集划分
2.数据预处理
3.数据增强
若数据不够,通过旋转、裁剪等方法将数据变得更强,让数据集尽量的多,尽量的全面。
4.欠拟合与过拟合
前者是在训练集与真实应用场景下正确率差距较大;后者是单纯记忆训练集,而不是学习其中的规律。
5.超参数调整
该参数的设计与样本无关,是人为提前设计好的。
6.模型集成

常用的分类任务评价指标

正确率与错误率

正确率(accuracy) =分对的样本数/全部样本数
错误率(error rate) = 1 -正确率

top1指标与top5指标

在这里插入图片描述

原网站

版权声明
本文为[小梁要努力哟]所创,转载请带上原文链接,感谢
https://blog.csdn.net/Y0704__00/article/details/125824475