当前位置:网站首页>CV-图像分类
CV-图像分类
2022-06-23 17:37:00 【巴川笑笑生】
什么是图像分类
核心任务
根据图像特征进行区分
给图像打标签
是更高级任务的基础
例如目标检测,图像分割
难点
语义鸿沟
- 视角
- 光照
- 尺度
- 遮挡
- 形变
- 背景杂波
- 类内形变
- 运动模糊
- 类别繁多
基于规则的方法
硬编码难以实现
数据驱动的方法

图像表示
- 全局特征
- 局部特征
如SIFT+word bag
- 像素
分类器
- SVM
- AdaBoost
- 随机森林
- 贝叶斯
- 线性分类器
- 神经网络
损失函数
- 0-1损失
- 交叉熵
- L1 L2
优化算法
- 一阶迭代
- 梯度下降
- 随机梯度下降
- 小批量随机梯度下降
- 二阶迭代
- 牛顿法
- BFGS L-BFGS
训练过程
- 数据集划分
- 数据预处理
- 数据增强
- 过拟合 欠拟合
- 超参数
- 模型集成
图像类别
- 二值图像
- 灰度图像
- 彩色图像
线性分类器
第i类线性分类器
f i ( w i , x ) = w i T x + b f_{i}(w_{i},x)=w_{i}^{T}x+b fi(wi,x)=wiTx+b
决策规则,哪个函数值最大就是哪个
权值w可以视为模板,匹配程度越高得分越高
权值也可视为超空间的分界面
损失函数
联系模型参数和模型性能指导模型优化参数
度量预测值和真实值的区别,输出通常是非负数(距离)
作为反馈信号,降低损失函数以提升模型性能
一般定义
L = 1 N ∑ i L i ( f i ( w , x i ) , y i ) L=\frac{1}{N}\sum_{i}L_{i}(f_{i}(w,x_{i}),y_{i}) L=N1i∑Li(fi(w,xi),yi)
正则项
同样一个损失函数值对应的权重不是唯一的
为了选择最优的权重w,我们需要正则项
L = 1 N ∑ i L i ( f i ( w , x i ) , y i ) + λ R ( w ) L=\frac{1}{N}\sum_{i}L_{i}(f_{i}(w,x_{i}),y_{i})+\lambda R(w) L=N1i∑Li(fi(w,xi),yi)+λR(w)
前向称为数据项,后项称为正则项
正则项防止过拟合
正则项与数据无关,只与模型有关
λ \lambda λ是超参数
超参数
学习过程前设置的参数,而不是学出来的
对模型性能影响巨大
可以使模型有偏好
L 2 L_{2} L2正则 ∑ w 2 \sum w^{2} ∑w2
惩罚大权值,鼓励权值分散
确保尽量把所有维度都用起来,而不是依赖少数特征
L 1 L_{1} L1正则 ∑ ∣ w ∣ \sum |w| ∑∣w∣
弹性正则 L 1 + β L 2 L_{1}+\beta L_{2} L1+βL2
参数优化
利用损失函数输出做反馈信号调制模型参数,提升模型性能
目标是找到使得L最优的w
梯度下降
- 方向 负梯度
- 长度 步长
算法
while True
w梯度=计算梯度(w,y,L)
w=w-w梯度*学习率
边栏推荐
- [Wwise] there is no sound problem after Wwise is embedded in unity and packaged
- Wiley-中国科学院文献情报中心开放科学联合研讨会第二讲:开放获取期刊选择及论文投稿...
- Implementing Domain Driven Design - using ABP framework - General guidelines
- Strong cache and negotiation cache in http
- [Huazhong University of science and technology] information sharing for the first and second examinations of postgraduate entrance examination
- Practical circuit analysis 3
- 【故障公告】取代 memcached 的 redis 出现问题造成网站故障
- 2022年T电梯修理考试题库及模拟考试
- 实用电路分析3
- 嵌入式开发基础之任务管理(线程管理)
猜你喜欢

TT 语音落地 Zadig:开源共创 Helm 接入场景,环境治理搞得定!

【故障公告】取代 memcached 的 redis 出现问题造成网站故障

Leetcode: hash table 02 (intersection of two arrays)

3000帧动画图解MySQL为什么需要binlog、redo log和undo log

论文阅读 (47):DTFD-MIL: Double-Tier Feature Distillation Multiple Instance Learning for Histopathology..

知道创宇:内容向善,AI+人工赋能

Paper reading (48):a Library of optimization algorithms for organizational design

研控电机步进模式

一,数组--滑动窗口问题--长度最小的子数组--水果成篮问题

iMeta | 南农沈其荣团队发布微生物网络分析和可视化R包ggClusterNet
随机推荐
Strong cache and negotiation cache in http
Goframe framework: add tracing Middleware
论文阅读 (48):A Library of Optimization Algorithms for Organizational Design
Prevent users from submitting repeatedly in the uniapp project
反直觉的三门问题,80%的人都会错?
计算机学院改考后,网络空间安全学院也改考了!南京理工大学计算机考研
leetcode刷题:哈希表04 (两数之和)
【故障公告】取代 memcached 的 redis 出现问题造成网站故障
Wiley- Open Science Joint Symposium of the documentation and information center of the Chinese Academy of Sciences, lecture 2: open access journal selection and paper submission
实用电路分析3
leetcode刷题:哈希表05 (四数相加 II)
启示录《贝索斯的商业逻辑与领导力法则》
Thesis reading (53):universal advantageous perturbations
How do I write a small program that can automatically edit new year greetings
"Tribute to a century old master, collect pocket book tickets"
Imeta | Nannong shenqirong team released microbial network analysis and visualization R package ggclusternet
Set up your own website (13)
2022年在网上办理股票开户安全吗?
第十三届蓝桥杯单片机国赛真题
【Qt】第十章:数据库