当前位置:网站首页>HOG特征学习笔记
HOG特征学习笔记
2022-08-05 01:51:00 【Wsyoneself】
- 前述知识:
- 特征描述符通过提取图像有用的信息,并丢弃无关信息来简化图像表示
- 根据任务判断什么特征有用:检测马路上的车道线:边缘检测,边缘信息有用,颜色信息无用
- 定义:
- 方向梯度直方图,可用来表示图像的物体特征,让能够检测出这类物体。
- 是一个类似于canny边缘检测器sift(比例不变和特征变换)的特征描述符,在cv和图像处理中用于目标检测
- 本质:对图像的局部部分中出现的梯度方向进行计数。使用梯度的大小和角度来计算特征(生成直方图)
- HOG描述符关注对象的结构或形状
HOG特征描述符将3通道的彩色图像转为一定长度的特征向量
在HOG特征描述符中,梯度方向的分布,即梯度方向的直方图被视作特征。
图像的角度(x和y的导数),边缘和拐角(强度突变的区域)周围的梯度幅度很大,包含更多关于物体形状的信息。
利用图像梯度就可以只关注边角信息,以勾勒出人的模样
- HOG常和svm配合使用,用于训练高精度的目标分类器.HOG(感觉和sift很像)+SVM的工作流程:
- 对输入的图片进行预处理:
- 裁减
- 缩放到固定尺寸
- 灰度处理(可选,对于彩色图像,相对三通道颜色值分别计算梯度,取梯度值最大的作为该像素的梯度)
- 伽马校正(输出图像是输入图像的幂函数,指数为γ,γ越大,图像越暗):调整图像对比度(减少光照(光照不匀,局部阴影)对图像的影响),使得图像更接近人眼看到的图像
- 计算每个像素点的梯度值(根据3X3的区域进行计算),得到幅度矩阵和角度矩阵:
- 对每个像素点,计算水平梯度和竖直梯度(可使用内核大小为1的sobel算子来获得相同的结果)
- 计算总的梯度强度值和梯度方向(取绝对值,所以范围是[0-180])
- 形成梯度直方图:
- 在一个8X8的cell中计算,则共有8X8X2=128个值(2是包括了梯度强度和梯度方向),通过统计形成梯度直方图,128个值将会变成9个值(此处9只是因为假设将0-180分为了9个bins,来对像素点进行统计m,9个柱的直方图,每个柱的角度范围为20度),降低计算量的同时,对光照等环境变化更加鲁棒。
- 当梯度方向倾向于0度和160度时,表明这些点的梯度方向是向上或向下,表明图像这个位置存在比较明显的横向边缘。
- 对blocks进行normalize
- 向量的每一个值除以向量的模长
- 具体:
- 将8X8的一个区域看做一个cell,再以2X2个cell作为一组,称为block。由于每个cell有9个值(因为8X8X2构建直方图步骤已经变成了9个值(bin)了),2X2个cell则有36个值,hog通过滑动窗口来得到block.
- 对block的梯度直方图进行归一化,由上可知,一个block有4个直方图,将4个直方图拼接成长度为36的向量,然后对整个向量进行归一化
- 滑动窗口,滑动步长为8个像素(就是一个cell),窗口大小是2X2的,每滑动一次,就得到一个长度为36的特征向量。
- 原因:降低光照的影响(图像的梯度对整体光照很敏感,但希望特征描述符不会受到光照变化的影响。所以需要对直方图进行归一化。因为原始像素的倍数变化,归一化之后得到结果是一样的。)
- 计算HOG特征向量:将整幅图像上滑动计算得到的特征向量进行拼接,就得到了整个图像的特征描述符了
- 收集HOG feature(一行高维的vector)放到svm里进行监督学习。
- 所有实践出真知,展示实践结果图:
- 对输入的图片进行预处理:
边栏推荐
猜你喜欢
Creative code confession
MySQL3
高数_复习_第1章:函数、极限、连续
day14--postman接口测试
深度学习训练前快速批量修改数据集中的图片名
新唐NUC980使用记录:在用户应用中使用GPIO
Live playback including PPT download | Build Online Deep Learning based on Flink & DeepRec
新来个技术总监,把DDD落地的那叫一个高级,服气
深度学习原理学习小结 - Self-Attention/Transformer
【七夕如何根据情侣倾听的音乐进行薅羊毛】背景音乐是否会影响情侣对酒的选择
随机推荐
AI+小核酸药物|Eleven完成2200万美元种子轮融资
How DHCP works
Greenplum数据库故障分析——能对数据库base文件夹进行软连接嘛?
Leetcode brushing questions - 22. Bracket generation
C language basics -- pointers
Chapter 09 Use of Performance Analysis Tools [2. Index and Tuning] [MySQL Advanced]
迁移学习——Distant Domain Transfer Learning
2022 EdgeX中国挑战赛8月3日即将盛大开幕
迅睿cms网站搬迁换了服务器后网站不能正常显示
4. PCIe interface timing
JWT简单介绍
MySQL3
Transfer Learning - Joint Geometrical and Statistical Alignment for Visual Domain Adaptation
【MySQL系列】- LIKE查询 以%开头一定会让索引失效吗
[Machine Learning] 21-day Challenge Study Notes (2)
硬实力和软实力,哪个对测试人来说更重要?
直播回放含 PPT 下载|基于 Flink & DeepRec 构建 Online Deep Learning
Knowledge Points for Network Planning Designers' Morning Questions in November 2021 (Part 1)
内存取证系列1
Log an error encountered when compiling google gn "I could not find a ".gn" file ..."