当前位置:网站首页>第六章 支持向量机
第六章 支持向量机
2022-07-28 12:51:00 【CsdN317a】
目录
第六章 支持向量机
支持向量机的目的是找到一个超平面来将不同的类别分开;支持向量回归是回归问题,希望学得一个回归方程y=f(x)使得,f(x)与y尽可能接近。
一、间隔与支持向量
1.分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面。
2.超平面线性方程:

3.样本点到超平面得距离:


4.距离超平面最近的训练样本点使得(6.3)等号成立,这样的样本称作支持向量,两个异类支持向量到超平面的距离称作“间隔”:


5.支持向量机的目的是找到具有最大间隔的划分超平面,支持向量机SVM的基本型:

二、对偶问题
1.求解SVM的最优解w、b值,可以转化为对偶问题,使用拉格朗日乘子法可得到“对偶问题”:

拉格朗日乘子法得到的式子可以写成:

上式转化为对偶问题可得:

将偏导为零带入拉格朗日式中:


2.求解对偶问题,需要满足KKT条件:


3.支持向量机重要性质:模型最终结果只与支持向量有关,大部分训练样本都不需要保留。

4.求解对偶问题的算法,著名的代表算法SMO:



5.确定偏移项b:

三、核函数
1.对于非线性可分的数据,需要将数据映射到更高维度的空间内,从而找到线性可分的超平面。
核函数可以将样本从原始空间映射到一个更高维的特征空间,任意一个核函数都隐式地定义了一个称为“再生核希尔波特空间”的特征空间。

![]()

2.核函数的分类:
线性核;多项式核;高斯核;拉普拉斯核;Sigmoid核
四、软间隔与正则化
1.为了防止过拟合,允许支持向量机在一些样本上出错,引入软间隔

2.采用合页损失函数,优化目标为:

C为惩罚系数,C趋于无穷,不允许样本出错;C为有限值,允许样本出错。
3.带有松弛变量
的拉格朗日函数:

4.软间隔的对偶问题,软间隔支持向量机最终模型仍仅与支持向量有关,采用合页损失函数仍保持了稀疏性



5.正则化
二范数倾向于w的分量取值尽量均衡,即非零分量个数尽量稠密;
一范数倾向于w的分量取值尽量稀疏,即非零分量个数尽量少。
五、支持向量回归SVR
1.SVR的支持向量仅是训练样本的一部分,其解仍具有稀疏性。


六、核方法
1.核函数对应的再生核希尔伯特空间;
2.基于核函数的学习方法统称为核方法。
3.如何提高效率,使SVM能适用于大规模数据一直是研究重点。核函数直接决定了支持向量机与核方法的最终性能,但遗憾的是,核函数的选择一直是未决问题。
边栏推荐
- 使用 IPtables 进行 DDoS 保护
- 111. SAP UI5 FileUploader 控件实现本地文件上传,接收服务器端的响应时遇到跨域访问错误
- 安全保障基于软件全生命周期-Istio的认证机制
- R language test sample proportion: use prop The test function performs the single sample proportion test to calculate the confidence interval of the p value of the successful sample proportion in the
- Humiliation, resistance, reversal, 30 years, China should win Microsoft once
- Some thoughts on.Net desktop development
- 30天刷题训练(一)
- 记一次使用pdfbox解析pdf,获取pdf的关键数据的工具使用
- Dojnoip201708 cheese solution
- 【架构】评分较高的三本微服务书籍的阅读笔记
猜你喜欢

接口调不通,如何去排查?没想到10年测试老鸟栽在这道面试题上

Strict mode -- let and const -- arrow function -- Deconstruction assignment -- string template symbol -- set and map -- generator function

After finishing, help autumn move, I wish you call it an offer harvester

111. The sap ui5 fileuploader control realizes local file upload and encounters a cross domain access error when receiving the response from the server

安全保障基于软件全生命周期-Istio的认证机制

No swagger, what do I use?

30天刷题训练(一)

使用 IPtables 进行 DDoS 保护

算法---不同路径(Kotlin)

SAP UI5 FileUploader 控件实现本地文件上传,接收服务器端的响应时遇到跨域访问错误的试读版
随机推荐
POJ3259虫洞题解
【安全】 阅读 RFC6749 及理解 Oauth2.0 下的授权码模式
Today's sleep quality record 75 points
C language: optimized merge sort
R语言因子数据的表格和列联表(交叉表)生成:使用summay函数分析列表查看卡方检验结果判断两个因子变量是否独立(使用卡方检验验证独立性)
vite在项目中配置路径别名
Remember to use pdfbox once to parse PDF and obtain the key data of PDF
数据库系统原理与应用教程(059)—— MySQL 练习题:操作题 1-10(三)
IntersectionObserver交叉观察器
How to play a data mining game entry Edition
I miss the year of "losing" Li Ziqi
No swagger, what do I use?
图的遍历(BFS&&DFS基础)
盘点操作URL中常用的几个高效API
TS扫盲大法-基础篇
Volcanic stone investment Zhang Suyang: hard technology, the relatively certain answer in the next 10 years
要想组建敏捷团队,这些方法不可少
How to check if the interface cannot be adjusted? I didn't expect that the old bird of the 10-year test was planted on this interview question
R language ggplot2 visualization: use the ggviolin function of ggpubr package to visualize violin diagrams, set the palette parameter, and customize the border colors of violin diagrams at different l
Blue Bridge Training (additional interview questions) day 7