当前位置:网站首页>凸函数的Hessian矩阵与高斯牛顿下降法增量矩阵半正定性的理解
凸函数的Hessian矩阵与高斯牛顿下降法增量矩阵半正定性的理解
2022-06-10 15:08:00 【知易行难wangshuailpp】
1.正定矩阵,半正定矩阵以及负定矩阵
矩阵所有特征值都大于零,则是正定矩阵
矩阵所有的特征值都不小于零,则是半正定矩阵
矩阵所有的特征值都小于零,则是负定矩阵
2.凸函数定义,海塞矩阵半正定性数学和几何意义
凸函数:任意属于定义域的两个自变量x1和x2,且对于任意0 =< a <= 1,如果函数f()满足f(a*x1+(1-a)) =< a*f(x1)+(1-a)f(x2),那么函数f()是凸函数。形象上的理解如下图所示,函数曲线上任意两点的连线一定在函数曲线的上方: 
多元函数的海塞矩阵半正定性就相当于一元函数二阶导非负性,因此凸函数的海塞矩阵一定是半正定。要想真正的理解凸函数海塞矩阵半正定性,需要从泰勒展开说起,
下式是一元函数泰勒二阶展开: 
如果函数f(x)是凸函数,那么必定当一阶导为零时,二阶导必须大于等于零,这样才满足f(x)存在极小值。
下式是多元函数泰勒展开,此时二阶导数变成了海塞矩阵: 
如果一阶导为0,是不是极小值完全取决于不同的dx, dy下,能不能做到最后一项一直非负。只有对于任意dx和dy,[dx,dy]H[dx,dy]T一直非负的情况,我们才能说这是极小值。如果一直非正,这就是极大值。如果它一会正一会负,就是鞍点。因此凸函数海塞矩阵是半正定矩阵。
3.高斯牛顿下降法中增量矩阵H半正定性
高斯牛顿法的实质也是用泰勒展开得到的,二次型来代替原函数,利用二次型的极值点的情况,逼近原函数的极值点。按照上面凸函数的推导,这里其实也是求一个极小值点,说白了也是一个凸函数的极值点。这里的增量矩阵就是凸函数的海塞矩阵。因此要满足高斯牛顿法有极小值点,必须要求增量矩阵半正定性。这里引用高翔视觉SLAM十四讲中内容,当增量矩阵为半正定型时,可能会出现奇异矩阵和病态的情况,此时增量的稳定性较差,因此高斯牛顿法要求增量矩阵为正定性,但实际情况下是半正定。
边栏推荐
- 如何写一个全局的 Notice 组件?
- Using GDB to quickly read the kernel code of PostgreSQL
- Hutool Usage Summary (VIP collection version)
- Kubernetes 1.24: preventing unauthorized volume mode switching
- 【Rust日报】2022-04-20 MnemOS 首次发布
- Insight Technology a été sélectionné dans le rapport panorama des fournisseurs d'analyse de l'amour et d'informatique de la vie privée et a été évalué comme représentant des fournisseurs de solutions
- 3、再遇HandyControl之窗体
- Kubernetes 1.24:statefulset introduces maxunavailable copies
- 共创地市价值空间,2022年华为商业分销地市百城行·宁波站成功举办
- Golang []byte to file
猜你喜欢

opencv#4 手写体识别:自建训练集完美

Software intelligence: formal rules of AAAS system metrics and grammars

Remote monitoring and data acquisition solution
![[logodetection data set processing] (2) draw the label box of the training set picture](/img/66/6c19b80b99d1e3ce50bac439e0e903.jpg)
[logodetection data set processing] (2) draw the label box of the training set picture

Several reasons and solutions of virtual machine Ping failure
![[logodetection dataset processing] (4) extract the logo area of each picture](/img/cf/a8d5f840f52a56d498fa36b2343c07.png)
[logodetection dataset processing] (4) extract the logo area of each picture

Day10/11 递归 / 回溯

One-way hash function

Consumption mode of Message Oriented Middleware

New exploration of meta company | reduce Presto latency by using alluxio data cache
随机推荐
2022第十四届南京国际人工智能产品展会
Applet to realize global data sharing
orgin框架 笔记
Wechat applet closes the current page
CANN的接口调用流程概述
在什么场景下,我们不能使用箭头函数?
Interview question details
Golang []byte to file
Golang []byte 转 File
2022 the 14th Nanjing International artificial intelligence product exhibition
Hutool Usage Summary (VIP collection version)
C# 游戏雏形 人物地图双重移动
一文带你了解J.U.C的FutureTask、Fork/Join框架和BlockingQueue
竟然还有人说ArrayList是2倍扩容,今天带你手撕ArrayList源码
My first go program
OpenTelemetry Metrics发布候选版本
Kubernetes 1.24: avoid conflicts when assigning IP addresses to services
Kubernetes 1.24: preventing unauthorized volume mode switching
小程序实现全局数据共享
力扣每日一题-第18天-350.两个数据的交集Ⅱ