当前位置：网站首页>高斯推断推导

高斯推断推导

2022-08-03 23:58:00 【威士忌燕麦拿铁】

设有一对服从多元正态分布的变量 $(\boldsymbol{x}, \boldsymbol{y})$ ，可以写出他们的联合概率密度函数：

$p(\boldsymbol{x}, \boldsymbol{y})=\mathcal{N}\left(\left[\begin{array}{l}\boldsymbol{\mu}_{x} \\\boldsymbol{\mu}_{y}\end{array}\right],\left[\begin{array}{ll}\boldsymbol{\Sigma}_{x x} & \boldsymbol{\Sigma}_{x y} \\\boldsymbol{\Sigma}_{y x} & \boldsymbol{\Sigma}_{y y}\end{array}\right]\right)$

其中， $\boldsymbol{\Sigma}_{y x}=\boldsymbol{\Sigma}_{x y}^{\mathrm{T}}$ 。

由舒尔补有：

$\left[\begin{array}{cc}\boldsymbol{\Sigma}_{x x} & \boldsymbol{\Sigma}_{x y} \\\boldsymbol{\Sigma}_{y x} & \boldsymbol{\Sigma}_{y y}\end{array}\right]=\left[\begin{array}{cc}\mathbf{1} & \boldsymbol{\Sigma}_{x y} \boldsymbol{\Sigma}_{y y}^{-1} \\\mathbf{0} & \mathbf{1}\end{array}\right]\left[\begin{array}{cc}\boldsymbol{\Sigma}_{x x}-\boldsymbol{\Sigma}_{x y} \boldsymbol{\Sigma}_{y y}^{-1} \boldsymbol{\Sigma}_{y x} & \mathbf{0} \\\mathbf{0} & \boldsymbol{\Sigma}_{y y}\end{array}\right]\left[\begin{array}{cc}\mathbf{1} & \mathbf{0} \\\boldsymbol{\Sigma}_{y y}^{-1} \boldsymbol{\Sigma}_{y x} & \mathbf{1}\end{array}\right]$

对两边同时求逆有：

${\left[\begin{array}{cc}\boldsymbol{\Sigma}_{x x} & \boldsymbol{\Sigma}_{x y} \\\boldsymbol{\Sigma}_{y x} & \boldsymbol{\Sigma}_{y y}\end{array}\right]^{-1}= \left[\begin{array}{cc}\mathbf{1} & \mathbf{0} \\-\boldsymbol{\Sigma}_{y y}^{-1} \boldsymbol{\Sigma}_{y x} & \mathbf{1}\end{array}\right]} \left[\begin{array}{cc}\left(\boldsymbol{\Sigma}_{x x}-\boldsymbol{\Sigma}_{x y} \boldsymbol{\Sigma}_{y y}^{-1} \boldsymbol{\Sigma}_{y x}\right)^{-1} & \boldsymbol{0} \\\boldsymbol{0} & \boldsymbol{\Sigma}_{y y}^{-1}\end{array}\right]\left[\begin{array}{cc}\mathbf{1} & -\boldsymbol{\Sigma}_{x y} \boldsymbol{\Sigma}_{y y}^{-1} \\\mathbf{0} & \mathbf{1}\end{array}\right]$

因此，联合概率密度函数 $p(\boldsymbol{x}, \boldsymbol{y})$ 指数部分的二次项为：

$\begin{aligned}&\left(\left[\begin{array}{l}\boldsymbol{x} \\\boldsymbol{y}\end{array}\right]-\left[\begin{array}{l}\boldsymbol{\mu}_{x} \\\boldsymbol{\mu}_{y}\end{array}\right]\right)^{\mathrm{T}}\left[\begin{array}{ll}\boldsymbol{\Sigma}_{x x} & \boldsymbol{\Sigma}_{x y} \\\boldsymbol{\Sigma}_{y x} & \boldsymbol{\Sigma}_{y y}\end{array}\right]^{-1}\left(\left[\begin{array}{l}\boldsymbol{x} \\\boldsymbol{y}\end{array}\right]-\left[\begin{array}{l}\boldsymbol{\mu}_{x} \\\boldsymbol{\mu}_{y}\end{array}\right]\right) \\=&\left(\left[\begin{array}{l}\boldsymbol{x} \\\boldsymbol{y}\end{array}\right]-\left[\begin{array}{l}\boldsymbol{\mu}_{x} \\\boldsymbol{\mu}_{y}\end{array}\right]\right)^{\mathrm{T}}\left[\begin{array}{cc}\boldsymbol{1} & \boldsymbol{0} \\-\boldsymbol{\Sigma}_{y y}^{-1} \boldsymbol{\Sigma}_{y x} & \boldsymbol{1}\end{array}\right]\left[\begin{array}{cc}\left(\boldsymbol{\Sigma}_{x x}-\boldsymbol{\Sigma}_{x y} \boldsymbol{\Sigma}_{y y}^{-1} \boldsymbol{\Sigma}_{y x}\right)^{-1} & \boldsymbol{0} \\\mathbf{0} & \boldsymbol{\Sigma}_{y y}^{-1}\end{array}\right] \\& \times\left[\begin{array}{cc}\mathbf{1} & -\boldsymbol{\Sigma}_{x y} \boldsymbol{\Sigma}_{y y}^{-1} \\\mathbf{0} & \mathbf{1}\end{array}\right]\left(\left[\begin{array}{l}\boldsymbol{x} \\\boldsymbol{y}\end{array}\right]-\left[\begin{array}{l}\boldsymbol{\mu}_{x} \\\boldsymbol{\mu}_{y}\end{array}\right]\right) \\=&\left(\boldsymbol{x}-\boldsymbol{\mu}_{x}-\boldsymbol{\Sigma}_{x y} \boldsymbol{\Sigma}_{y y}^{-1}\left(\boldsymbol{y}-\boldsymbol{\mu}_{y}\right)\right)^{\mathrm{T}}\left(\boldsymbol{\Sigma}_{x x}-\boldsymbol{\Sigma}_{x y} \boldsymbol{\Sigma}_{y y}^{-1} \boldsymbol{\Sigma}_{y x}\right)^{-1} \\& \times\left(\boldsymbol{x}-\boldsymbol{\mu}_{x}-\boldsymbol{\Sigma}_{x y} \boldsymbol{\Sigma}_{y y}^{-1}\left(\boldsymbol{y}-\boldsymbol{\mu}_{y}\right)\right)+\left(\boldsymbol{y}-\boldsymbol{\mu}_{y}\right)^{\mathrm{T}} \boldsymbol{\Sigma}_{y y}^{-1}\left(\boldsymbol{y}-\boldsymbol{\mu}_{y}\right)\end{aligned}$

很明显可以看出，这是两个二次项的和。

又由贝叶斯公式有：

$p(\boldsymbol{x}, \boldsymbol{y})=p(\boldsymbol{x} \mid \boldsymbol{y}) p(\boldsymbol{y})$

并且：

$p(\boldsymbol{y}) =\mathcal{N}\left(\boldsymbol{\mu}_{y}, \boldsymbol{\Sigma}_{y y}\right)$

因此，由幂运算中同底数幂相乘，底数不变、指数相加的性质，可以得到：

$p(\boldsymbol{x} \mid \boldsymbol{y}) =\mathcal{N}\left(\boldsymbol{\mu}_{x}+\boldsymbol{\Sigma}_{x y} \boldsymbol{\Sigma}_{y y}^{-1}\left(\boldsymbol{y}-\boldsymbol{\mu}_{y}\right), \boldsymbol{\Sigma}_{x x}-\boldsymbol{\Sigma}_{x y} \boldsymbol{\Sigma}_{y y}^{-1} \boldsymbol{\Sigma}_{y x}\right)$

这便是高斯推断中最重要的部分：从状态的先验概率分布出发，然后基于一些观测值来缩小这个范围。

原网站

版权声明
本文为[威士忌燕麦拿铁]所创，转载请带上原文链接，感谢
https://blog.csdn.net/whatiscode/article/details/126100663

当前位置：网站首页>高斯推断推导

高斯推断推导

边栏推荐

猜你喜欢

随机推荐