边际概率的信息矩阵（二）

最新推荐文章于 2024-08-21 15:53:22 发布

原创最新推荐文章于 2024-08-21 15:53:22 发布 · 584 阅读

0 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#VINS

----------VIO原理系列专栏收录该内容

14 篇文章

订阅专栏

与第一篇流程几乎完全一样，唯一的不同之处在于：将要被 marg 掉的变量位于信息矩阵的右下角！
【符号约定】
随机变量 $X=[XrT,XmT]T\Chi=[\Chi^T_r,\Chi^T_m]^T$ ；
下标 $m, r$ ：分别表示margin, reserve；
$Σ,Λ\Sigma,\Lambda$ ：分别表示协方差矩阵、信息矩阵；
$p(X)=p(Xr,Xm)p(\Chi)=p(\Chi_r,\Chi_m)$ ，表示联合概率；
$p(Xr)=∫p(Xr,Xm)dXmp(\Chi_r)=\int p(\Chi_r,\Chi_m)d\Chi_m$ ，表示边际概率。

假设随机变量服从零均值高斯分布。

已知联合概率 $p(X)=p(Xr,Xm)p(\Chi)=p(\Chi_r,\Chi_m)$ 对应的信息矩阵 $Λ\Lambda$ ，求边际概率 $p(Xr)p(\Chi_r)$ 对应的信息矩阵 $Λr′\Lambda'_r$ 。

解：首先， $Λ\Lambda$ 按变量的维数分块：
$Λ=[ΛrrΛrmΛmrΛmm]\Lambda=\begin{bmatrix} \Lambda_{rr} & \Lambda_{rm} \\ \Lambda_{mr} & \Lambda_{mm} \\ \end{bmatrix}$

我们知道把 $p(X)p(\Chi)$ 对应的信息矩阵求逆，将得到 $p(X)p(\Chi)$ 对应的协方差矩阵（反之亦然）：
$(1)Λ−1=[ΣrrΣrmΣmrΣmm]=Σ\Lambda^{-1}=\begin{bmatrix} \Sigma_{rr} & \Sigma_{rm} \\ \Sigma_{mr} & \Sigma_{mm} \\ \end{bmatrix}=\Sigma \tag{1}$

式中， $Σrr\Sigma_{rr}$ 即为边际概率 $p(Xr)p(\Chi_r)$ 对应的协方差矩阵。【从高斯联合概率分布中，显然可得】

此时，我们把该 $Σrr\Sigma_{rr}$ 求逆，将得到边际概率 $p(Xr)p(\Chi_r)$ 对应的信息矩阵 $Λr′\Lambda'_r$ ，即为所求！
$Λr′=Σrr−1\Lambda'_r=\Sigma^{-1}_{rr}$

不难发现使用这种思路，我们求了两次逆。下面使用一些技巧：
对于公式（1），做一些变形构造 $Σrr−1\Sigma^{-1}_{rr}$ ：
$(2)Λ=[ΛrrΛrmΛmrΛmm]=[ΣrrΣrmΣmrΣmm]−1\Lambda=\begin{bmatrix} \Lambda_{rr} & \Lambda_{rm} \\ \Lambda_{mr} & \Lambda_{mm} \\ \end{bmatrix} =\begin{bmatrix} \Sigma_{rr} & \Sigma_{rm} \\ \Sigma_{mr} & \Sigma_{mm} \\ \end{bmatrix}^{-1} \tag{2}$

开始变形之前，给出两个公式（可以展开验证一下），
第一个：
$[ΣrrΣrmΣmrΣmm]=[I0ΣmrΣrr−1I][Σrr00Σmm−ΣmrΣrr−1Σrm][IΣrr−1Σrm0I]\begin{bmatrix} \Sigma_{rr} & \Sigma_{rm} \\ \Sigma_{mr} & \Sigma_{mm} \\ \end{bmatrix} = \begin{bmatrix} I & 0 \\ \Sigma_{mr} \Sigma^{-1}_{rr} & I \end{bmatrix} \begin{bmatrix} \Sigma_{rr} & 0 \\ 0 & \Sigma_{mm}-\Sigma_{mr}\Sigma^{-1}_{rr}\Sigma_{rm}\\ \end{bmatrix} \begin{bmatrix} I & \Sigma^{-1}_{rr}\Sigma_{rm} \\ 0 & I \end{bmatrix}$

我们定义 $ΔΣrr≜Σmm−ΣmrΣrr−1Σrm\Delta_{\Sigma_{rr}} \triangleq \Sigma_{mm}-\Sigma_{mr}\Sigma^{-1}_{rr}\Sigma_{rm}$ 为 $Σrr\Sigma_{rr}$ 关于 $Σ\Sigma$ 的舒尔补。
第二个（求上式的逆）：
$[ΣrrΣrmΣmrΣmm]−1=[I−Σrr−1Σrm0I][Σrr−100ΔΣrr−1][I0−ΣmrΣrr−1I]=[Σrr−1+Σrr−1ΣrmΔΣrr−1ΣmrΣrr−1−Σrr−1ΣrmΔΣrr−1−ΔΣrr−1ΣmrΣrr−1ΔΣrr−1]\begin{aligned} \begin{bmatrix} \Sigma_{rr} & \Sigma_{rm} \\ \Sigma_{mr} & \Sigma_{mm} \\ \end{bmatrix}^{-1} &= \begin{bmatrix} I & -\Sigma^{-1}_{rr}\Sigma_{rm} \\ 0 & I \end{bmatrix} \begin{bmatrix} \Sigma_{rr}^{-1} & 0 \\ 0 & \Delta_{\Sigma_{rr}}^{-1} \\ \end{bmatrix} \begin{bmatrix} I & 0 \\ -\Sigma_{mr} \Sigma^{-1}_{rr} & I \end{bmatrix} \\ &= \begin{bmatrix} \Sigma_{rr}^{-1}+\Sigma_{rr}^{-1} \Sigma_{rm} \Delta_{\Sigma_{rr}}^{-1} \Sigma_{mr} \Sigma_{rr}^{-1} & -\Sigma_{rr}^{-1} \Sigma_{rm} \Delta_{\Sigma_{rr}}^{-1} \\ -\Delta_{\Sigma_{rr}}^{-1} \Sigma_{mr} \Sigma_{rr}^{-1} & \Delta_{\Sigma_{rr}}^{-1} \\ \end{bmatrix} \end{aligned}$

将上式展开，代入公式（2），得：
$[ΛrrΛrmΛmrΛmm]=[Σrr−1+Σrr−1ΣrmΔΣrr−1ΣmrΣrr−1−Σrr−1ΣrmΔΣrr−1−ΔΣrr−1ΣmrΣrr−1ΔΣrr−1]\begin{aligned} \begin{bmatrix} \Lambda_{rr} & \Lambda_{rm} \\ \Lambda_{mr} & \Lambda_{mm} \\ \end{bmatrix} &=\begin{bmatrix} \Sigma_{rr}^{-1}+\Sigma_{rr}^{-1} \Sigma_{rm} \Delta_{\Sigma_{rr}}^{-1} \Sigma_{mr} \Sigma_{rr}^{-1} & -\Sigma_{rr}^{-1} \Sigma_{rm} \Delta_{\Sigma_{rr}}^{-1} \\ -\Delta_{\Sigma_{rr}}^{-1} \Sigma_{mr} \Sigma_{rr}^{-1} & \Delta_{\Sigma_{rr}}^{-1} \\ \end{bmatrix} \end{aligned}$