边际概率的信息矩阵

最新推荐文章于 2024-08-21 15:53:22 发布

原创最新推荐文章于 2024-08-21 15:53:22 发布 · 800 阅读

2 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#VINS

----------VIO原理系列专栏收录该内容

14 篇文章

订阅专栏

【符号约定】
随机变量 $X=[XmT,XrT]T\Chi=[\Chi^T_m,\Chi^T_r]^T$ ；
下标 $m, r$ ：分别表示margin, reserve；
$Σ,Λ\Sigma,\Lambda$ ：分别表示协方差矩阵、信息矩阵；
$p(X)=p(Xm,Xr)p(\Chi)=p(\Chi_m,\Chi_r)$ ，表示联合概率；
$p(Xr)=∫p(Xm,Xr)dXmp(\Chi_r)=\int p(\Chi_m,\Chi_r)d\Chi_m$ ，表示边际概率。

假设随机变量服从零均值高斯分布。

已知联合概率 $p(X)=p(Xm,Xr)p(\Chi)=p(\Chi_m,\Chi_r)$ 对应的信息矩阵 $Λ\Lambda$ ，求边际概率 $p(Xr)p(\Chi_r)$ 对应的信息矩阵 $Λr′\Lambda'_r$ 。

解：首先， $Λ\Lambda$ 按变量的维数分块：
$Λ=[ΛmmΛmrΛrmΛrr]\Lambda=\begin{bmatrix} \Lambda_{mm} & \Lambda_{mr} \\ \Lambda_{rm} & \Lambda_{rr} \\ \end{bmatrix}$

我们知道把 $p(X)p(\Chi)$ 对应的信息矩阵求逆，将得到 $p(X)p(\Chi)$ 对应的协方差矩阵（反之亦然）：
$(1)Λ−1=[ΣmmΣmrΣrmΣrr]=Σ\Lambda^{-1}=\begin{bmatrix} \Sigma_{mm} & \Sigma_{mr} \\ \Sigma_{rm} & \Sigma_{rr} \\ \end{bmatrix}=\Sigma \tag{1}$

式中， $Σrr\Sigma_{rr}$ 即为边际概率 $p(Xr)p(\Chi_r)$ 对应的协方差矩阵。【从高斯联合概率分布中，显然可得】

此时，我们把该 $Σrr\Sigma_{rr}$ 求逆，将得到边际概率 $p(Xr)p(\Chi_r)$ 对应的信息矩阵 $Λr′\Lambda'_r$ ，即为所求！
$Λr′=Σrr−1\Lambda'_r=\Sigma^{-1}_{rr}$

不难发现使用这种思路，我们求了两次逆。下面使用一些技巧：
对于公式（1），做一些变形构造 $Σrr−1\Sigma^{-1}_{rr}$ ：
$(2)Λ=[ΛmmΛmrΛrmΛrr]=[ΣmmΣmrΣrmΣrr]−1\Lambda=\begin{bmatrix} \Lambda_{mm} & \Lambda_{mr} \\ \Lambda_{rm} & \Lambda_{rr} \\ \end{bmatrix} =\begin{bmatrix} \Sigma_{mm} & \Sigma_{mr} \\ \Sigma_{rm} & \Sigma_{rr} \\ \end{bmatrix}^{-1} \tag{2}$

开始变形之前，给出两个公式（可以展开验证一下），
第一个：
$[ΣmmΣmrΣrmΣrr]=[IΣmrΣrr−10I][Σmm−ΣmrΣrr−1Σrm00Σrr][I0Σrr−1ΣrmI]\begin{bmatrix} \Sigma_{mm} & \Sigma_{mr} \\ \Sigma_{rm} & \Sigma_{rr} \\ \end{bmatrix} = \begin{bmatrix} I & \Sigma_{mr} \Sigma^{-1}_{rr} \\ 0 & I \end{bmatrix} \begin{bmatrix} \Sigma_{mm}-\Sigma_{mr}\Sigma^{-1}_{rr}\Sigma_{rm} & 0 \\ 0 & \Sigma_{rr} \\ \end{bmatrix} \begin{bmatrix} I & 0 \\ \Sigma^{-1}_{rr}\Sigma_{rm} & I \end{bmatrix}$

我们定义 $ΔΣrr≜Σmm−ΣmrΣrr−1Σrm\Delta_{\Sigma_{rr}} \triangleq \Sigma_{mm}-\Sigma_{mr}\Sigma^{-1}_{rr}\Sigma_{rm}$ 为 $Σrr\Sigma_{rr}$ 关于 $Σ\Sigma$ 的舒尔补。
第二个（求上式的逆）：
$[ΣmmΣmrΣrmΣrr]−1=[I0−Σrr−1ΣrmI][ΔΣrr−100Σrr−1][I−ΣmrΣrr−10I]=[ΔΣrr−1−ΔΣrr−1ΣmrΣrr−1−Σrr−1ΣrmΔΣrr−1Σrr−1+Σrr−1ΣrmΔΣrr−1ΣmrΣrr−1]\begin{aligned} \begin{bmatrix} \Sigma_{mm} & \Sigma_{mr} \\ \Sigma_{rm} & \Sigma_{rr} \\ \end{bmatrix}^{-1} &= \begin{bmatrix} I & 0 \\ -\Sigma^{-1}_{rr}\Sigma_{rm} & I \end{bmatrix} \begin{bmatrix} \Delta_{\Sigma_{rr}}^{-1} & 0 \\ 0 & \Sigma_{rr}^{-1} \\ \end{bmatrix} \begin{bmatrix} I & -\Sigma_{mr} \Sigma^{-1}_{rr} \\ 0 & I \end{bmatrix} \\ &= \begin{bmatrix} \Delta_{\Sigma_{rr}}^{-1} & -\Delta_{\Sigma_{rr}}^{-1} \Sigma_{mr} \Sigma_{rr}^{-1} \\ -\Sigma_{rr}^{-1} \Sigma_{rm} \Delta_{\Sigma_{rr}}^{-1} & \Sigma_{rr}^{-1}+\Sigma_{rr}^{-1} \Sigma_{rm} \Delta_{\Sigma_{rr}}^{-1} \Sigma_{mr} \Sigma_{rr}^{-1}\\ \end{bmatrix} \end{aligned}$

将上式展开，代入公式（2），得：
$[ΛmmΛmrΛrmΛrr]=[ΔΣrr−1−ΔΣrr−1ΣmrΣrr−1−Σrr−1ΣrmΔΣrr−1Σrr−1+Σrr−1ΣrmΔΣrr−1ΣmrΣrr−1]\begin{aligned} \begin{bmatrix} \Lambda_{mm} & \Lambda_{mr} \\ \Lambda_{rm} & \Lambda_{rr} \\ \end{bmatrix} &= \begin{bmatrix} \Delta_{\Sigma_{rr}}^{-1} & -\Delta_{\Sigma_{rr}}^{-1} \Sigma_{mr} \Sigma_{rr}^{-1} \\ -\Sigma_{rr}^{-1} \Sigma_{rm} \Delta_{\Sigma_{rr}}^{-1} & \Sigma_{rr}^{-1}+\Sigma_{rr}^{-1} \Sigma_{rm} \Delta_{\Sigma_{rr}}^{-1} \Sigma_{mr} \Sigma_{rr}^{-1}\\ \end{bmatrix} \end{aligned}$

对应元素相等，发现：
$Σrr−1=Λrr−ΛrmΛmm−1Λmr\Sigma^{-1}_{rr}=\Lambda_{rr}-\Lambda_{rm}\Lambda_{mm}^{-1}\Lambda_{mr}$

即为所求。
对比第一种思路，发现求逆的次数少了，且求逆的规模小了！

【应用】
设 $k$ 时刻的最小二乘优化之后，现将状态中的 $Xm\Chi_m$ marg掉：
$ΛX=−b[ΛmmΛmrΛrmΛrr][XmXr]=−[bmbr]\begin{aligned} \Lambda\Chi &=-b \\ \begin{bmatrix} \Lambda_{mm} & \Lambda_{mr} \\ \Lambda_{rm} & \Lambda_{rr} \\ \end{bmatrix} \begin{bmatrix} \Chi_{m} \\ \Chi_{r} \end{bmatrix} &= -\begin{bmatrix} b_{m} \\ b_{r} \end{bmatrix} \end{aligned}$

marg后，变量 $Xm\Chi_m$ 的测量信息传递给了变量 $Xr\Chi_r$ ，并构成 $Xr\Chi_r$ 的先验信息：
$[I0−ΛrmΛmm−1I][ΛmmΛmrΛrmΛrr][XmXr]=−[I0−ΛrmΛmm−1I][bmbr][ΛmmΛmr0Λrr−ΛrmΛmm−1Λmr][XmXr]=−[bmbr−ΛrmΛmm−1bm]\begin{aligned} \begin{bmatrix} I & 0 \\ -\Lambda_{rm}\Lambda_{mm}^{-1} & I\\ \end{bmatrix} \begin{bmatrix} \Lambda_{mm} & \Lambda_{mr} \\ \Lambda_{rm} & \Lambda_{rr} \\ \end{bmatrix} \begin{bmatrix} \Chi_{m} \\ \Chi_{r} \end{bmatrix} &= - \begin{bmatrix} I & 0 \\ -\Lambda_{rm}\Lambda_{mm}^{-1} & I\\ \end{bmatrix} \begin{bmatrix} b_{m} \\ b_{r} \end{bmatrix} \\ \begin{bmatrix} \Lambda_{mm} & \Lambda_{mr} \\ 0 & \Lambda_{rr}-\Lambda_{rm}\Lambda_{mm}^{-1}\Lambda_{mr}\\ \end{bmatrix} \begin{bmatrix} \Chi_{m} \\ \Chi_{r} \end{bmatrix} &= - \begin{bmatrix} b_{m} \\ b_{r}-\Lambda_{rm}\Lambda_{mm}^{-1} b_{m} \end{bmatrix} \end{aligned}$

只取第二行： $Λr′Xr=−br′\Lambda'_r\Chi_r=-b'_r$

设 $k^{'}$ 时刻，加入了新的状态 $Xnew\Chi_{new}$ 及对应的观测，开始新一轮的最小二乘优化：
$b(k′)=ΠTbr′(k)+Σ(i,j∈S)JijT(k′)Σij−1rij(k′)Λ(k′)=ΠTΛr′(k)Π+Σ(i,j∈S)JijT(k′)Σij−1Jij(k′)\begin{aligned} b(k') &=\Pi^Tb'_r(k)+\Sigma_{(i,j\in \mathcal{S})} J^T_{ij}(k') \Sigma^{-1}_{ij} r_{ij}(k') \\ \Lambda(k') &= \Pi^T \Lambda'_r(k) \Pi+ \Sigma_{(i,j\in \mathcal{S})} J^T_{ij}(k') \Sigma^{-1}_{ij} J_{ij}(k') \end{aligned}$