LOAM误差函数、代价函数的雅克比矩阵详细推导,点到线和点到面误差函数求导

本文深入探讨LOAM激光SLAM中的点到线和平面误差函数及其导数的推导过程,采用SO(3)理论简化求解,适用于优化算法如高斯牛顿法。

LOAM误差函数的导数详细推导

前言

LOAM对于激光SLAM的发展起到了举足轻重的作用,他提出了点到线和点到面的误差函数,通过优化的方法,得到了非常不错的激光里程计效果。我猜测作者Zhang Ji很可能是从点到线和点到面的ICP算法中找到的灵感。

在LOAM的论文中以及Zhang Ji早期开源的代码中,对于代价函数求解使用的是欧拉角的方式进行求导解算的。一方面由于未采用矩阵的形式进行推导,导致整个推导过程非常复杂,另一方面在代码实现中,有大量的中间运算过程,实际上对效率也带来了一部分影响。

在后续研究中F LOAM,采用了更加优雅的方式,在SE(3)的理论基础之上推导出了更加规整的雅克比矩阵,并借用ceres进行了实现,也确实对于精度和速度有一定的提升。

LOAM这种使用欧拉角的方式进行优化的方式,一直继承了下来,在LEGO-LOAM、LIO-SAM中均能看到。

在这篇博客中,我将在SO(3)的基础之上进行雅克比矩阵的详细推导,它与F LOAM的SE(3)推导区别并不大,只是我更加喜欢使用SO(3)方式。另外在国内的网站上有较少博客去做这件事,所以我将我的一些理解,向你分享。如果有理解偏颇的地方,烦请斧正。

预备知识

本篇博客会比较偏理论一些,需要你有一些先验知识:

(1)简单的矩阵运算;

(2)向量、矩阵求导;

(3)熟悉最优化理论;

(4)了解LOAM的误差函数的意义,本篇重点是探索误差函数的求解,所以不会去介绍误差函数的由来。

1. 点到直线(Point to Edge)

1.1 点到直线误差函数

de=∥(Rps+t−pt)×n⃗e∥2(1) d_e = \|(Rp_s + t -p_t) \times \vec n_e\|_2 \tag{1} de=(Rps+tpt)×ne2(1)

ded_ede:点到直线的距离(标量);
ptp_tpt:目标(地图)点云中的角点;
psp_sps:源(当前帧)点云中的角点;
n⃗e\vec n_ene:近邻角点组成的直线对应的单位向量。

1.2 误差函数对R(旋转)和t(平移)的求导结果

∂de∂R=(n⃗e×(Rps)∧)T∗(Rps+t−pt)×n⃗e∥(Rps+t−pt)×n⃗∥2∂de∂t=(−n⃗e×I3×3)T∗(Rps+t−pt)×n⃗e∥(Rps+t−pt)×n⃗e∥2(2) \frac{\partial d_e}{\partial R} = (\vec n_e \times (Rp_s)^{\wedge})^T * \frac{(Rp_s + t -p_t) \times \vec n_e}{\|(Rp_s + t -p_t) \times \vec n\|_2} \\ \frac{\partial d_e}{\partial t} = (-\vec n_e \times I_{3\times3})^T *\frac{(Rp_s + t -p_t) \times \vec n_e}{\|(Rp_s + t -p_t) \times \vec n_e\|_2} \tag{2} Rde=(ne×(Rps))T(Rps+tpt)×n2(Rps+tpt)×netde=(ne×I3×3)T(Rps+tpt)×ne2(Rps+tpt)×ne(2)

I3×3I_{3\times 3}I3×3:单位矩阵;
×\times×:该运算符表示向量叉乘;
∗*:该运算符表示一般的向量、矩阵之间的乘法。

1.3 预备数学公式

在推导公式(1)之前,先解释一下用到的一些数学公式:

二范数的导数
∂∥x∥2∂x=x∥x∥2(3) \frac{ \partial\|x\|_2 } {\partial x} = \frac{x}{\|x\|_2} \tag{3} xx2=x2x(3)

其中:x=[x0,x1,x2,⋅]Tx = [x_0,x_1,x_2,\cdot]^{T}x=[x0,x1,x2,]T∥x∥2=x02+x12+⋯\|x\|_2 = \sqrt{x_0^2+x_1^2+\cdots}x2=x02+x12+

标量对向量求导的链式法则

例如:zzz是关于yyy的函数,yyy是关于xxx的函数,它们的传递过程是:x−>y−>zx -> y->zx>y>z. 其中zzz是标量,yyy是向量,xxx是向量,则求导的链式法则如下:
∂z∂x=(∂y∂x)T∂z∂y(4) \frac{\partial z}{\partial x} = (\frac{\partial y}{\partial x})^T \frac{\partial z}{\partial y} \tag{4} xz=(xy)Tyz(4)

叉乘的交换性质
u×v=−v×u(5) u \times v = -v\times u \tag{5} u×v=v×u(5)
旋转矩阵左扰动求导

由于旋转矩阵不满足加法性质,所以采用扰动模型进行求导,这里采用的是对其左乘一个微小转动量δR\delta RδR,其对应的李代数ϕ\phiϕ,于是得到如下结论:(由于求导推导比较简单,并且资料较多,这里只给出结论)
∂Rp∂ϕ=−(Rp)∧(6) \frac{\partial Rp}{\partial \phi} = -(Rp)^{\wedge} \tag{6} ϕRp=(Rp)(6)

∧\wedge:该符号表示向量的反对称矩阵

1.4 误差函数对R和t的求导推导

根据以上数学性质,我们开始完成loam代价函数公式的求导,从而得到雅克比矩阵:

关于R的导数
∂de∂R=∥(Rps+t−pt)×n⃗e∥2∂R(7) \frac{\partial d_e}{\partial R} = \frac{\|(Rp_s + t -p_t) \times \vec n_e\|_2}{\partial R} \tag{7} Rde=R(Rps+tpt)×ne2(7)
对(7)式使用(4)式对应的链式求导法则:
∂de∂R=∥(Rps+t−pt)×n⃗e∥2∂R=(∂((Rps+t−pt)×n⃗e)∂R)T∗(Rps+t−pt)×n⃗e∥(Rps+t−pt)×n⃗∥2(8) \frac{\partial d_e}{\partial R} = \frac{\|(Rp_s + t -p_t) \times \vec n_e\|_2}{\partial R} \\ = (\frac{\partial((Rp_s + t -p_t) \times \vec n_e)}{\partial R} )^{T} * \frac{(Rp_s + t -p_t) \times \vec n_e}{\|(Rp_s + t -p_t) \times \vec n\|_2} \tag{8} Rde=R(Rps+tpt)×ne2=(R((Rps+tpt)×ne))T(Rps+tpt)×n2(Rps+tpt)×ne(8)
对于(8)式中第二行前半部分的偏导数计算:
∂((Rps+t−pt)×n⃗e)∂R=∂(−n⃗e×(Rps+t−pt))∂R=∂(−n⃗e×(Rps))∂R=−n⃗e×(−(Rps)∧)(9) \frac{\partial((Rp_s + t -p_t) \times \vec n_e)}{\partial R} \\ = \frac{\partial( -\vec n_e \times(Rp_s + t -p_t))}{\partial R} \\ = \frac{\partial( -\vec n_e \times(Rp_s))}{\partial R} \\ = -\vec n_e \times(-(Rp_s)^{\wedge}) \tag{9} R((Rps+tpt)×ne)=R(ne×(Rps+tpt))=R(ne×(Rps))=ne×((Rps))(9)
整理之后,得到关于点到线的误差函数关于R的导数:
∂de∂R=(n⃗e×(Rps)∧)T∗(Rps+t−pt)×n⃗e∥(Rps+t−pt)×n⃗∥2(10) \frac{\partial d_e}{\partial R} = (\vec n_e \times (Rp_s)^{\wedge})^T * \frac{(Rp_s + t -p_t) \times \vec n_e}{\|(Rp_s + t -p_t) \times \vec n\|_2} \tag{10} Rde=(ne×(Rps))T(Rps+tpt)×n2(Rps+tpt)×ne(10)
关于t的导数
∂de∂t=∥(Rps+t−pt)×n⃗e∥2∂t=(∂((Rps+t−pt)×n⃗e)∂t)T∗(Rps+t−pt)×n⃗e∥(Rps+t−pt)×n⃗∥2(11) \frac{\partial d_e}{\partial t} = \frac{\|(Rp_s + t -p_t) \times \vec n_e\|_2}{\partial t} \\ = (\frac{\partial((Rp_s + t -p_t) \times \vec n_e)}{\partial t} )^{T} * \frac{(Rp_s + t -p_t) \times \vec n_e}{\|(Rp_s + t -p_t) \times \vec n\|_2} \tag{11} tde=t(Rps+tpt)×ne2=(t((Rps+tpt)×ne))T(Rps+tpt)×n2(Rps+tpt)×ne(11)
对于(11)式第二行左半部分的偏导数计算:
∂((Rps+t−pt)×n⃗e)∂t=−n⃗e×∂(t)∂t=−n⃗e×I3×2(12) \frac{\partial((Rp_s + t -p_t) \times \vec n_e)}{\partial t} \\ = \frac{ -\vec n_e \times \partial(t)}{\partial t} \\ = -\vec n_e \times I_{3\times 2} \tag{12} t((Rps+tpt)×ne)=tne×(t)=ne×I3×2(12)
整理之后,得到关于点到线的误差函数关于t的导数:
∂de∂t=(−n⃗e×I3×3)T∗(Rps+t−pt)×n⃗e∥(Rps+t−pt)×n⃗e∥2(13) \frac{\partial d_e}{\partial t} = (-\vec n_e \times I_{3\times3})^T *\frac{(Rp_s + t -p_t) \times \vec n_e}{\|(Rp_s + t -p_t) \times \vec n_e\|_2} \tag{13} tde=(ne×I3×3)T(Rps+tpt)×ne2(Rps+tpt)×ne(13)

2. 点到平面(Point to Surface)

2.1 点到平面误差函数

dp=∥(Rps+t−pt)T∗n⃗∥2(14) d_p = \| (Rp_s + t - p_t)^T * \vec n \|_2 \tag{14} dp=(Rps+tpt)Tn2(14)

ptp_tpt:目标(地图)点云中的平面点;
n⃗s\vec n_sns:近邻平面点组成的平面对应的法向量。

2.2 误差函数对R(旋转)和t(平移)的求导结果

∂dp∂R=(−(Rps)∧)T∗n⃗∗(Rps+t−pt)T∗n⃗∥(Rps+t−pt)T∗n⃗∥2∂dp∂t=I3×3∗n⃗∗(Rps+t−pt)T∗n⃗∥(Rps+t−pt)T∗n⃗∥2(15) \frac{\partial d_p}{\partial R} = (-(Rp_s)^{\wedge})^T*\vec{n}* \frac{ (Rp_s + t - p_t)^T * \vec n}{\| (Rp_s + t - p_t)^T * \vec n \|_2}\\ \frac{\partial d_p}{\partial t} = I_{3\times3} *\vec{n} * \frac{(Rp_s + t - p_t)^T * \vec n}{\| (Rp_s + t - p_t)^T * \vec n \|_2} \tag{15} Rdp=((Rps))Tn(Rps+tpt)Tn2(Rps+tpt)Tntdp=I3×3n(Rps+tpt)Tn2(Rps+tpt)Tn(15)

2.3 误差函数对R和t的求导推导

根据第1节的推导过程,对于点到平面误差函数的推导就非常容易了!

关于R的导数
∂dp∂R=∂(∥(Rps+t−pt)T∗n⃗∥2)∂R=∂(∥n⃗T∗(Rps+t−pt)∥2)∂R=(∂(n⃗T∗(Rps+t−pt))∂R)T∗(Rps+t−pt)T∗n⃗∥(Rps+t−pt)T∗n⃗∥2=(n⃗T∗∂(Rps)∂R)T∗(Rps+t−pt)T∗n⃗∥(Rps+t−pt)T∗n⃗∥2=(−(Rps)∧)T∗n⃗∗(Rps+t−pt)T∗n⃗∥(Rps+t−pt)T∗n⃗∥2(16) \frac{\partial{d_p}}{\partial R} = \frac{\partial(\|(Rp_s + t - p_t)^T * \vec n \|_2)}{\partial R} \\ = \frac{\partial(\|\vec n^T * (Rp_s + t - p_t)\|_2)}{\partial R} \\ = ( \frac{\partial(\vec n^T * (Rp_s + t - p_t))}{\partial R})^T * \frac{(Rp_s + t - p_t)^T * \vec n}{\| (Rp_s + t - p_t)^T * \vec n \|_2} \\ = ( \frac{\vec n^T * \partial(Rp_s)}{\partial R})^T * \frac{(Rp_s + t - p_t)^T * \vec n}{\| (Rp_s + t - p_t)^T * \vec n \|_2} \\ =(-(Rp_s)^{\wedge})^T*\vec{n}* \frac{ (Rp_s + t - p_t)^T * \vec n}{\| (Rp_s + t - p_t)^T * \vec n \|_2} \tag{16} Rdp=R((Rps+tpt)Tn2)=R(nT(Rps+tpt)2)=(R(nT(Rps+tpt)))T(Rps+tpt)Tn2(Rps+tpt)Tn=(RnT(Rps))T(Rps+tpt)Tn2(Rps+tpt)Tn=((Rps))Tn(Rps+tpt)Tn2(Rps+tpt)Tn(16)

注意:式子(16)中的第二行,利用了定理:常量转置等于自身。所以n⃗T∗(Rps+t−pt)=(Rps+t−pt)T∗n⃗\vec n^T * (Rp_s + t - p_t) = (Rp_s + t - p_t)^T * \vec nnT(Rps+tpt)=(Rps+tpt)Tn。之所以这样做,主要是为了可以直接利用公式(6)进行旋转的求导。

关于t的导数
∂dp∂t=∂(∥(Rps+t−pt)T∗n⃗∥2)∂t=∂(∥n⃗T∗(Rps+t−pt)∥2)∂t=(∂(n⃗T∗(Rps+t−pt))∂t)T∗(Rps+t−pt)T∗n⃗∥(Rps+t−pt)T∗n⃗∥2=(n⃗T∗∂t)∂t)T∗(Rps+t−pt)T∗n⃗∥(Rps+t−pt)T∗n⃗∥2=I3×3∗n⃗∗(Rps+t−pt)T∗n⃗∥(Rps+t−pt)T∗n⃗∥2(17) \frac{\partial{d_p}}{\partial t} = \frac{\partial(\|(Rp_s + t - p_t)^T * \vec n \|_2)}{\partial t} \\ = \frac{\partial(\|\vec n^T * (Rp_s + t - p_t)\|_2)} {\partial t} \\ = (\frac{\partial(\vec n^T * (Rp_s + t - p_t))}{\partial t})^T * \frac{(Rp_s + t - p_t)^T * \vec n}{\| (Rp_s + t - p_t)^T * \vec n \|_2} \\ = (\frac{\vec n^T * \partial t)}{\partial t})^T * \frac{(Rp_s + t - p_t)^T * \vec n}{\| (Rp_s + t - p_t)^T * \vec n \|_2}\\ = I_{3\times3} *\vec{n} * \frac{(Rp_s + t - p_t)^T * \vec n}{\| (Rp_s + t - p_t)^T * \vec n \|_2} \tag{17} tdp=t((Rps+tpt)Tn2)=t(nT(Rps+tpt)2)=(t(nT(Rps+tpt)))T(Rps+tpt)Tn2(Rps+tpt)Tn=(tnTt))T(Rps+tpt)Tn2(Rps+tpt)Tn=I3×3n(Rps+tpt)Tn2(Rps+tpt)Tn(17)
注意:式子(17)中的第二行,利用了定理:常量转置等于自身。所以n⃗T∗(Rps+t−pt)=(Rps+t−pt)T∗n⃗\vec n^T * (Rp_s + t - p_t) = (Rp_s + t - p_t)^T * \vec nnT(Rps+tpt)=(Rps+tpt)Tn

3. 对于loam代价函数的总结

loam的总体代价函数

如下:
d=∑Nde+∑Mds=∑N∥(Rps+t−pt)×n⃗e∥2+∑M∥(Rps+t−pt)T∗n⃗∥2(18) d = \sum_N d_e + \sum_M d_s \\ = \sum_N \|(Rp_s + t -p_t) \times \vec n_e\|_2 + \sum_M \| (Rp_s + t - p_t)^T * \vec n \|_2 \tag{18} d=Nde+Mds=N(Rps+tpt)×ne2+M(Rps+tpt)Tn2(18)
根据1和2小节的求导,可以得到每一个误差的导数,组成一个大的雅克比矩阵(也有可能是向量),有了雅克比矩阵之后带入高斯牛顿或者LM算法即可以求解最优的R和t。该过程是属于最优化理论相关的内容,是比较成熟的理论,不是本篇博客要探索的,不在此做细致介绍。

是否有更好的代价函数形式?

我在复现loam的过程中发现,其中点到线的误差项,也就是∑de\sum d_ede,它实际优化过程中对于R和t求解的贡献比较小,其主要原因是点到面的误差项∑ds\sum d_sds中M的数量比较庞大,在16线激光雷达中,经过我的验证M几乎是N的20倍以上,所以实际过程中,如果我们省略掉点到线的误差项,对于最终的精度并未产生明显影响。也许在插满了细长柱子的环境中点到线的误差项才会有明显作用。否则我认为多数真实环境下,点到面的误差项实际上已经涵盖住了点到线的误差。所以在后来一些开源项目中,例如r3live、fast-lio都只计算点到面的误差。

另外,我也尝试对loam的代价函数做了一些改变,如下式,构建成两个最小二乘项的求和:
d=∑N(de)2+∑M(ds)2=∑N∥(Rps+t−pt)×n⃗e∥22+∑M∥(Rps+t−pt)T∗n⃗∥22(19) d = \sum_N (d_e)^2 + \sum_M (d_s)^2 \\ = \sum_N \|(Rp_s + t -p_t) \times \vec n_e\|_2^2 + \sum_M \| (Rp_s + t - p_t)^T * \vec n \|_2^2 \tag{19} d=N(de)2+M(ds)2=N(Rps+tpt)×ne22+M(Rps+tpt)Tn22(19)
也就是说,对代价函数计算平方二范数误差。在我的意识中,平方二范数会有更好的收敛性,上式应该会比loam的二范数收敛的更好。但是后来的实验中证明我的想法是错误的,上式的求解得到的R和t与真值差距较大。大家可以去思考一下是什么原因导致的?如果有想法的话,可以在评论区留下你的看法。

算法实现过程中的一些小细节

对于式(16)和(17),它们均包含下式:
(Rps+t−pt)T∗n⃗∥(Rps+t−pt)T∗n⃗∥2(20) \frac{(Rp_s + t - p_t)^T * \vec n}{\| (Rp_s + t - p_t)^T * \vec n \|_2} \tag{20} (Rps+tpt)Tn2(Rps+tpt)Tn(20)
观察可以发现,它的值是-1或者1,如果你没看出来,可以花些时间想一想,并不难!

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值