之前写过一篇讲解BA的博客，不过那篇主要侧重于讲解BA在slam中的应用与求解方式，但是忽略了对于细节的边的构造与jacobian矩阵的计算的讲解，前几天有人提醒我这一点，所以今天抽出来时间补充一下。

BA优化中的边（重投影误差）

Bundle Adjustment，中文翻译有捆集调整、光束法平差。它的主要思想是最小化重投影误差。

BA优化的误差边也就是重投影误差边。 - 投影过程是将一个地图点（三维坐标为\((X,Y,Z)\)）投影到当前帧（假设位姿为\(T_{wc}\)）的像素平面上（得到投影坐标为\((u,v)\)）

误差边的定义是测量坐标（该帧上提取到的此地图点的位置\((u_m,v_m)\)）减去投影得到坐标\((u,v)\)

\[ e = [u_m,v_m]^T - [u,v]^T \]

BA优化中的节点（投影点与关键帧）

通常我们最经常放入BA中进行优化的节点有两个 1. 地图点的三维坐标为\((X,Y,Z)\)

被投影帧的位姿\(T_{wc}\)

当然了，BA优化时只要观测到的约束足够多，方程就足够多，因此可以优化更多节点。比如我们还可以放入的节点有相机内参等。

jacobian的推导

前面已经列出来了重投影误差的定义为：

\[ e = [u_m,v_m]^T - [u,v]^T \]

然后被投影帧的位姿为\(T_{wc}\)，地图点在世界坐标系中的位置为\(P\)，则将其变换到该帧的相机坐标系下的坐标为

\[ P' = T_{wc} * P = [X', Y', Z']^T\]

然后将这个点投影到像素平面上的操作为（此处为了简单忽略了相机畸变）

\[ \left[\begin{array}{c}{Z' u} \\ {Z' v} \\ {Z'}\end{array}\right]=\left[\begin{array}{ccc}{f_{x}} & {0} & {c_{x}} \\ {0} & {f_{y}} & {c_{y}} \\ {0} & {0} & {1}\end{array}\right]\left[\begin{array}{c}{X^{\prime}} \\ {Y^{\prime}} \\ {Z^{\prime}}\end{array}\right] \]

即

\[ u=f_{x} \frac{X^{\prime}}{Z^{\prime}}+c_{x}, \quad v=f_{y} \frac{Y^{\prime}}{Z^{\prime}}+c_{y} \]

重投影误差对地图点三维坐标的jacobian

由上，我们首先计算重投影误差对地图点相机坐标系下坐标\(P^{\prime}\)的偏导，

\[ \frac{\partial e}{\partial P^{\prime}}=-\left[\begin{array}{ccc}{\frac{\partial u}{\partial X^{\prime}}} & {\frac{\partial u}{\partial Y^{\prime}}} & {\frac{\partial u}{\partial Z^{\prime}}} \\ {\frac{\partial v}{\partial X^{\prime}}} & {\frac{\partial v}{\partial Y^{\prime}}} & {\frac{\partial v}{\partial Z^{\prime}}}\end{array}\right]=-\left[\begin{array}{ccc}{\frac{f_{x}}{Z^{\prime}}} & {0} & {-\frac{f_{x^{\prime}} X^{\prime}}{Z^{\prime 2}}} \\ {0} & {\frac{f_{y}}{Z^{\prime}}} & {-\frac{f_{y} Y^{\prime}}{Z^{\prime 2}}}\end{array}\right] \]

接着根据如下链式法则与坐标变换关系

\[ \frac{\partial e}{\partial \boldsymbol{P}}=\frac{\partial \boldsymbol{e}}{\partial \boldsymbol{P}^{\prime}} \frac{\partial \boldsymbol{P}^{\prime}}{\partial \boldsymbol{P}} \]

\[ \boldsymbol{P}^{\prime} = \boldsymbol{R} \boldsymbol{P} + t \]

可以得到最终的重投影误差对地图点三维坐标的jacobian

\[ \frac{\partial e}{\partial \boldsymbol{P}} = -\left[\begin{array}{ccc}{\frac{f_{x}}{Z^{\prime}}} & {0} & {-\frac{f_{x^{\prime}} X^{\prime}}{Z^{\prime 2}}} \\ {0} & {\frac{f_{y}}{Z^{\prime}}} & {-\frac{f_{y} Y^{\prime}}{Z^{\prime 2}}}\end{array}\right] \boldsymbol{R} \]

重投影误差对被投影帧位姿的jacobian

此处需要说明的是，对于位姿变换（对应的李群是\(SE(3)\)）的求导我们一般将其变换到\(SE(3)\)对应的李代数\(\xi\)上使用扰动模型来求导。

根据前面的推导我们可以发现，重投影误差项\(e\)中与位姿\(T_{wc}\)相关的只有\(\boldsymbol{P}^{\prime}\)，因此可以将求解过程分解为如下两步

\[ \frac{\partial e}{\partial \delta \xi}=\frac{\partial e}{\partial P^{\prime}} \frac{\partial P^{\prime}}{\partial \delta \xi} \]

其中第一部分\(\frac{\partial e}{\partial P^{\prime}}\)在前面已经求解出来了，第二部分可以通过使用扰动模型左乘扰动量来求得（具体步骤见附录1）

\[ \frac{\partial(\boldsymbol{T} \boldsymbol{P})}{\partial \delta \boldsymbol{\xi}}=(\boldsymbol{T} \boldsymbol{P})^{\odot}=\left[\begin{array}{cc}{\boldsymbol{I}} & {-\boldsymbol{P}^{\prime \wedge}} \\ {\boldsymbol{0}^{\mathrm{T}}} & {\boldsymbol{0}^{\mathrm{T}}}\end{array}\right] \]

由于上面是使用的\(\boldsymbol{P}\)的齐次坐标形式，所以从上式结果中取出前三维就是（这是一个\(3*6\)大小的矩阵）

\[ \frac{\partial \boldsymbol{P}^{\prime}}{\partial \delta \boldsymbol{\xi}}=\left[\boldsymbol{I},-\boldsymbol{P}^{\prime \wedge}\right] \]

然后将两项相乘就可以得到我们想要的结果--重投影误差对被投影帧位姿的jacobian

\[ \frac{\partial e}{\partial \delta \xi}=-\left[\begin{array}{lllll}{\frac{f_{x}}{Z^{\prime}}} & {0} & {-\frac{f_{x} X^{\prime}}{Z^{\prime 2}}} & {-\frac{f_{x} X^{\prime} Y^{\prime}}{Z^{\prime 2}}} & {f_{x}+\frac{f_{x} X^{2}}{Z^{\prime 2}}} & {-\frac{f_{x} Y^{\prime}}{Z^{\prime}}} \\ {0} & {\frac{f_{y}}{Z^{\prime}}} & {-\frac{f_{y Y^{\prime}}}{Z^{\prime 2}}} & {-f_{y}-\frac{f_{y} Y^{\prime 2}}{Z^{\prime 2}}} & {\frac{f_{y} X^{\prime Y^{\prime}}}{Z^{\prime 2}}} & {\frac{f_{y} X^{\prime}}{Z^{\prime}}}\end{array}\right] \]

附录1

假设如下求导中的左乘的扰动项的李代数为\(\delta \boldsymbol{\xi}=[\delta \boldsymbol{\rho}, \delta \phi]^{\mathrm{T}}\)，那么：

上面最后一行矩阵除法，与矩阵乘法规则类似，只是乘号变成了除号。其使用一个\(4×1\)矩阵除以一个\(1×6\)矩阵得到一个\(4×6\)矩阵

附录2

雅克比矩阵即是偏导数矩阵，由于一般待求导的目标函数的因变量是列向量，自变量也是列向量，在求雅克比矩阵时遵循如下规则：

\[ \frac{\mathrm{d}\left[\begin{array}{l}{a} \\ {b}\end{array}\right]}{\mathrm{d}\left[\begin{array}{l}{x} \\ {y}\end{array}\right]}=\left[\begin{array}{cc}{\frac{\mathrm{d} a}{\mathrm{d} x}} & {\frac{\mathrm{d} a}{\mathrm{d} y}} \\ {\frac{\mathrm{d} b}{\mathrm{d} x}} & {\frac{\mathrm{d} b}{\mathrm{d} y}}\end{array}\right] \]

其实只需要明确一点，上述公式便很容易记起来了。对于输入为n维向量，输出为m维向量的变换（即从\(R^n\)到\(R^m\)的变换），它的雅克比矩阵为\(m*n\)维。即行数由输出向量的维度决定，列数由输入向量的维度决定

参考文献

[1] 视觉slam十四讲从理论到实践高翔等著；

#数学

BA优化中Jacobian矩阵的计算

http://line.com/2019/11/01/2019-11-01-BA-jacobian/

作者

Line

发布于

2019年11月1日

许可协议

空间坐标系系统介绍上一篇

vins中的外参标定下一篇