基于自适应多变量超扭转的 Lyapunov 重新设计 RLV 姿态控制

原创已于 2024-09-05 20:17:58 修改 · 1.2k 阅读

22 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#算法 #数学建模 #动态规划

于 2024-09-05 20:17:14 首次发布

控制与信号处理专栏收录该内容

13 篇文章

订阅专栏

自适应多变量Super-Twisting-Based的 Lyapunov重新设计RLV姿态控制

Adaptive Multivariable Super-Twisting-Based Lyapunov Redesign for RLV Attitude Control
I. 引言
II. 问题陈述
III. 基于自适应多变量超扭转的 Lyapunov 重新设计算法
- A. Lyapunov 对 RLV 进行重新设计
- B.基于自适应超扭转的Lyapunov重新设计
IV. 模拟与讨论
- A. 模型与参数设置
- B. 结果分析
V. 结论
附录
REFERENCES

Adaptive Multivariable Super-Twisting-Based Lyapunov Redesign for RLV Attitude Control

摘要 ——本文针对可重复使用运载火箭 (RLV) 姿态控制系统，提出了一种基于自适应多变量超扭转的新型 Lyapunov 重设计 (AMSTLR) 算法，该算法受未知干扰和不确定控制系数的影响。该方法提出了一种结合 Lyapunov 重设计 (LR) 方法和自适应超扭转 (AST) 方法的连续自适应控制算法。所提出的方法可以实现 RLV 的有限时间姿态跟踪，而无需精确了解不确定性的上限。此外，利用 Lyapunov 技术对所提出的算法进行了严格的稳定性分析。最后，提供了仿真结果以证明所提出的控制方案的有效性。

索引术语 ——自适应多变量超扭转、李雅普诺夫重新设计（LR）、可重复使用运载火箭（RLV）姿态控制、不确定控制系数。

I. 引言

可重复使用运载火箭由于其复杂的特性和飞行环境而受到越来越多的关注，这对控制器设计提出了挑战。在可重复使用运载火箭 (RLV) 姿态控制系统中，实现快速稳定的控制至关重要，特别是在存在外部干扰和不确定控制系数的情况下，同时确保控制器的连续性也同样重要。近年来，已经开发出一些先进的姿态控制算法来提高 RLV 的姿态跟踪性能。滑模控制 (SMC) 方法在 RLV 姿态控制系统中得到了广泛的研究[1]，[2]，[3]，[4]，[5]，具有固有的对不确定性的不敏感性和鲁棒性。然而，抖动问题的存在阻碍了 SMC 的实际应用[6]，[7]。为了解决这个问题，高阶 SMC 方法，如超扭转算法 [8]，[9]，已经成功应用于 RLV 姿态系统。超扭转算法确保滑模变量及其一阶导数收敛到零，有效衰减抖动，并通过在积分器中引入包含不连续项的动态扩展来实现连续控制信号。然而，超扭转算法的实现依赖于对扰动导数上限的精确了解，这可能很难提前获得[10]，[11]。这推动了自适应超扭转（AST）算法的发展，该算法无需精确了解不确定性即可实现有限时间收敛[12]。
此外，为了应对执行器故障带来的挑战，[13] 中的工作提出了一种自适应滑模控制器，目的是实现一致的协同跟踪。该控制器不仅能够处理未知的有界扰动，还能有效解决与未知控制系数相关的潜在问题。为了解决参数不确定性和执行器故障，[14] 引入了一种基于屏障 Lyapunov 函数和反步法的自适应控制方法，确保跟踪误差的有效收敛。
此外，近年来，智能控制也得到了很好的研究，特别是在通过智能技术解决不确定性方面。在 [15] 中，提出了一种创新的神经自适应控制方法，不仅在解决不确定性方面取得了进展，而且在实现跟踪误差收敛方面也表现出惊人的速度。
此外，在 [16] 中，提出了一种利用自适应反步神经控制器的方法，利用神经网络估计外部扰动的能力。

与 SMC 类似，李雅普诺夫重新设计 (LR) 方法在处理不确定性方面非常有效 [17]，[18]。扰动系统的 LR 方法的基本概念是将控制信号分为两个部分：1) 标称控制和 2) 补偿控制 [19]，[20]。在不确定因素上限未知的情况下，已采用自适应 LR 算法来自适应调整控制增益，以实现精确的扰动补偿 [21]，[22]。在 [23] 中，提出了一种基于 LR 的积分反步法，通过鲁棒自适应控制来稳定扰动系统。此外，[24] 中开发了一种基于屏障函数的自适应 LR 方法，该方法产生控制信号以将系统轨迹引导到预定义域中，并有效处理不确定的控制系数。然而，经典 LR 方法的一个局限性是它在一阶滑动流形中表现出不连续控制，这可能导致不希望的控制抖动。为了解决这个问题，一些研究已经集中在这个主题上。例如，在 [25] 中，开发了一种连续 LR 方法来合成时滞系统的最优预测控制器。此外，基于超扭曲方法 [26] 开发了一种不确定线性延迟系统的连续 LR 方法，具有渐近收敛特性。尽管已经提出了一些控制方法，但实现具有未知外部扰动和不确定控制系数的 RLV 的连续有限时间姿态跟踪控制仍然具有挑战性。现有方法通常侧重于在不考虑不确定控制系数的情况下实现连续控制，或者旨在实现具有不连续控制信号的未知扰动和不确定控制系数下的鲁棒控制。

动机和贡献： 受观察结果的启发，我们的目标是为 RLV 姿态系统提出一种新型连续控制器，该系统受到未知的外部干扰和不确定的控制系数的影响。为此，提出了一种结合 LR 方法和 AST 方法的连续自适应控制算法，利用 LR 处理干扰的能力和 AST 提供连续控制信号的优势。我们工作的主要贡献可以总结如下。

针对RLV姿态控制系统，提出了一种新颖的有限时间连续控制算法，该算法保证了在存在未知干扰和不确定控制系数的情况下，仍能在有限的时间内实现姿态跟踪。
利用Lyapunov技术给出了算法的收敛性准则和严格的稳定性证明。

与现有方法（如 [27] 中的自适应控制器）相比，我们的算法具有提供连续控制矩的优势。此外，与具有连续输出的控制器 [28] 相比，我们成功解决了由潜在执行器故障引起的不确定控制系数的影响。最后，我们进行了模拟以验证算法的有效性，比较结果证实了我们优于经典 LR 方法。

本文的其余部分安排如下：第二部分介绍问题的表述，清晰地阐述研究目标。第三部分设计了自适应多变量超扭转 LR（AMSTLR）算法，以实现具有不确定控制系数和未知干扰的 RLV 的有限时间控制。第四部分介绍了数值模拟，作为验证并证明了所提算法的有效性。最后，在第五部分，本文总结了主要发现和贡献。

II. 问题陈述

A. 符号

在本文中，采用以下符号。欧几里得范数和无穷范数分别由 $\|x\| = \sqrt{x^T x}$ 和 $\|x\|_\infty = \max(|x_1|, \ldots, |x_n|)$ 给出，其中 $[x_1, \ldots, x_n]^T \in \mathbb{R}^n$ 。对于 $\in \mathbb{R}$ ，我们有 $\left[ \frac{1}{\|x\|_p} \right]^\dagger = -\frac{p x^T \dot{x}}{\|x\|_p + 2}$ 和 $\left[ \frac{x}{\|x\|_p} \right]^\dagger = \left[ \frac{1}{\|x\|_p} \right] [I_m - \frac{p x x^T}{\|x\|^2}] \dot{x}$ ，其中 $x\|_p$ 是 $x\|_p$ 和 $\text{sign}(x) = \frac{x}{\|x\|}$ 。符号 $\otimes$ 表示克罗内克积。 $\lambda_{\text{min}}(.)$ 和 $\lambda_{\text{max}}(.)$ 分别表示 $(.)$ 的最小和最大特征值。

B. 准备工作

定义 1 [29]： 如果非线性动力系统 $\dot{x} = f(x)$ 是李雅普诺夫稳定的，则它全局有限时间稳定，并且对于任何 $R > 0$ ，都存在 $T > 0$ ，使得在区域 $∣ x ∣ < R$ 内起始的任何轨迹在有限时间内在原点稳定下来 $T$ 。

引理 1 [30]： 对于系统 $\dot{x} = f(x)$ ，其初始条件为 $x(t_0) = x_0$ ，如果存在一个连续可微的正定 Lyapunov 函数 $V (x)$ 满足 $\dot{V}(x) \leq -\alpha V(x)^\beta$ 其中 $\alpha \in (0, 1)$ 和 $\beta > 0$ ，则系统解将在有限时间内收敛到零 $\leq \frac{1}{\alpha(1 - \beta)} V(x_0)^{1 - \beta}$ ，其中 $V(x_0)$ 表示 Lyapunov 函数的初始值。

C.问题表述

考虑RLV的控制导向旋转模型，其中扰动未知，控制系数不确定[31]
$\dot{\Theta} = R \omega \\ I \dot{\omega} = -\Omega I \omega + \Delta_B M + M \tag{1}$
其中， $\Theta = [\alpha, \beta, \sigma]^T$ 为姿态角向量， $\omega = [p, q, r]^T$ 表示姿态角向量， $M = [M_x, M_y, M_z]^T$ 表示控制力矩。 $\Delta_B$ 为不确定控制系数矩阵， $\Delta_M$ 表示外部扰动。系统矩阵 $I$ 、 $R$ 和 $\Omega$ 与 [31] 中的定义保持一致。

假设1： 控制系数 $\Delta_B$ 由不确定的正常数 $g$ 和 $G$ 界定，即 $\leq \|\Delta_B\| \leq G$ 。扰动 $\Delta_M$ 连续可微，满足 $\|\Delta_M\| \leq L$ 和 $\|\dot{\Delta}_M\| \leq M$ ，其中 $L$ 和 $M$ 为未知常数。

这项工作的目标是开发一个控制器，提供连续的控制信号，以确保尽管存在不确定性 $\Delta B$ 和 $\Delta M$ ，但仍可以在有限的时间内跟踪参考命令 $\Theta_{\text{ref}}$ 。

III. 基于自适应多变量超扭转的 Lyapunov 重新设计算法

A. Lyapunov 对 RLV 进行重新设计

将姿态跟踪误差定义为 $e_1 = \Theta - \Theta_{\text{ref}}$ 和 $e_2 = R \omega - \dot{\Theta}_{\text{ref}}$ ，姿态误差动态可以用以下公式描述

$\dot{e}_1 = e_2 \\ \dot{e}_2 = F + R I^{-1} B M + R I^{-1} M \tag{2}$

其中 $I^{-1} \Omega I \omega - \ddot{\Theta}_{\text{ref}} + \dot{R} \omega$ 。

LR 方法通过将补偿控制输入 $v$ 与标称控制输入 $M_0$ （即 $M = M_0 + v$ ）相结合来设计 (2) 中的控制器 $M$ 。

标称系统是通过忽略系统 (2) 中的外部扰动（即设置 $\Delta_M = 0$ ）并假设没有未知的控制衰减（即设置 $\Delta_B = 1$ ）获得的。在这种情况下，系统 (2) 的标称部分可以表示为
$\dot{e}_1 = e_2, \quad \dot{e}_2 = F + R I^{-1} M_0. \tag{3}$
按照[28，定理 1]，标称控制输入 $M_0$ 可以设计为
$M_0 = I R^{-1} \left( \theta - F - l_1 \|e_1\|^{\rho_1} - l_2 \|e_2\|^{\rho_2} \right) \tag{4}$
满足以下条件：
$l_1, l_2 > 0, \quad \rho_1 = \frac{\rho}{2 - \rho}, \quad \rho_2 = \rho, \quad \rho \in (0, 1). \tag{5}$
此外，在LR方法中，需要设计补偿控制输入 $v$ 来处理不确定性。首先，提出了一个连续Lyapunov函数
$V_0 = \|e_1\|^{\rho_1 + 1} + \frac{\rho_1 + 1}{2 l_1} \|e_2\|^2. \tag{6}$
此外，沿误差动力学轨迹 (2) 对 $V_0$ 进行微分可得
$\dot{V}_0 = \frac{\partial V_0}{\partial e_1} e_2 + \frac{\partial V_0}{\partial e_2} \left(F + R I^{-1} \Delta_B (M_0 + v) + R I^{-1} \Delta_M \right) = \dot{V}_{\text{nom}} + \frac{\partial V_0}{\partial e_2} \left(R I^{-1} \Delta_B v + R I^{-1} L \Delta_M \right) \tag{7}$
其中 $\Delta_M + \Delta_B M_0 - M_0$ 和 $\dot{V}_{\text{nom}}$ 是 $V_0$ 沿标称系统 (3) 的导数。令 $w$ 表示滑动变量，定义为 $\left[\frac{\partial V_0}{\partial e_2}\right]$ 。LR 方法通过设计补偿项 $v$ 来解决扰动项，从而实现 $w$ 向零的收敛。请注意，经典 LR 方法（如 [18] 所示）通过设计 $-k_0 \left[\frac{w}{\|w\|}\right]$ 来确保滑动变量 $w$ 的收敛。然而，不连续的控制输入可能会导致抖动问题。

B.基于自适应超扭转的Lyapunov重新设计

接下来，基于 AST 开发一个连续控制输入 $v$ ，以确保滑动变量 $w$ 的收敛并衰减抖动。滑动变量 $w$ 的导数为

$\dot{w} = \frac{\partial w}{\partial e_2} \left(\bar{F} + R I^{-1} \Delta_B v + R I^{-1} L M \right) \tag{8}$

其中 $\bar{F} = F + R I^{-1} M_0$ 。设 $R^{-1} u_{\text{sta}}$ ， $\bar{F} = \Delta_B^{-1} (\bar{F} + R I^{-1} L M)$ ， $\hat{\Delta}_B = \left[\frac{\partial w}{\partial e_2}\right] \Delta_B$ 。通过这些定义，(8) 可以简化为

$\dot{w} = \hat{\Delta}_B (u_{\text{sta}} + \bar{F}). \tag{9}$

系统 (9) 的收敛由 AST 控制输入 $u_{\text{sta}}$ 解决，其公式为

$u_{\text{sta}} = -k_1 \|w\|^{1/2} - k_2 \int_0^t \text{sign}(w) \, dt.$

因此，控制器 $v$ 的补偿部分可以表示为

$R^{-1} \left( k_1 \|w\|^{1/2} + k_2 \int_0^t \text{sign}(w) \, dt \right) \tag{10}$

其中 $k_1$ 和 $k_2$ 是自适应增益，其动态特性由下式给出：

$\dot{k}_1 = \begin{cases} L_1 \frac{2}{\|w\|} & \text{if } \|w\| \neq 0 \\ 0 & \text{if } \|w\| = 0 \end{cases} , \quad k_2 = 2\tau k_1, \quad L_1 > 0, \quad \tau > 0. \tag{11}$

**假设 2：**假设 (9) 中的不确定控制系数矩阵 $\hat{\Delta}_B$ 由不确定常数 $\bar{g}$ 和 $\bar{G}$ 界定，其中 $\bar{g} \leq \|\hat{\Delta}_B\| \leq \bar{G}$ 。此外，假设扰动 $F$ 满足 $\|\dot{\Delta}_F\| \leq \bar{M}$ ，其中 $\bar{M}$ 存在但未知。

**注释 1：**本文中的假设是基于 RLV 姿态控制领域的实际考虑。考虑到与执行器行为相关的实际约束以及控制系统固有的有限采样时间（这意味着扰动导数信号的上限），可以合理地假设 $\Delta_B$ 有界、 $\Delta_M$ 有界且 Lipschitz 连续。此外，假设 2 可以看作是假设 1 的扩展，并且在考虑实际情况时仍然合理。

考虑误差动态（2），以及（4）中的标称控制输入和（10）中的补偿项，应用于RLV姿态系统的AMSTLR算法的反馈控制输入设计为 $M = M_0 + v$ ，可表示为

$R^{-1} \left( F + l_1 \|e_1\|^{\rho_1} + l_2 \|e_2\|^{\rho_2} + \\ k_1 \|w\|^{1/2} + k_2 \int_0^t \text{sign}(w) \, dt \right) \tag{12}$

其中自适应增益 $k_1$ 和 $k_2$ 根据 (11) 进行选择。为了阐明控制器设计，图 1 给出了所提设计方法的框图，而图 2 中的流程图显示了所述步骤。随后，以下定理提供了开发的 AMSTLR 算法的主要结果。

定理 1： 在假设 1 和 2 下考虑误差动态（2），如果反馈控制器设计为（12），控制参数选择条件为（5）和（11），则系统（2）中 $e_1$ 和 $e_2$ 的轨迹将在有限的时间内收敛到原点。

证明： 证明分为两个步骤。首先，将证明滑动变量 $w$ 在有限时间 $T_1$ 内收敛到零。随后，通过利用连续标称控制器项 $M_0$ ，可以建立系统状态的有限时间稳定性。

步骤 1： 动态系统模型（9）与控制器（10）相结合描述为

$\dot{w} = \hat{\Delta}_B \left(-k_1 \|w\|^{1/2} + z \right) \\ \dot{z} = -k_2 \|w\|^0 + \dot{\Delta}_F. \tag{13}$

为了方便进行Lyapunov分析，引入如下向量：

$\xi^T = \begin{bmatrix} \xi_1 & \xi_2 \end{bmatrix}, \quad \xi_1 = w^{1/2}, \quad \xi_2 = z. \tag{14}$

对 $\xi$ 取导数，结果如下：
$\begin{bmatrix} \dot{\xi}_1 \\ \dot{\xi}_2 \end{bmatrix} = - \frac{1}{\|\xi_1\|} \begin{bmatrix}k_1 \frac{2}{I_3} & \hat{\Delta}_B \\ k_2 I_3 & 0 \end{bmatrix} \begin{bmatrix} \xi_1 \\ \xi_2 \end{bmatrix} + \begin{bmatrix} 0 \\ \dot{\Delta}_F \end{bmatrix} + \begin{bmatrix} -\frac{ \hat{\Delta}_B \xi_1 \xi_1^T \xi_2 }{2\|\xi_1\|^3} \\ 0_3 \end{bmatrix}. \tag{15}$

考虑到

$\begin{bmatrix} 0 \\ \dot{F} \end{bmatrix} = - \frac{1}{\|\xi_1\|} \begin{bmatrix} 0 & 0 \\ -\dot{\Delta}_F^T \text{sign}(\xi_1) & 0 \end{bmatrix} \otimes I_3 \begin{bmatrix} \xi_1 \\ \xi_2 \end{bmatrix}, \tag{16}$

方程（15）可以重写为

$\begin{bmatrix} \dot{\xi}_1 \\ \dot{\xi}_2 \end{bmatrix} = - \frac{1}{\|\xi_1\|} \begin{bmatrix} \frac{k_1}{2}\boldsymbol{I}_3 & -\hat{\Delta}_B \\ (k_2 - X)\boldsymbol{I}_3 & \boldsymbol{0} \end{bmatrix} \begin{bmatrix} \xi_1 \\ \xi_2 \end{bmatrix} + \begin{bmatrix} - \frac{ \hat{\Delta}_B \xi_1 \xi_1^T \xi_2 }{2\|\xi_1\|^3} \\ \boldsymbol{0}_3 \end{bmatrix} \tag{17}$

其中 $\dot{\Delta}_F^T \text{sign}(\xi_1)$ 。

此外，提出了以下 Lyapunov 候选函数：

$V_0 + \frac{1}{2} \left( k_1 - k^*_1 \right)^2 + \frac{1}{2} \left( k_2 - k^*_2 \right)^2, \tag{18}$

其中 $k^*_1, k^*_2$ 为常数，矩阵 $P$ 定义为

$\begin{bmatrix}p_1 & -1 \\ -1 & p_2 \end{bmatrix} \otimes \boldsymbol{I}_3. \tag{19}$

请注意，当 $p_1 p_2 > 1$ 时， $P$ 为正定，而 $V_0$ 的导数由下式给出

$\dot{V}_0 = - \frac{1}{\|\xi_1\|} \xi^T Q \xi + V_1, \tag{20}$

式中，

$A^T_1 P + PA_1 \tag{21}$

和

$V_1 = 2 \xi^T P A_2. \tag{22}$

矩阵 $Q$ 的计算方法如下

$\begin{bmatrix}k_1 p_1 \hat{\Delta}_B - 2 (k_2 - X) \boldsymbol{I}_3 & -p_2 (k_2 - X) \boldsymbol{I}_3 - p_1 \hat{\Delta}_B \\ -p_2 (k_2 - X) \boldsymbol{I}_3 - p_1 \hat{\Delta}_B & 2 \hat{\Delta}_B \end{bmatrix} \tag{21}$

和

$V_1 = - \hat{\Delta}_B \frac{1}{\|\xi_1\|} \begin{bmatrix} \xi_1^T \xi_2 p_1 - \xi^T_2 \xi_1 \xi^T_1 \xi_2 \\ \frac{1}{\|\xi_1\|^2} \end{bmatrix}. \tag{22}$

考虑到

$\frac{\xi^T_2 \xi_1 \xi^T_1 \xi_2}{\|\xi_1\|^2} \leq \frac{\|\xi_1\|^2 \|\xi_2\|^2}{\|\xi_1\|^2} = \|\xi_2\|^2,$

$V_1$ 满足以下不等式：

$V_1 \leq - \left\| \hat{\Delta}_B \right\| \frac{1}{\|\xi_1\|} \begin{bmatrix} \xi^T_1 \xi_2 p_1 - \|\xi_2\|^2 \end{bmatrix} \otimes I_3. \tag{23}$

从 (20)、(21) 和 (23)， $V_0$ 的导数可以转换为

$\dot{V}_0 \leq - \left\| \hat{\Delta}_B \right\| \lambda_{\text{min}} \left(Q \right) \|\xi\|^2. \tag{24}$

其中矩阵 $\hat{Q}$ 计算如下

$\hat{Q} = \begin{bmatrix}k_1 p_1 - 2 (k_2 - X) \|\hat{\Delta}_B^{-1}\| & p_2 (k_2 - X) \|\hat{\Delta}_B^{-1}\|- \frac{1}{2} (p_1 + k_1) \\ p_2 (k_2 - X) \|\hat{\Delta}_B^{-1}\|- \frac{1}{2} (p_1 + k_1) & 1 \end{bmatrix} \otimes I_3. \tag{25}$

如果矩阵 $\hat{Q}$ 是正定的，则 $V_0$ 的时间导数将是负定的。为此， $\hat{Q}$ 的行列式表示为

$\det(\hat{Q}) = a p_1^2 + b p_1 + c \tag{26}$

式中，

$-\frac{1}{4}, \quad b = \frac{1}{2} k_1 + p_2 \tilde{k}_2, \quad c = -2 \tilde{k}_2 - \frac{1}{4} k^2_1 - p^2_2 \tilde{k}_2^2 + k_1 p_1 \tilde{k}_2. \tag{27}$

其中 $\tilde{k}_2 = (k_2 - X) \|\hat{\Delta}_B\|^{-1}$ 。

注意系数 $-\frac{1}{4}$ 为负数。为了确保 $\det(\hat{Q})$ 的正定性，二阶方程 $\det(\hat{Q}) = 0$ 的判别式应为正数，并且 $p_1$ 应在 $\det(\hat{Q}) = 0$ 的两个实根定义的区间内选择。因此， $p_1$ 满足

$p_1 = \frac{b^2 - 4 a c}{a} = \tilde{k}_2 (k_1 p_2 - 2) > 0. \tag{28}$

当 $\tilde{k}_2 > 0$ 和 $k_1 p_2 - 2 > 0$ 时，我们有 $k_2 > \bar{M}$ 和 $p_2 > \frac{2}{k_1}$ 。因此， $p_2$ 的一个可能选择是 $p_2 = \frac{2 + \epsilon}{k_1}$ ，而 $\det(\hat{Q})$ 有两个实根

$p^+_1 = k_1 + 2 p_2 \tilde{k}_2 + 2 \sqrt{p_1}, \quad p^-_1 = k_1 + 2 p_2 \tilde{k}_2 - 2 \sqrt{p_1}, \tag{29}$

其中 $p_{1c} = k_1 + 2 p_2 \tilde{k}_2$ 。

$p_1 \in [\text{min}, \text{max}]$ 和 $p_{1c} \in [p_{1c \text{min}}, p_{1c \text{max}}]$ 的边界由以下公式给出
$p_1 \in [k_2 \text{min} (k_1 p_2 - 2), k_2 \text{max} (k_1 p_2 - 2)], \tag{30}$
$p_{1c} \in [k_1 + 2 p_2 k_2 \text{min}, k_1 + 2 p_2 k_2 \text{max}]. \tag{31}$
$p_1$ 的值从最小值 $(p^-_{1 \text{min}}, p^+_{1 \text{min}})$ 移动到最大值 $(p^-_{1 \text{max}}, p^+_{1 \text{max}})$ 。因此， $p_1$ 的有效选择应该在其最大值 $p^-_{1 \text{max}}$ 的小端点与其最小值 $p^+_{1 \text{min}}$ 的最大端点的交集中，即 $p_1 \in (p^-_{1 \text{max}}, p^+_{1 \text{min}})$ 。结合 $p_1$ 和 $p_{1c}$ 的界限， $p_1$ 的区间表示为

$p_1 \in \left[k_1 + 2 p_2 k_2 \text{max} - 2, k_1 + 2 p_2 k_2 \text{min} + 2\right]. \tag{32}$

为了保证交集有效，条件应该满足 $p^+_{1 \text{min}} > p^-_{1 \text{max}}$ 。经过几次代数运算后，条件可以表示为

$k^2_2 \text{min} + b k_2 \sqrt{k^2_2 \text{min}} + c k_2 > 0, \tag{33}$

式中，

$\frac{\bar{G} - \bar{g}}{\bar{g}} p_2, \quad b = -4 \frac{\bar{M}}{\bar{g}} p_2, \quad c = 4 \sqrt{\epsilon}. \tag{34}$

其中 $\epsilon = k_1 p_2 - 2$ 。由于 $a$ 为负，因此 $k_2 \text{min} > 0$ 应确保

$k_2 = \frac{b^2 k^2 - 4 a c k_2}{16 \epsilon - 32 \left(\epsilon + 2\right)^2 \bar{g}^2 k^2_1 \bar{M}} \left(\bar{G} - \bar{g}\right) > 0. \tag{35}$

因此，选择参数 $k_1$ 的可能值范围计算为

$k_1 > \frac{\epsilon + 2}{\bar{g}} \frac{\bar{G} - \bar{g}}{2 \epsilon \bar{M}}. \tag{36}$

因此，只要 $k_1$ 满足（36）的条件，就能保证 $\hat{Q}$ 的正定性。

注意到 $\|\xi\|^2 = \xi^2_1 + \xi^2_2$ 和 $\lambda_{\text{min}}(\hat{Q}) \|\xi\|^2 \leq \xi^T \hat{Q} \xi \leq \lambda_{\text{max}}(\hat{Q}) \|\xi\|^2$ ，（24）式中 $V_0$ 的导数表示为

$\dot{V}_0 \leq - \left\| \hat{\Delta}_B \right\| \lambda_{\text{min}}(\hat{Q}) \|\xi\|^2 \leq - \lambda_{\text{min}}(\hat{Q}) \left\| \hat{\Delta}_B \right\| \|\xi\|^2. \tag{37}$

考虑到 $\lambda_{\text{min}}(P) \|\xi\|^2 \leq V_0 \leq \lambda_{\text{max}}(P) \|\xi\|^2$ ， $\|\xi\|$ 的范围表示为

$\sqrt{\frac{V_0}{\lambda_{\text{max}}(P)}} \leq \|\xi\| \leq \sqrt{\frac{V_0}{\lambda_{\text{min}}(P)}}. \tag{38}$

考虑 (37) 和 (38)， $V$ 的导数得出

$\dot{V} \leq -\left[\frac{\lambda_{\text{min}}(\hat{Q})}{\sqrt{\lambda_{\text{max}}(P)}}\right] \|\hat{\Delta}_B\| V^{1/2}.$

根据附录提供的具体证明，式（11）中的自适应控制律确保控制参数 $k_1$ 满足条件（36），并实现式（18）中的Lyapunov函数 $V$ 的以下有限时间条件：

$\dot{V} \leq -\eta V^{1/2},$

式中，

$\eta = \min\left[\frac{\lambda_{\text{min}}(\hat{Q})}{\sqrt{\lambda_{\text{max}}(P)}} \|\hat{\Delta}_B\|, \sqrt{L_1}, 2\tau \sqrt{L_1}\right].$

通过应用引理 1，可以保证 (13) 的有限时间稳定性。因此，滑动模式变量在满足以下条件的有限时间内收敛到零： $T_1$

$T_1 \leq \frac{2}{\eta} V^{1/2}(\xi_0).$

步骤 2： 随后的证明表明，(2) 中的轨迹可以在有限的时间内驱动到原点。基于步骤 1，可以得出结论，对于任何 $\geq T_1$ ， $w = 0$ 都成立。因此，(7) 中的 $V_0$ 的导数满足

$KaTeX parse error: Got function '\boldsymbol' with no arguments as superscript at position 80: …bol{\Delta B}^ \̲b̲o̲l̲d̲s̲y̲m̲b̲o̲l̲{v} + \|\hat{R}…$

按照[28，定理1]，我们可以得出结论，具有名义控制输入 $\boldsymbol{M}_0$ 的名义系统（3）的轨迹将在有限时间内全局收敛到原点 $T_2$ 。因此，可以确保（2）中的 $e_1$ 和 $e_2$ 在有限时间内收敛 $\leq T_1 + T_2$ 。证明到此结束。

备注3： 需要说明的是，在满足定理1的条件的前提下，合理选取控制参数可以提高RLV姿态系统的控制性能。例如，增大 $l_1$ 和 $l_2$ 可以加快系统收敛速度，增大 $L_1$ 和 $\tau$ 可以加快扰动补偿速度。但是，这些改进是以增大控制力矩为代价的，这可能会给RLV飞行系统带来更大的负担。另外，减小 $\rho$ 的值虽然可以加快收敛速度，但可能导致控制平滑度的下降。实际应用中，这些参数的选取是在收敛速度、控制成本和控制平滑度之间的折衷。

IV. 模拟与讨论

本节通过仿真验证了所提AMSTLR算法的有效性，并对定理1中提出的方法与经典LR进行了仿真比较。

A. 模型与参数设置

标称控制器参数选定为 $l_1 = 4$ 、 $l_2 = 2$ 、 $\rho = 0.4$ 。自适应控制增益参数的初始值设置为 $k_1(0) = 0.01$ 。为了防止 (11) 中的增益 $k_1$ 和 $k_2$ 无限增加，对于 $\|w\| \geq \epsilon$ ，参数设计为 $L_1 = 0.18$ 和 $\tau = 0.5$ ，对于 $\|w\| < \epsilon$ ，其中 $\epsilon = 0.0001$ ，参数设计为 $L_1 = 0$ 。系统的初始状态设置为 $\Theta_0 = [\alpha_0, \beta_0, \sigma_0]^T = [0.2, 0.2, 0.2]^T$ rad 和 $\omega_0 = [p_0, q_0, r_0]^T = [0, 0, 0]^T$ rad/s 。为了证明 AST 的鲁棒性，时间相关扰动 $\Delta M(t)$ 由下式给出

$\Delta _M = \begin{cases} 2 \times 10^4 [\sin(3t), 2 \cos(3t), 3 \sin(3t)]^T, & 0 < t \leq 5 \\ 5 \times 10^5 [\sin(4t), 2 \cos(4t), 3 \sin(4t)]^T, & 5 < t \leq 10 \\ 1.5 \times 10^6 [\sin(5t), 2 \cos(5t), 3 \sin(5t)]^T, & 10 < t \leq 20. \end{cases}$

所需的参考命令由 $\Theta_{\text{ref}} = [\alpha_{\text{ref}}, \beta_{\text{ref}}, \sigma_{\text{ref}}]^T = [0.5 \sin(t), 0.4 \cos(t), 0.3 \sin(t)]^T$ rad 选择。不确定的控制系数由 $\Delta_B = (3 + \sin(3t))I_3$ 给出。

B. 结果分析

图 3 中的图表描绘了实际姿态和参考姿态，而 图 4 则说明了姿态跟踪误差。这些图表明，即使在存在不确定性的情况下，所提出的 AMSTLR 算法也能精确跟踪参考命令。图 5 显示了自适应律和扰动曲线的变化。分段扰动会在特定点引起突然的外部干扰，从而提供了一种验证本文所提出方法的稳健性的方法。观察到自适应增益 $k_1$ 动态增加以驱动系统状态向原点移动，此后保持不变，这是由于扰动 $\boldsymbol{\Delta_M}$ 在 5 秒和 10 秒时出现阶跃跳跃。此外，图 6 显示了滑动变量和 Lyapunov 函数的演变，表明滑动模式变量 $w$ 和 Lyapunov 函数 $V_0$ 在有限时间内收敛到原点。为了解决抖动问题，AST 用不连续项代替了不连续项来生成连续控制信号。图 7 对所开发的方法与利用不连续控制输入的经典 LR 进行了比较。该图显示了当采用所提出的 AST 控制代替不连续控制时控制信号中抖动的衰减。根据 (2)，不确定性（包括外部干扰、不确定控制系数和系统标称项）可以表示为 $-\boldsymbol{\Delta_B}^{-1}\boldsymbol{I}_R - 1(\boldsymbol{F} + \boldsymbol{R}\boldsymbol{I}^{-1}\boldsymbol{\Delta_M})$ 。图 8 显示，即使在 $t = 5$ 和 $t = 10$ 存在显著变量扰动的情况下，控制输入 $\boldsymbol{M}$ 也能成功抵消不确定性。仿真结果表明，设计的控制器可以有效地抑制不确定的控制系数和外部干扰。

V. 结论

本文通过一种新颖的连续 AMSTLR 方法解决了具有未知干扰和不确定控制系数的再入姿态控制系统的鲁棒稳定性问题。所提出的方法具有几个明显的优势，包括：

有限时间稳定性；
连续控制信号；
对未知干扰和不确定控制系数的鲁棒性。
利用Lyapunov技术给出了该算法的收敛标准和严格的稳定性证明。

附录

在附录中，我们证明自适应增益 $k_1$ 收敛到 (36)，确保矩阵 $\hat{Q}(t)$ 的正定性，并满足有限时间收敛条件 $\dot{V} \leq -\eta V^{1/2}$ 。

从 (18) 中的 Lyapunov 函数 $V_{\text{a}} + \frac{1}{2}(k_1 - k^*_1)^2 + \frac{1}{2}(k_2 - k^*_2)^2$ 开始，利用柯西不等式 $(a^2 + b^2 + c^2)^{1/2} \leq |a| + |b| + |c|$ ， $V$ 可以重写为：
$\sqrt{V} = \left(V_{\text{a}} + \frac{1}{2}(k_1 - k^*_1)^2 + \frac{1}{2}(k_2 - k^*_2)^2\right)^{1/2} \leq V_{\text{a}}^{1/2} + \frac{\sqrt{2}}{2} |k_1 - k^*_1| + \frac{\sqrt{2}}{2} |k_2 - k^*_2|.$
此外，还可以推导出以下不等式：
$-\mu_1 V_{\text{a}}^{1/2} - \left(\frac{L_1}{2} |k_1 - k^*_1| + \frac{L_2}{2} |k_2 - k^*_2|\right) \leq -\eta \sqrt{V},$

其中 $\mu_1 = \frac{\lambda_{\text{min}}(\hat{Q})}{\sqrt{\lambda_{\text{max}}(P)}} \hat{\Delta}_B \hat{F}$ 和 $\eta = \min(\mu_1, \sqrt{L_1}, \sqrt{L_2})$ 。

$V$ 的导数由下式给出：

$\dot{V} = \dot{V}_{\text{a}} + (k_1 - k^*_1) \dot{k}_1 + (k_2 - k^*_2) \dot{k}_2.$

通过考虑 $\dot{V}_{\text{a}} \leq -\mu_1 V_{\text{a}}^{1/2}$ ，使用 (43) ，并减去和添加项 $\frac{\sqrt{L_1}}{2}|k_1 - k^*_1| + \frac{\sqrt{L_2}}{2}|k_2 - k^*_2|$ ， (44) 可以进一步转换为：

$\dot{V} \leq -\eta V^{1/2} + (k_1 - k^*_1) \dot{k}_1 + (k_2 - k^*_2) \dot{k}_2 + \frac{L_1}{2} |k_1 - k^*_1| + \frac{L_2}{2} |k_2 - k^*_2|.$

为了确保有限时间收敛，自适应增益 $k_1$ 和 $k_2$ 应该有界。这意味着存在正常数 $k^*_1$ 和 $k^*_2$ ，使得 $k_1(t) - k^*_1 < 0$ 和 $k_2(t) - k^*_2 < 0$ 和 $\geq 0$ 。因此，不等式 (45) 可以转化为：

$\dot{V} \leq -\eta V^{1/2} - |k_1 - k^*_1| (\dot{k}_1 - \sqrt{\frac{L_1}{2}}) - |k_2 - k^*_2| (\dot{k}_2 - \sqrt{\frac{L_2}{2}}).$

我们定义：

$-|k_1 - k^*_1| (\dot{k}_1 - \sqrt{\frac{L_1}{2}}) - |k_2 - k^*_2| (\dot{k}_2 - \sqrt{\frac{L_2}{2}}).$

对于有限时间收敛， $U = 0$ 应该通过调整增益 $k_1$ 和 $k_2$ 来保证。在这种情况下，增益 $k_1$ 和 $k_2$ 应该满足：

$\dot{k}_1 = \frac{L_1}{2}, \quad \dot{k}_2 = \frac{L_2}{2}.$

通过选择 $\tau = \frac{1}{2} \sqrt{\frac{L_2}{L_1}}$ ，（11）和（47）是等价的，如下面的推导所示：

$k_2 = 2\tau k_1 \Rightarrow \dot{k}_2 = 2\tau \dot{k}_1 \Rightarrow \dot{k}_2 = \frac{L_2}{2}.$

为了实现有限时间收敛， $k_1$ 需要满足 (36)。这意味着 $k_1$ 必须按照 (47) 增加，直到满足 (36)。由于 $k_1$ 线性增加，因此目标将在有限时间内达到。此外，不等式 (46) 可以进一步转换为 $\dot{V} \leq -\eta V^{1/2}$ ，其中 $\eta = \min(\mu_1, \sqrt{L_1}, \sqrt{L_2})$ 。

REFERENCES

[1] S. Qu, X. Xia, and J. Zhang, “Dynamics of discrete-time sliding-mode control uncertain systems with a disturbance compensator,” IEEE Trans. Ind. Electron., vol. 61, no. 7, pp. 3502–3510, Jul. 2014.

[2] B. Zhao, B. Xian, Y. Zhang, and X. Zhang, “Nonlinear robust sliding mode control of a quadrotor unmanned aerial vehicle based on immersion and invariance method,” Int. J. Robust Nonlin. Control, vol. 25, no. 18, pp. 3714–3731, Jul. 2015.

[3] S. Zeghlache, D. Saigaa, K. Kara, A. Harrag, and A. Bouguerra, “Backstepping sliding mode controller improved with fuzzy logic: Application to the quadrotor helicopter,” Arch. Control Sci., vol. 22, no. 3, pp. 315–342, 2012.

[4] D. Lee, H. J. Kim, and S. Sastry, “Feedback linearization vs. adaptive sliding mode control for a quadrotor helicopter,” Int. J. Control, Autom. Syst., vol. 7, no. 3, pp. 419–428, 2009.

[5] H. Khebbache and M. Tadjine, “Robust fuzzy backstepping sliding mode controller for a quadrotor unmanned aerial vehicle,” J. Control Eng. Appl. Inform., vol. 15, no. 2, pp. 3–11, 2013.

[6] I.-L. G. Borlaug, K. Y. Pettersen, and J. T. Gravdahl, “The generalized super-twisting algorithm with adaptive gains,” in Proc. Eur. Control Conf. (ECC), 2020, pp. 1624–1631.

[7] H.-T. Yau and C.-L. Chen, “Chattering-free fuzzy sliding-mode control strategy for uncertain chaotic systems,” Chaos, Solitons Fractals, vol. 30, no. 3, pp. 709–718, 2006.

[8] Y. Yu, H. Wang, and N. Li, “Fault-tolerant control for over-actuated hypersonic reentry vehicle subject to multiple disturbances and actuator faults,” Aerosp. Sci. Technol., vol. 87, pp. 230–243, Apr. 2019.

[9] J. Davila, J. Cieslak, D. Henry, A. Zolghadri, and F. J. Bejarano, “A fault tolerant controller based on quasi-continuous high-order sliding mode technique,” in Proc. Amer. Control Conf. (ACC), 2016, pp. 7529–7534.

[10] M. Harmouche, S. Laghrouche, and Y. Chitour, “Robust and adaptive higher order sliding mode controllers,” in Proc. IEEE 51st IEEE Conf. Decis. Control (CDC), 2012, pp. 6436–6441.

[11] J. Sun, J. Yi, and Z. Pu, “Fixed-time adaptive fuzzy control for uncertain nonstrict-feedback systems with time-varying constraints and input saturations,” IEEE Trans. Fuzzy Syst., vol. 30, no. 4, pp. 1114–1128, Apr. 2022.

[12] Y. B. Shtessel, J. A. Moreno, F. Plestan, L. M. Fridman, and A. S. Poznyak, “Super-twisting adaptive sliding mode control: A Lyapunov design,” in Proc. 49th IEEE Conf. Decis. Control (CDC), 2010, pp. 5109–5113.

[13] E. Nazemorroaya and M. Hashemi, “Adaptive sliding mode controller design for the bipartite consensus tracking of multi-agent systems with actuator faults and disturbances,” Int. J. Autom. Control, vol. 16, nos. 3–4, pp. 288–302, 2022.

[14] F. Mohammadzamani, M. Hashemi, and G. Shahgholian, “Adaptive control of nonlinear time-delay systems in the presence of output constraints and actuators faults,” Int. J. Control, vol. 96, no. 3, pp. 541–553, 2023.

[15] F. Mohammadzamani, M. Hashemi, and G. Shahgholian, “Adaptive neural control of non-linear fractional order multi-agent systems in the presence of error constraints and input saturation,” IET Control Theory Appl., vol. 16, no. 13, pp. 1283–1298, 2022.

[16] F. Qiao, J. Shi, X. Qu, and Y. Lyu, “Adaptive back-stepping neural control for an embedded and tiltable V-tail morphing aircraft,” Int. J. Control, Autom. Syst., vol. 20, no. 2, pp. 678–690, 2022.

[17] S. Gutman, “Uncertain dynamical systems—A Lyapunov min-max approach,” IEEE Trans. Autom. Control, vol. 24, no. 3, pp. 437–443, Jun. 1979.

[18] G. Leitmann, “Guaranteed asymptotic stability for some linear systems with bounded uncertainties,” Dyn. Syst., Meas. Control, vol. 101, no. 3, pp. 212–216, 1979.

[19] M. Corless and G. Leitmann, “Continuous state feedback guaranteeing uniform ultimate boundedness for uncertain dynamic systems,” IEEE Trans. Autom. Control, vol. 26, no. 5, pp. 1139–1144, Oct. 1981.

[20] G. Leitmann, “On one approach to the control of uncertain systems,” Dyn. Syst., Meas. Control, vol. 115, no. 2B, pp. 373–380, 1993.

[21] B. Brogliato and A. T. Neto, “Practical stabilization of a class of nonlinear systems with partially known uncertainties,” Automatica, vol. 31, no. 1, pp. 145–150, 1995.

[22] H. Wu, “Continuous adaptive robust controllers guaranteeing uniform ultimate boundedness for uncertain nonlinear systems,” Int. J. Control, vol. 72, no. 2, pp. 115–122, 1999.

[23] E. Jalalabadi, S. Z. Paylakhi, A. Rahimi-kian, and B. Moshiri, “Integral backstepping Lyapunov redesign control of uncertain nonlinear systems,” IET Control Theory Appl., vol. 16, no. 3, pp. 330–339, 2022.

[24] C. D. Cruz-Ancona, M. A. Estrada, and L. Fridman, “Barrier function-based adaptive Lyapunov redesign for systems without a priori bounded perturbations,” IEEE Trans. Autom. Control, vol. 67, no. 8, pp. 3851–3862, Aug. 2022.

[25] O.-J. Santos-Sánchez, R.-E. Velasco-Rebollo, L. Rodríguez-Guerrero, J.-P. Ordaz-Oliver, and C. Cuvas-Castillo, “Lyapunov redesign for input and state delays systems by using optimal predictive control and ultimate bound approaches: Theory and experiments,” IEEE Trans. Ind. Electron., vol. 68, no. 12, pp. 12575–12583, Dec. 2021.

[26] M. A. Gomez, C. D. Cruz-Ancona, and L. Fridman, “Super twisting based Lyapunov redesign for uncertain linear delay systems,” IEEE Trans. Autom. Control, vol. 68, no. 2, pp. 1107–1113, Feb. 2023, doi: 10.1109/TAC.2022.3148309.

[27] Y. Shou, B. Xu, X. Liang, and D. Yang, “Aerodynamic/reaction-jet compound control of hypersonic reentry vehicle using sliding mode control and neural learning,” Aerosp. Sci. Technol., vol. 111, Apr. 2021, Art. no. 106564.

[28] C. Dong, Y. Liu, and Q. Wang, “Barrier Lyapunov function based adaptive finite-time control for hypersonic flight vehicles with state constraints,” ISA Trans., vol. 96, pp. 163–176, Jan. 2020.

[29] B. Tian, L. Liu, H. Lu, Z. Zuo, Q. Zong, and Y. Zhang, “Multivariable finite time attitude control for quadrotor UAV: Theory and experimentation,” IEEE Trans. Ind. Electron., vol. 65, no. 3, pp. 2567–2577, Mar. 2018.

[30] B. Tian, L. Yin, and H. Wang, “Finite-time reentry attitude control based on adaptive multivariable disturbance compensation,” IEEE Trans. Ind. Electron., vol. 62, no. 9, pp. 5889–5898, Sep. 2015.

[31] B. Tian, Z. Li, X. Zhao, and Q. Zong, “Adaptive multivariable reentry attitude control of RLV with prescribed performance,” IEEE Trans. Syst., Man, Cybern., Syst., vol. 52, no. 10, pp. 6674–6678, Oct. 2022.