【MPC学习笔记】01：MPC简介（Lecture 1_1 Unconstrained MPC）

本笔记来自北航诸兵老师的课程
课程地址：模型预测控制（2022春）lecture 1-1 Unconstrained MPC

文章目录

0 MPC 简介
1 详细介绍

0 MPC 简介

0.1 案例引入

MPC（Model Predictive Control）模型预测控制，是预测控制的一种，是基于模型来进行控制的。
老师举了下面这个例子来引入MPC的基本思想：

比方说我们为未来的一段时间制定计划，一天中几点到几点该做什么。但是计划赶不上变化，出现变化，出现拖延，计划就得做相应的调整。过了一段时间，根据计划的实际落实情况，再对接下来的计划进行调整。如此往复。不断地执行计划，也不断地修订计划。

0.2 系统模型

在控制系统中，有惯用表示：输入记作 $u$ ，状态变量记作 $x$ ，输出记作 $y$
假设系统是离散的，系统的状态方程为：
$x (k + 1) = f (x (k), u (k))$

实际上系统可以是，线性的或非线性的，连续的或离散的或既包含连续又包含离散的，确定的或随机的，只要满足该方程即可

设当前时刻为 $k$ ，当前状态为 $x (k)$
在输入 $u (k)$ 的作用下，系统的状态将由 $x (k)$ 变为 $x (k + 1)$
在输入 $u (k + 1)$ 的作用下，系统的状态将由 $x (k + 1)$ 变为 $x (k + 2)$
在输入 $u (k + 2)$ 的作用下，系统的状态将由 $x (k + 2)$ 变为 $x (k + 3)$
…
由上面的列举，知：输入序列➡️输出序列
但在此时，也就是时刻 $k$ ，我们并不知道输入序列 $\{u(k),u(k+1),u(k+2),\cdots\}$ 是多少

自然而然就会想到一个问题——怎么确定输入序列？
答：通过优化的方式，Optimization
将 状态序列 记为 $X (k)$
将 输入序列 记为 $U (k)$
输入序列的求解，可用如下优化问题的公式来描述：
$\begin{aligned} U^*(k) &= arg\ min\sum^{\infin}_{i=k}l(x(i),u(i)) \\ &=\{u^*(k),u^*(k+1),\dots\} \\ \\ s.t.\quad &x\in \mathscr{X}, u\in \mathscr {U} \end{aligned}$
其中， $arg\ min$ 表示使 **代价函数（目标函数）**取值最小时，输入序列 $U (k)$ 的取值； $^*$ 表示最优解； $s . t .$ 表示约束条件； $l (x (i), u (i))$ 称为 “Stage cost”。
令 $u(k)=u^*(k)$ ，舍弃求出的 $U^*(k)$ 中后续其他时刻的输入，则由 $x (k + 1) = f (x (k), u (k))$ 可以求出时刻 $k + 1$ 的状态
接着， $k + 1$ 变为当前时刻，重复上述步骤，求出时刻 $k + 2$ 的状态 $x (k + 2)$ ，…
以上就是MPC的基本原理

如果只优化一次，将计算出的 $U (k)$ 序列依次执行，那么就变成了开环优化；而这里每一时刻优化后都只取 $u^*(k)$ 执行（ $u^*(k)$ 是 $x (k)$ 的函数），并且不断进行优化，构成滚动优化（闭环优化），因此MPC实际上引入了反馈

0.3 MPC的优点

处理控制输入和系统状态上的约束（Constraints）
- 约束来源：actuator limits; safety; environmental; economic constraints
- PID没办法解决约束问题
近似最优控制
- 与线性系统中的最优控制（LQR, 线性二次型调节器）有区别，在LQR中，我们找到的是最优的增益 $k$ （假设，已知系统是线性反馈），MPC找的是 $u$

0.4 MPC的缺点

需要在线优化（online optimization），可能会有较大的计算负载

0.5 MPC的未来

随着计算机算力提升，MPC或替代PID成为工业界控制主流
在这里插入图片描述

1 详细介绍

见【MPC学习笔记】02：MPC详细简介（Lecture 1_1 Unconstrained MPC）