最优控制（Optimal Control) - Maurice Smith (Harvard University) NMA (TBD) - Tengjun的个人技术博客

生物要有大脑就是因为需要运动！但大脑怎么计划、协调、执行运动命令呢？最优控制（Optimal Control）是一种可能的解释。但在开始深入讨论之前，我们需要先定下一个数学框架以便讨论。

1. 最优控制的数学框架

假设有一个动力系统，它的状态为 \((s)\) ，这里的状态指的是：用于描述、决定系统行为的变量的集合。

如果这个动力系统中，状态的变化只由状态本身决定，一个通用的描述此动力系统的方程如下：

\[ \dot{s}(t) = \frac{\mathrm{d}s}{\mathrm{d}t} = D(s(t)) \]

如果简化为线性动力系统，则可以描述为：

\[ \dot{s}(t) = \frac{\mathrm{d}s}{\mathrm{d}t} = D·s(t) \]

那么这个动力系统即被称为 自治动力系统（Autonomous Dynamical System) 。

然而这是非常简单的形式，现实中我们经常遇到的动力系统都会接收外部的输入,记为 \((a)\) (action, 在动力系统上采取的行动)，那么类似地， 有外部输入 \((a)\) 的动力系统 的通用描述方程和线性描述方程分别为：

\[ \dot{s}(t) = \frac{\mathrm{d}s}{\mathrm{d}t} = D(s(t), a(t)) \]

\[ \dot{s}(t) = \frac{\mathrm{d}s}{\mathrm{d}t} = D·s(t) + B·a(t)\]

下面引入一个简单的例子。假设有一只松鼠在一棵树上，它想要吃到另一棵树上的坚果，这时候它很饥饿，所以它想要尽可能快地吃到那个坚果，