单级倒立摆是一个经典的控制问题。一根杆子下方连接一个小车。杆子可以自由转动。小车可以在一条直线上移动。控制目标是让杆子保持直立。杆子不能倒下。小车也不能超出轨道范围。这个问题看起来简单。实际上它很难。倒立摆本身不稳定。轻轻一碰杆子就会倒下。必须持续施加控制力才能稳住它。
许多控制理论都用倒立摆做验证。它代表一大类不稳定系统。比如火箭起飞时的姿态控制。机器人保持平衡的原理也一样。研究倒立摆控制有实用价值。早期人们用数学模型描述倒立摆。先建立它的动力学方程。杆子有质量有长度。小车也有质量。考虑它们受到的力。运用牛顿力学或拉格朗日方程。可以得到一组微分方程。这些方程是非线性的。非线性方程不好直接处理。
线性化是常用的方法。在平衡点附近进行线性化。假设杆子偏离角度很小。这样非线性方程可以近似为线性方程。线性系统理论非常成熟。可以设计各种控制器。状态空间法是现代控制的基础。把倒立摆模型写成状态空间形式。状态变量包括小车位置、小车速度、杆子角度、杆子角速度。输入是小车的推力。输出可以是全部或部分状态。这样问题就变成了状态反馈控制。
可控性和可观性需要分析。分析表明倒立摆系统完全可控。只要四个状态都能测量。理论上可以任意配置极点。极点位置决定系统响应速度。极点选在复平面左半平面。系统才会稳定。具体位置需要权衡。响应太快要求控制力大。可能超出小车电机能力。响应太慢恢复时间长。杆子容易倒下。需要反复试凑。
线性二次型调节器是一种最优控制方法。它不需要直接选极点。设计者定义两个权重矩阵。一个惩罚状态偏差。一个惩罚控制量大小。加大状态权重。控制器会更快消除角度偏差。加大控制权重。控制器会节省能量动作平缓。求解一个代数黎卡提方程。可以得到最优状态反馈矩阵。这种方法很方便。在实际倒立摆控制中广泛应用。
倒立摆状态有时不能直接测量。比如杆子角速度不方便测。这时需要状态观测器。根据输出量估计状态量。龙伯格观测器是常见设计。观测器也有极点。观测器极点通常比控制器极点快。这样估计才能跟上真实状态。结合状态反馈和观测器。就构成输出反馈控制器。这称为基于观测器的控制器。
PID控制是更简单的方法。它不依赖精确模型。只需要调节三个参数。比例项快速响应误差。积分项消除稳态误差。微分项预测变化改善稳定性。在倒立摆中可以直接对角度偏差进行PID控制。但效果常常不好。单回路PID很难稳定倒立摆。可以设计串级PID。内环控制角度。外环控制小车位置。这样效果更好。PID方法容易实现。在简单场合仍有使用。
模糊逻辑控制模仿人的思维。人的经验是如果杆子往右倒。小车就加速往右移动。把这种经验写成语言规则。如果角度为正且角速度为正。那么控制力为正大。定义输入输出的隶属度函数。模糊化、推理、解模糊化。最后得到精确控制量。模糊控制不依赖精确模型。适应性强。抗干扰能力好。但规则和函数设计依赖经验。
神经网络控制是另一种智能方法。用大量数据训练网络。数据来自手动控制或仿真。网络学习从状态到控制力的映射。训练好的网络可以自己控制。神经网络能逼近复杂非线性。适合模型不确定的系统。还有一种方法叫强化学习。控制器通过试错学习。成功时得到奖励。失败时得到惩罚。最终学会最优策略。这种方法在仿真中取得成功。
实际控制要考虑许多问题。小车电机出力有限。控制力不能无限大。这属于输入饱和问题。轨道长度有限。小车不能跑出范围。这属于状态约束。传感器有测量噪声。执行器有响应延迟。数学模型总有误差。这些不确定因素需要鲁棒控制。H无穷控制可以处理模型误差和干扰。保证最坏情况下的性能。滑模变结构控制也是一种鲁棒方法。它强迫系统沿预定滑模面运动。对外部干扰不敏感。但控制力会高频抖振。
数字控制是现代实现方式。连续控制器需要离散化。计算机定时采样传感器数据。计算控制量输出给执行器。采样频率要足够高。至少要高于系统带宽十倍。否则会出现混叠失真。控制算法编程实现时。要考虑计算延时和量化误差。
倒立摆实验平台有不同形式。有的轨道很短。有的轨道很长。有的用直流电机驱动。有的用步进电机或直线电机。杆子材质也不同。有的在杆子顶端加装摆锤。增加控制难度。有的设计成旋转倒立摆。杆子在平面内旋转。还有多级倒立摆。两根杆子铰接在一起。控制难度更大。这些变体丰富了研究内容。
倒立摆控制的理论和实践不断进步。它成为自动控制教学的典范。学生可以亲手调节参数。观察系统行为。理解稳定性和性能的平衡。它也是新算法的试金石。任何新控制方法常先用于倒立摆。检验其有效性。从简单线性控制到复杂智能控制。倒立摆问题贯穿其中。它连接了经典理论和现代技术。
相关文献非常多。早期文献奠定数学模型基础。二十世纪六十年代就有人研究。状态空间方法推广后。大量论文研究极点配置和最优控制。八十年代后。模糊控制、神经网络应用增多。近期文献集中在鲁棒控制、自适应控制和强化学习。每篇文献都在前人基础上改进。有的提高响应速度。有的增强抗干扰能力。有的降低对模型精度的依赖。这些工作推动整个控制领域发展。
倒立摆控制不仅是一个题目。它代表人类对不稳定系统的驾驭能力。小到平衡车。大到航天器。原理都相通。通过传感器感知状态。通过计算做出决策。通过执行器施加影响。这个反馈循环是自动控制的核心。倒立摆以最简洁形式呈现了这一核心。它将继续吸引研究者探索。