对生命游戏进行梯度下降

2024 年 6 月 · 复杂系统 / 数值实验笔记

在康威生命游戏里，简单的局部规则能涌现出惊人的复杂度：滑翔子会穿越棋盘、振荡子保持节奏、枪炮结构自发生成无限序列。若我们希望“设计”这些结构，仅靠穷举搜索往往效率低下。一个更可控的思路是把生命游戏松弛成可导系统，让我们能够对目标模式构建损失函数，并用梯度下降优化初始状态或外部干预。

对生命游戏进行梯度下降的关键不在于直接优化离散格点，而是用平滑近似让演化可导，在连续空间里下降，再将解投影回二值世界。

1. 让规则可导：软邻居统计与激活函数

生命游戏的基本变量是格点 (i, j, t) 的存活状态 x_{i,j}^t \in \{0,1\}。为了使用梯度法，我们把状态松弛为区间变量 y_{i,j}^t \in [0,1]，并将局部规则改写为平滑函数。常见做法包括：

软邻居计数：使用卷积核 k 对上一帧状态做加权求和，得到连续的邻居数量 s_{i,j}^t。
平滑阈值：用 Sigmoid 或 Softplus 函数近似“等于 2 或 3 则存活、等于 3 则诞生”的离散规则，例如 \sigma(\alpha (s-2.5))。
温度调节：通过调整平滑参数 \alpha 控制规则的锐利程度，训练初期使用较低温度保证梯度存在，后期逐渐升温逼近原规则。

这样得到的演化函数 \tilde{G}(y^{t-1}) 虽然只是原规则的软近似，但它是处处可导的，从而允许反向传播。

有了可导的演化，我们可以为不同任务设计损失函数：

目标重建：给定目标帧 \hat{x}^T，最小化终态误差 \|y^T - \hat{x}^T\|_2^2，反向传播以优化初始状态 y^0。
轨迹约束：如果希望中间帧遵循既定路径，可对每个时间步加入重建损失，或设置“关键帧”施加更高权重。
正则项：添加 \lambda \sum_{i,j,t} y_{i,j}^t (1 - y_{i,j}^t) 鼓励二值化，或用总变差惩罚保持结构边界清晰。

损失的设计直接影响梯度方向。过于尖锐的指标可能导致梯度消失，因此我们通常混合平滑的 \ell_2 项与离散化惩罚。

梯度下降的核心是把生命游戏视作一个参数化的计算图。典型流程如下：

这一流程本质上是把生命游戏当作可微分的动力系统，梯度通过时间反向传播，指导我们修改初始条件。

直接反向传播可能面临梯度爆炸或消失。以下技巧有助于提升稳定性：

这些策略与训练神经网络类似：我们不仅要关心目标函数，还要关注梯度流的形态。

除了调整初始状态，我们还可以在每个时间步引入可控变量 u^t，表示强制点亮或熄灭的格点。损失中加入 \gamma \|u\|_1 惩罚，使得梯度下降在达到目标结构的同时，尽量减少干预次数。

优化后的控制序列可以用来构造“操控脚本”：在真实的生命游戏中只需按脚本干预，就能把系统推向预期的振荡子或滑翔子。这一框架也方便分析敏感度——梯度告诉我们哪些格点最影响目标，从而指导结构设计。

生命游戏的魅力在于简单规则下的无限可能。通过软化规则、构建损失并执行梯度下降，我们得以在连续空间里探索这些可能性，再投影回离散世界验证。虽然松弛带来了近似误差，但它让我们能系统地设计初始状态、规划干预，并量化不同结构的敏感度。

与其盲目搜索，不如搭建一个可微的生命游戏框架：让梯度指引我们雕刻模式，在无限涌现的舞台上实现可控的创作。