物理学报告：复杂系统的可预测性

在小说阅读器读本章

去阅读

导语

复杂系统作为现代科学的核心研究对象，其本质特征体现在自组织、涌现性、非线性、适应性和开放性等方面。与简单机械系统或完全随机系统不同，复杂系统处于完全规则与完全随机之间的平衡状态。本文系统综述了复杂系统可预测性研究的理论框架与方法体系，为理解系统演化的内在规律提供了重要视角。

研究复杂系统可预测性具有重要科学意义。首先，可预测性本身可作为描述系统复杂性的关键特征；其次，准确估计可预测性为预测算法研究提供了基准，帮助识别当前预测精度与理论极限之间的差距；更重要的是，可预测性研究往往需要开发新的理论和方法，进而激发更有效算法的设计。

关键词：复杂系统 (Complex Systems)，可预测性 (Predictability)，时间序列 (Time Series)，复杂网络 (Complex Networks)，动力学系统 (Dynamical Systems)，极限 (Limits)

任筱芃丨作者

赵思怡丨审校

论文题目：Predictability of complex systems

论文链接：https://doi.org/10.1016/j.physrep.2026.01.001

发表时间：2026年1月21日

论文来源：Physics Reports

楔子：拉普拉斯妖会梦见蝴蝶吗？

1814年，皮埃尔-西蒙·拉普拉斯（Pierre-Simon Laplace）构想出了被我们称为物理学四大神兽之一的拉普拉斯妖。在它眼中，宇宙物似一座精密咬合的机械钟表。因此，只要知晓某一时刻宇宙中所有原子的位置和动量，无论是过去最遥远的冲动，还是未来最幽微的瞬间，都将如亲临般清晰可见。这种对机械唯物论的终极信仰，曾是科学界关于可预测性最完美的幻梦。

半个世纪前，爱德华·洛伦兹（Edward Lorenz）在计算机模拟的轨迹中发现了一只"蝴蝶"。这只"蝴蝶"在南美洲扇动几下翅膀，也许能在两周后的德克萨斯州掀起一场龙卷风。这一发现如同劈开了一道裂痕，击碎决定论的虚假穹顶，将我们吸回了非线性与复杂相互作用构成的真实世界里。微小的初始扰动足以在时间的长河中被指数级放大，让确定性的边界消散在混沌的迷雾中。

但复杂系统显然并非完全不可捉摸的随机游走，也非刻板僵硬的机械重复。它们在秩序与混沌的边缘起舞，既有宏观涌现的统计规律，又有微观演化的内生不确定性。在拉普拉斯妖的全知幻象与蝴蝶效应的混沌现实之间，认知的边界究竟在何处？我们能否用一把数学的标尺，去丈量不可知域？

这就是复杂系统可预测性研究试图回答的。

时间序列的可预测性：信息论视角

信息论方法的理论基础

时间序列可预测性的研究最早可以追溯到信息论方法的应用，其核心在于建立熵与预测精度之间的定量关系。对于符号时间序列，研究者通过Fano不等式等形式化工具，将序列的熵与预测精度联系起来，为预测精度的理论上界提供了信息论解释。

图1：熵S与可预测性Π之间的关系示意图。曲线展示了Fano函数SF(p)在不同候选集大C下的变化趋势。该函数具有单调递减和凹函数的性质，直观地表明了熵（不确定性）越低，系统潜在的可预测性上限越高，且两者之间呈现非线性关系。

Song等人提出的Fano缩放方法是该领域的重要里程碑。其核心创新在于通过结构简化真实状态分布，构建可解析处理的Fano函数，从而直接从序列熵估计预测精度的上界。

图2：人类移动轨迹的熵分布与可预测性极限。 (a) 展示了45,000名用户的实际熵S（橙色）、非相关熵Sunc（绿色）和随机熵Srand（蓝色）的分布；(b) 对应的可预测性分布，其中实际移动轨迹的最大可预测性Πmax（橙色）峰值约为0.93，显著高于随机基准；(c) 最大可预测性Πmax与用户回转半径rg的关系，显示当活动范围超过10km后，可预测性稳定在93%左右，表明无论活动范围大小，人类行为均具有高度规律性；(d) 用户在其 Top-ℓ 最常访问位置所花费的时间的一小部分——，用作上界Πmax的近似值。当 c=2 时，约为 0.6;随着 c 的增加，近似以对数方式增长。

他们做了一个数学简化，假设除了那个最可能发生的状态之外，其余所有可能发生的状态概率都是均等的。降低分布复杂度后，构建出的可供计算的Fano函数让我们能直接根据一段历史数据的熵，并算出预测精度的上限。这种方法在人类移动性研究中取得了显著成果，实证分析表明人类移动的可预测性可高达93%。

基于这一基础框架，后续研究从多个方向进行了扩展。研究者们开发了基于可达性的候选集估计方法、考虑Top-ℓ概率结构的整合方法，以及符号序列与数值序列的统一处理框架。这些优化方法有效收紧了可预测性上界，并提高了对实际数据的适用性。

图3：在不同空间量化尺度与变化的时间采样间隔下，总不同位置数与可达位置数的比较，展示了拓扑约束造成的差距。

在人类移动性预测中，传统方法直接用历史访问过的不同位置数估计候选状态空间C，但这会高估实际的可能状态数，因为往往地理空间存在物理障碍、道路网络具有拓扑约束。例如，重庆市的导航路线规划就会常常出现相邻两点的实际路线距离可能有数公里。这种案例中往往体现了物理障碍和拓扑约束。因此，用可达位置数替代总不同位置数作为候选集大小C能显著降低熵估计中的状态空间维度，使可预测性估计Π更贴近真实理论极限

图4：推荐系统中不同缩放形式对可预测性的影响。 (a) 用户偏好项目的真实概率分布; (b) 经典方法计算的 Top-ℓ 可预测性; (c) 参考文献中提出的缩放形式。

真实世界中用户偏好物品的概率分布，是相对平滑地下降的。由图4可见，经典方法计算的简化方式，把后面的概率均等分布，会导致预测上限被高估。而优化后的缩放形式，精确保留了前几个核心候选者的概率阶梯，从而得出更贴近真实的预测上限。

早期的Fano缩放框架主要关注单一个体在孤立状态下的历史数据。然而，在真实的复杂系统中，个体的行为往往嵌入在社交网络与复杂的外部环境之中。为了更精准地刻画这些因素，研究者们将经典熵模型进行了三种关键维度的拓展。

如果我们完全没有某人的历史数据，仅凭他朋友的行为，能预测他的未来吗？研究者利用交叉熵量化了信息在社交网络中的流动。基于Twitter数据的研究发现，仅依靠一个人最常互动的8-9个朋友的历史发帖，就能恢复其高达95%的预测能力。后续研究进一步对比了"社交好友"与"无互动的时空伴随者（同在某地的人）"，发现虽然社交关系携带的预测信息最强，但当大量非社交伴随者的数据被聚合时，同样能提供惊人的预测能力。这一发现不仅揭示了现代社交网络中群体行为的高度耦合，也为数据匿名化和隐私保护敲响了警钟。

图5：社交关系与非社交共位者在交叉熵和可预测性方面的比较。(a) Weeplaces数据集中条件交叉熵的分布：Top-1社交关系（中位数8.17比特）、Top-1非社交共位者（中位数8.46比特）和Top-3非社交共位者（中位数8.02比特）；(b) 相应的可预测性分布：Top-1社交关系（中位数17.43%）、Top-1非社交共位者（中位数12.35%）和Top-3非社交共位者（中位数19.60%）；(c) 每个点代表一个自我中心用户（ego），x轴表示Top-1好友的交叉熵，y轴表示Top-3共位者的累积交叉熵；黑色实线y = x表示相等；(d) 与(c)类似，但坐标轴显示；(e) 在累积包含Top-10 alter后，交叉熵随alter数量的变化，比较社交关系与非社交共位者。圆形表示包含自我历史，三角形表示排除；(f) 相应的可预测性变化，水平线表示自我中心用户的平均熵（5.80比特）和可预测性（47.05%）。误差线表示均值±95%置信区间。

人类的行为不仅仅是时间的序列，更受到此在的约束。研究者提出了上下文熵的概念，将时间段（如早晨/傍晚）和地点类别（如住宅/办公区）等外部情境信息作为约束条件引入熵的计算中。以纽约和东京的签到数据为例，当引入情境条件后，行为序列的不确定性被大幅压缩，使得推导出的整体熵值降低且分布更加集中。情境转移下的可预测性显著高于其他两种方法，且表现出更强的集中性。这表明情境因素能够大幅降低行为不确定性并提升可预测性。该趋势在纽约和东京保持一致，证明了该方法在不同城市环境中具有通用性和鲁棒性。

图6：纽约市（NYC）和东京（TKY）用户熵与可预测性分布的比较。(a)(c) 表两种城市用户在不同计算方法下的熵分布，包括SShannon（绿色虚线）、SReal（红色实线）和（蓝色点划线）；(b)(d) 表相应的可预测性分布，包括 ∏Shannon、∏Real和。蓝色、红色和绿色曲线分别表示情境感知转移、真实转移和香农熵假设下的概率密度函数。

传统的基于压缩算法的熵估计（如Lempel-Ziv）虽然有效，但缺乏直观的物理解释。为了打开这个黑盒，研究者引入了条件熵，并通过平稳性（短时间内停留在同一地点的连贯性）和规律性（长期访问少数几个偏好地点的集中度）这两个直观的特征来拆解个体的行为结构。这种方法将纯粹的数学上限转化为可以被具体的行为习惯所解释的指标，不仅让预测模型的特征构建更加透明，也理清了不同环境因素如何具体调节系统的不确定性。

基于复杂度的度量方法

前文提到的基于Fano缩放的信息论方法，主要针对状态有限且可枚举的"符号序列"（例如人类移动的有限个地点）。然而在真实世界中，许多复杂系统产生的数据是连续的数值序列（如降水量、股票价格、脑电波信号等）。对于这类数据，潜在的状态空间是无限的，如果强行进行离散化处理，不可避免地会造成信息丢失。

那么，如何在不关心具体数值大小的情况下，仅凭"涨跌模式"就能判断一个序列的可预测性？

排列熵巧妙地避开了具体数值的绝对大小，转而关注局部数据点顺序的重复性。数学上的简化就是忽略数据的绝对数值，只保留相邻数据点的相对大小关系。具体而言，对于一个由连续数值构成的时间序列，排列熵首先将序列划分为若干长度为m的滑动窗口；在每个窗口内，只关心第一个点是否比第二个点大。如果一个序列的局部涨跌模式不断重复出现，说明其规律性强、随机性低，预测潜力就大；反之，如果各种排列模式出现的概率都差不多，序列就更接近随机过程，难以预测。研究者将标准化排列熵的补数（1−Sperm）直接作为可预测性的量化指标。例如，在对美国多个州数十年的传染病（如麻疹、流感等）数据进行分析时，研究人员使用排列熵挖掘了一个动态规律。疾病的可预测性并不是固定不变的，而是在爆发早期极高，随后迅速衰减并趋于稳定。在相同的时间点（16周）上，不同疾病的可预测性存在显著差异——麻疹（Measles）的中位数明显高于流感（Influenza），这表明疾病的内在传播特性深刻影响其预测潜力。进一步研究发现，这种可预测性衰减的速度，主要是由疾病的"基本传染数（R0）"驱动的。R0现在已经成为被广泛接受的重要流行病学指标，为疫情早期预警提供理论依据。

图7：美国各州九种传染病的可预测性分析。(a) 平均可预测性(1-Sperm)随时间序列长度的变化，曲线表示均值，阴影区域表示跨州和跨起始时间的四分位距。黑色实线代表SIR模型的中位排列熵。深棕色虚线标记(b)图所选的16周时间点。(b) 4个月（16周）时不同疾病的可预测性分布。箱线图表示中位数、四分位距和全距。结果表明，尽管各疾病随时间的可预测性趋势一致，但在同一时间点上存在显著水平差异。

κ 指数（κ-index）的核心思路源于另一个思路——如果一个序列真的蕴含可预测的规律，那么打乱它的顺序，预测难度应该会显著增加。想象把一首维瓦尔第的《冬》音符顺序完全打乱，控制同一位小提琴家演奏，你肯定能听出区别，因为原曲的旋律结构被破坏了。但如果是一段白噪音，打乱与否毫无影响，因为它本就没有可复用的结构。是用原始真实序列与被完全随机打乱顺序的序列作为对照，检验同一预测算法对它们的可预测性差异。具体做法是对原始序列做一步预测，得到预测误差序列 e1；再把序列元素顺序完全打乱，用同样的方法预测并得到误差序列 er。随后比较两者的误差强度（以平方误差和度量），并定义。

直观上，如果原始序列确实蕴含稳定结构、高度可预测，那么在原始序列上的误差会显著小于被打乱序列上的误差，于是，误差会远小于随机打乱后的误差，此时κ值趋近于1；相反，如果原始序列本身接近随机噪声，打乱与否对预测难度几乎没有影响，误差相近，此时κ值趋近于0。早期的 κ 指数会受到序列长度影响。序列越长，误差平方和的尺度效应越明显。为降低这一干扰，后续工作引入滑动窗口，在局部窗口内计算 κ 并取平均；同时在定义中采用平方根修正（上式中的 1/2 次幂），以改善数值尺度与区分度。

在金融市场的测试中，改进后的 κ 表现出较强的分辨力：它能把理论上近乎完全确定的动力学序列（κ 接近 1）与纯随机游走（约 0.140）清晰区分开；而真实股票价格序列通常落在两者之间，例如通用电气约为 0.415，反映出其部分可预测、部分随机的混合特征。

与贝叶斯错误率的等价性

传统的基于熵的可预测性估计方法虽然经典，但往往暗含马尔可夫假设，难以捕捉序列中的长距离依赖，且对短序列数据非常敏感，容易产生明显的估算偏差。为了克服这些局限，研究人员将时间序列的预测问题，巧妙地转化为一个多分类问题。

具体而言，我们可以把系统"过去的历史状态"看作分类任务中的输入特征，把"下一个即将出现的状态"看作需要预测的分类标签。在分类理论中，贝叶斯错误率（Bayes Error Rate，简称 BER，记为 RB）代表了在现有信息下最完美的理想分类器的最低错误率极限。时间序列可预测性与贝叶斯错误率之间存在严格等价关系，Π=1−RB，这一发现丰富了理论框架，也为算法设计提供了新的指导原则。这种等价性表明，可预测性极限可以理解为分类任务的最优可达性能，为通过非参数估计近似可预测性极限提供了替代路径。

图8：基于熵的方法与 BER 启发式方法在三种序列生成器下的可预测性估计比较。(a, c) 分别为第一和第二个生成器下，基于熵的方法随序列长度 n 变化的结果。(b, d) 在相同生成器下，基于熵的方法与 BER 启发式方法的性能比较，其中和表示下界和上界，代表估计值，阴影区域表示BER方法优于基于熵的方法的区域。(e) 第三个生成器在N = 20固定时，改变参数r的结果。(f) 第三个生成器在r = 3固定时，改变C的结果。所有结果在n = 215时经过10次独立运行平均，阴影区域表示标准误。

如上图所示，通过三个具有解析真实值的合成生成器（用于测试序列长度影响的一步马尔可夫链、用于测试状态空间大小的两步依赖空间、以及用于测试复杂依赖的多步记忆+随机扰动），新方法展现出了显著的优势。即便是在面对具有复杂长短期依赖关系的第三种生成器时（图8e、f），BER 方法依然保持了极高的准确性和鲁棒性。

然而，上述方法——无论是基于熵的信息论框架，还是基于分类错误的BER方法——都隐含了一个关键假设：观测对象是孤立的时间序列。但在真实世界中，个体的行为往往嵌入在复杂的关系网络之中。一个人的移动模式受社交关系影响，一个物种的种群动态受食物链位置约束，一个金融变量的波动受市场关联结构驱动。当我们把视角从单点时间演化扩展到"多点相互作用结构"时，可预测性的分析框架也需要相应升级。这就引出了复杂网络可预测性研究的核心问题，即网络的结构本身，能否告诉我们它未来演化的可预测程度？

复杂网络的可预测性：结构分析与谱方法

复杂网络的基础概念

复杂网络由节点和边组成，用于表示多体相互作用系统。复杂网络研究关注网络结构、动力学过程以及结构与功能的关系。复杂网络理论为理解复杂系统提供了重要工具。链路预测是复杂网络研究中的一个重要问题，旨在预测网络中可能存在的连边，基于网络结构、节点属性和已存在的连边信息进行推断。链路预测在社会网络、生物网络和通信网络等领域有广泛应用。

图9：与网络可预测性相关的研究概述。每个方框代表一项具有代表性的工作。

如何量化一个网络的可预测性？研究者们从谱方法、信息论和结构分析三个视角，发展出了七类代表性方法：

结构一致性（Structural Consistency）通过微扰网络结构观察特征向量稳定性量化网络对结构变化的鲁棒性、

网络谱（Network Spectrum）利用谱隙和子图中心性刻画网络模块化程度、

网络能量（Network Energy）通过特征值绝对值之和度量网络整体活性与稳定性、

压缩长度（Compressed Length）基于无损压缩算法评估网络结构的可压缩性、

熵率（Entropy Rate）度量网络演化序列的渐近不确定性、

结构规律性（Structural Regularity）统计局部重复子图模式以反映网络组织的规则性、

结构可控性（Structural Controllability）从控制理论角度分析通过少量节点驱动网络的能力。

这些方法分别从谱方法、信息论和结构方法视角量化了网络的内在规律性。

谱方法与网络结构分析

谱方法通过分析网络邻接矩阵或拉普拉斯矩阵的特征值和特征向量，揭示了网络结构的内在模态特性。结构一致性（Structural Consistency）分析通过比较不同时间步或不同条件下的网络谱特征，来评估网络结构的稳定性和可预测性。

图10：计算网络结构一致性的过程示意图。 (a) 为给定网络，蓝色虚线链路构成扰动集 ∆E = {(5, 8), (6, 9)}（对应∆A），实线链路构成集合 ER（对应AR）；(b) 为给定网络的邻接矩阵A，每个方格中的数字为相应矩阵元素的值。黑色和蓝色方格分别代表 ER 和 ∆E 中的链路。为计算一致性，我们用 ∆A 对 AR 进行扰动。扰动后的矩阵 Ã 如(c)所示，由此导出扰动网络；(d)，其中红色虚线为按照 Ã 中对应值降序排列后从 U − ER 中选出的结果链路。由于 ∆E 中有两条链路，故 L = 2，集合 EL = {(3, 8), (6, 9)}。在此例中，两条蓝色链路仅有一条通过扰动被恢复，因此 σc = 0.5。

如上图所示，如果网络结构具有内在规律性，那么对网络进行微小扰动后，其拓扑特征应保持相对稳定。σc = 0.5表示50%的扰动边能被正确恢复，反映了该网络具有中等程度的结构一致性和可预测性。

然而，一致性只能告诉我们网络对扰动的敏感度，无法揭示敏感的内在来源。是整体拓扑的规则性，还是局部模体的重复？这就需要我们从更全局的视角审视网络结构。

网络谱（Network Spectrum）可以理解为网络的结构指纹，包含了网络整体连接强度与全局耦合模式，为预测提供了理论依据。谱信息里特征值之间的间隔（谱隙）往往蕴含了网络的模态分布与拓扑稳定性等深层线索，因此可以被用来把网络是否足够的鲁棒性转化为可计算的指标，从而间接衡量潜在链路的可预测性。

以蛋白质相互作用网络为例。当谱隙较大时，网络存在清晰分离的模块结构，蛋白质之间的相互作用集中在若干功能簇内，跨簇的连边较少且更可预测；当谱隙接近零时，网络呈现连续谱特征，模块边界模糊，连边出现的随机性更强，可预测性更低。因此，谱隙可以被用来把网络的模块化程度转化为可计算的指标，从而间接衡量潜在链路的可预测性。

图11：模型网络在不同网络规模 N 下的可预测性 σs 随参数 α 的变化关系。

研究者进一步基于谱隙构造可预测性指标 σs∈[0,1]。即当网络的谱结构更接近理想化的一致的情形时，偏离量趋近于 0，σs 就趋近于 1，表示链路更可预测；反之则更不可预测。该指标在广义 BA 模型上用参数 α 控制结构规则性（α 越大网络越规则）。显示随着 α 增大，σs 整体上升，说明谱方法能够有效捕捉网络演化过程中规则性与可预测性的正相关性。

谱隙为我们提供了全局模块化程度的度量，但它是一维投影。所以，当网络演化涉及复杂的局部重构时，单一标量可能掩盖关键细节。能否找到一个同时反映全局强度和局部稳定性的综合指标？

网络能量（Network Energy）把网络的谱信息压缩成一个全局标量。对无向无权图G，其值等于邻接矩阵所有特征值绝对值之和，，用于量化网络的整体强度和分布特征。其变化趋势可反映网络演化的动态过程。但原始的 E(G) 不仅受拓扑形态影响，还会随节点数 N、边数 M 的规模变化而显著漂移，因此不适合跨网络直接比较。

图12：不同网络规模下的原始网络能量与归一化网络能量。(a) 不同规模的 ER 网络的网络能量 E(G)；(b) 不同规模的无标度网络的网络能量 E(G)；(c) 不同规模的 ER 网络的归一化能量；(d) 不同规模的无标度网络的归一化能量。

能量指标的优势在于全局简洁，但简洁的代价是信息损失——两个能量相同的网络，可能具有完全不同的预测特性。为消除这些外在规模因素，Chai等人引入了归一化能量，其中 Emax(G) 是在相同 N,M 约束下可达到的最大能量上界。这样一来，如图12所示，网络越规则，越小；越随机，越大。

基于这一单调关系，作者进一步转写，并提出融合版指标，将"全局谱强度"（能量）与"局部扰动稳定性"（结构一致性 σc）结合，以获得更丰富的预测证据。

图13：真实网络与模型网络中，三种可预测性指标与预测效果之间的关系。纵轴为链路修正预测算法（LCPA）的 Precision（该算法基于随机扰动与结构一致性，具体流程见文献 [260]），横轴为网络可预测性指标。 (a)–(c) 分别展示在真实网络上的表现；(d)–(f) 分别展示在 ER 网络上的表现。每个点为 10 次独立实验结果的平均值，黑色实线为散点图的线性拟合曲线。

对应到上图，横轴取等可预测性指标，无论在真实网络还是 ER 模型网络中，这些指标与可达到的预测精度都呈现出清晰的正相关并线性拟合，说明"网络能量→归一化→反比映射"的路线不仅是定义上的方便，更能在实验上对网络的结构可预测性提供有效刻画。

信息论视角的网络可预测性

如果谱方法是从"数学结构"提取指纹，压缩长度（Compressed length）则是从"信息冗余"角度评估规律性。其核心思路是把网络结构当作一段可以被重编码的数据，试图在不丢失信息的前提下压缩它。越有规律的结构越可压缩；有重复的局部模式、稳定的组织方式会带来更高的压缩效率。例如先将网络拓扑按既定规则编码为二进制字符串，再用无损压缩算法得到其最短压缩长度，作为网络的结构复杂度表征。压缩长度方法压缩效率越高，说明网络结构越具有规律性，越容易被预测。网络结构的压缩长度反映了其规律性和复杂性，为评估网络可预测性提供了信息论视角。

图14：拓扑编码（topological encoding）的一个示例。令 v 为第 t 步中被选中进行编码的节点，Pt 为第 t 步之后其余节点集合的划分。在编码开始时，我们先任意选择一个节点。例如，如右侧表格所示，选择节点 a 作为起点。首先将其邻居数用二进制表示：由于 ka=2，且节点 a 所属集合 P0-{a} 的元素个数为 |U|=7，因此需要位二进制数来表示，得到二进制串 "010"。随后，根据其余节点是否为 a 的邻居，把它们分成两组：{b,c} 与 {d,e,f,h,g}，至此完成对节点 a 的编码。接着，从 a 的邻居中选择新节点继续编码，例如选择节点 b。同样地，我们把两个数字写成二进制：分别是 b 在前述两组中的邻居数量。由于 b 在集合 {b,c} 中有 1 个邻居、在集合 {d,e,f,h,g} 中有 2 个邻居，对应编码分别为 "1" 和 "010"。然后，再依据节点是否同时与 a 和 b 相邻，把剩余节点进一步划分为（去掉空集后）4 个组，从而完成对节点 b 的编码。按照同样流程，依次对网络中的每个节点进行编码，直到所有节点都处理完毕。编码过程中，长度超过 1 bit 的编码项（即 |U|>1）被追加到序列 B1，长度恰为 1 bit 的编码项，即 |U|=1，被追加到序列 B2。经过 8 步后，B1 与 B2 分别为 01001001001000 与 111111。

这一指标背后是符合工程直觉的，越有规律的结构越可压缩。有重复的局部模式、稳定的组织方式会带来更高的压缩效率，从而使压缩长度更短；越随机的网络越接近不可压缩，其压缩长度更长。

图15：网络压缩（network compression）的过程。 (a) 打乱（shuffled）网络的最短压缩长度。这里的打乱操作是：从原始网络中随机挑选一定比例（Randomness fraction）的连边并将其随机重连。随着 Randomness 增大，压缩长度单调上升；当 Randomness = 1 时，网络在性质上与对应的 ER 网络相同。 (b) 代谢网络（Metabolic network）中 ri 的分布。这里使用 RA 指标（RA index）进行预测，每个柱子的宽度等于网络规模 N。 (c) BPAA 的性能熵 SBPAA 与连边打乱比例 Randomness 的关系。可以看到三种网络都呈现与 (a) 相似的单调趋势。每条曲线为 50 次仿真的平均值，阴影区域表示标准差。与代谢网络具有相同节点数与连边数的 ER 网络中 ri 的分布。

通过随机重连逐步打乱网络来验证。随着打乱比例上升，网络的压缩长度单调增加。当将所有的连边随机重连时，网络在性质上趋近同规模的 ER 随机网络。压缩长度不仅能区分"有序—随机"的结构连续谱，还能与预测任务的可达性能对齐。F随着结构被打乱，基于 BPAA 的性能熵 SBPAA 也呈现与压缩长度相似的单调退化趋势。

压缩效率高的网络确实更可预测，但压缩行为本身不告诉我们哪些局部模式最值得复用。对于时序演化的网络，我们需要更动态的视角。

网络的熵率（Entropy Rate）量化了网络结构的不确定性和复杂性。熵率越低，说明网络的时空演化中存在更多可复用的规律与重复模式，未来状态对过去更可推断。熵率越高，则网络更接近随机过程，结构变化更难预测。基于这一点，熵率不仅能作为复杂性的度量，还能进一步用于推导时序网络预测准确率的理论上限，从而同时回答能否预测和预测精度这两个问题

图16：量化时序网络（Temporal network）可预测性的过程。 (a) 展示了一个包含四个节点的时序网络随时间的演化过程；(b-c) 通过二维矩阵记录每一对潜在连边在不同时间快照中的状态，并过滤掉极少出现的连边以保留核心演化结构；(d) 利用信息论中的压缩算法原理，在时空矩阵中寻找局部模式的重复规律，以此来计算熵率并推导出该时序网络预测准确率的理论上限。

结构方法与网络可控性

结构规律性（Structural Regularity）通过量化网络中存在的模式、周期性和其他结构特征来评估其可预测性。规律性越高的网络结构，其可预测性通常也越高。复杂网络的拓扑结构中，往往普遍存在着局部重复的子图模式。一个直观的验证方式是合成时序网络实验。

图17：(a) 合成时序网络（synthetic temporal networks）。为研究网络拓扑对可预测性的影响，采用一个演化小世界网络模型：第一个快照为环形网络；之后每一步的网络拓扑，都由对前一快照中一定比例 p 的连边进行随机重连得到。 (b) 合成时序网络的可预测性。展示演化小世界网络的可预测性随重连概率变化的结果。网络由 (a) 所示模型生成，节点数为 50，平均度为 2。结构一致性（Structural consistency）是一种已有的可预测性度量，我们在"结构一致性（Structural Consistency）"小节中已作介绍。

从环形网络出发，每一步对上一时刻的一部分连边以概率 p 进行随机重连。此时 p 就相当于"打乱通路"——p 越大，结构越随机、可复用模式越少；因此网络可预测性会随 p 增大而下降。

在真实复杂网络中，这种可复用模式往往表现为大量局部重复的子图结构（例如相似的三角闭合等）。Xian等人提出了一种基于"低秩稀疏表示"的方法来刻画这种局部模式的重复性。简单来说，这种方法试图找出一个包含少数几个核心子图的包，看看整个网络能否由这些核心子图通过线性组合来还原。如果一个网络能够被少数几块子图高效地表示，说明它的结构规律性极强、冗余度高，其未来连边的演化就会表现出高度的可预测性。实验证明，这种结构规律性指标与链路预测算法的准确率之间存在显著的线性关系，它不仅能衡量网络的可预测性上限，还能顺便帮我们找出网络演化过程中最具代表性的"预制板"。

结构可控性（Structural Controllability）从控制论角度研究网络结构，探讨通过控制少量节点来完全驱动网络状态的能力。如何通过向最少数量的驱动节点输入外部信号，来实现对整个网络状态的完全控制。在这个框架下，网络中的连边被分为两类。一类是关键连边（一旦移除就会导致所需的驱动节点数量增加），另一类是普通连边。 Jing等人巧妙地将可控性与可预测性联系了起来，并得出了一个略显反直觉的深刻结论。尽管关键连边对于维持网络的全局控制至关重要，但它们的预测难度往往显著高于普通连边。这种现象揭示了网络在结构控制能力与演化路径可预测性之间存在着一种负向调节的耦合关系（通过结构互惠指数SRI来量化）。这告诉我们，网络中承担核心信息传输和结构支撑的骨干要素，往往也是最难被常规算法预测到的部分。

图18：八个真实网络与 ER 网络的基本拓扑统计量。其中，N 与 M 分别表示节点数与连边数，M(·) 中的 (·) 表示关键连边（critical links）的数量。为数据稀疏度（data sparsity）。〈k〉为平均度。C 为聚类系数。〈d〉为弱连通网络中所有节点对的平均距离；符号 "–" 表示该网络不连通。r 为同配系数（assortativity coefficient）。SRI 为结构互惠指数（structural reciprocity index）的取值。

借由这些工具，我们由此得知一个网络的算法复杂度、可压缩性。但复杂系统的本质特征在于其演化动态。网络结构会随时间变化，连边会生成与消失，节点会敲入与敲出。当我们追问结构将如何随时间变化时，就触及了一个更深层的问题，即支配系统演化的动力学规则本身，具有多大的可预测性？这要求我们适应静态结构分析与动态过程建模并行不悖的研究方式。

动力学的可预测性：从经典理论到AI方法

时间序列告诉我们"系统有多不确定？"，网络理论告诉我们关系结构有多规则。"但如果我们要追问"误差会如何随时间放大？"、"预测窗口为何有限？"，就需要第三种视角——动力学系统的相空间。

经典动力学可预测性方法

动力学可预测性关注的是在已知系统当前状态的条件下，我们能在多长时间尺度内、以多高精度预测其未来演化。需要强调的是，即使系统的演化规则是确定性的，非线性耦合与对初始条件的敏感性也可能导致误差快速放大，从而显著压缩预测提前期并降低长期预测精度。这一类研究的核心动机包括：为任意预测算法提供理论上界、将可预测性作为系统复杂度的关键表征、以及在可预测性显著变化时捕捉潜在的状态转折信号。与此同时，在实际预测任务中，模型误差、观测噪声与系统高维性会进一步放大预测难度，使得如何精确界定并有效提升可预测性成为复杂系统研究的核心挑战之一。

经典研究通常围绕三类理论框架展开：信息论方法（Information-theoretic approaches）、动力学系统理论（Dynamical systems theory）与统计分析方法（Statistical analysis）。

信息论方法将系统演化视为信息产生与传递过程，利用熵、熵率等指标量化不确定性及其增长速度。

动力学系统理论从相空间结构与稳定性出发，通过轨道发散、吸引子几何等性质理解预测误差的演化规律。

统计分析方法将系统观测视为随机过程的实现，借助统计特征与相关结构评估可预测性并构造可用的预测量。

信息论方法

熵和互信息提供了不确定性的量级，但不告诉我们为什么难预测。熵值高可能源于混沌，也可能源于噪声；互信息低可能源于非线性耦合，也可能源于观测不足。要打开这个黑盒，理解误差增长的内在机制，我们需要进入相空间，从几何结构出发分析系统的稳定性与发散特性。

信息论视角将动力学系统的演化理解为信息的产生、压缩与传递。即系统状态随时间推进，不确定性会被放大或被约束，而这种变化本身就对应可预测性的上限与衰减速度。因而，信息论方法通常围绕不确定性边界、增长速率、信源三个问题来刻画可预测性。

在这一框架下，香农熵（Shannon entropy）用来度量系统状态本身的不确定性，熵率（entropy rate）则刻画单位时间产生的新信息量。二者共同指向序列的复杂度与长期预测的困难程度。对确定性系统而言，科尔莫戈罗夫-西奈熵（Kolmogorov–Sinai entropy，KS熵）可以被理解为信息产生率，即KS熵越大，预测误差累积越快，并且其量级与最大可预测时间尺度近似呈反比关系，这使得它成为连接动力学混沌与预测上限的一把信息论标尺。在更贴近预测任务的表述中，条件熵强调当下新增且无法由过去预测的信息，而信息存储则对应当下仍可由过去解释的那部分信息，后者往往更直接指向系统的可预测结构（但也更容易受长程相关影响）。

当研究从单变量走向多变量或耦合系统时，信息来源及其流动方向会变成可预测性的关键。互信息（Mutual Information，MI）通过比较联合分布与边缘分布乘积来刻画变量之间的非线性依赖，但由于它是对称量，无法区分因果方向。 时间延迟互信息（Time-Delayed Mutual Information，TDMI）通过引入时间滞后，把依赖结构投影到时间轴上。其衰减速率常被用来衡量系统的有效记忆长度与可用的预测提前期，因此在多领域时间序列分析中被频繁使用。进一步地，传递熵（Transfer Entropy，TE）建立在条件互信息之上，度量的是"已知另一个变量的过去"能在多大程度上减少对目标变量未来的不确定性，从而同时刻画信息流的强度与方向，并帮助识别系统中的信息源与驱动关系。它关注的是变量 A 的历史是否真正改善了对变量 B 未来的预测，因此更适合用于复杂系统中的因果依赖探索。

需要注意的是，信息论量的价值往往与可估计性紧密绑定。因此在高维变量、样本稀疏或噪声较强等情形下，传统 TE 估计器（如直方图、核密度、kNN）容易出现不稳定和显著偏差，限制了其在动力学建模与预测中的适用范围。为缓解这一问题，原文提到一种基于P-F转移算子（Perron–Frobenius transfer operator）的估计思路。不直接去拟合高维联合分布，利用系统动力学诱导的状态转移结构来间接获得吸引子上的不变测度，并据此计算熵与传递熵。同时，数据预处理在熵类指标估计中并非锦上添花。去趋势、标准化等操作可以显著降低非平稳性对估计的干扰，提高结果的可比性与可信度。

图19：不同条件下熵度量及其推荐估计器。在此表中，Xt 表示系统当前时刻的状态变量，X＜t 表示其过去状态的集合，p(x) 是系统状态的概率分布函数，S(·) 表示熵，S(X|Y）表示给定 Y 条件下 X 的条件熵，I(X;Y）表示变量 X 与 Y 之间的互信息。

该表系统比较了三种熵类指标——熵 S(X）、条件熵 C(X）、信息存储 M(X）——的定义、数学表达式、推荐估计器及其对非平稳性和长程依赖的敏感性。熵度量系统当前状态的总信息量，稳定性高，适合刻画整体不确定性；条件熵 C(X)=S(Xt, X＜t)-S(X＜t) 反映当前无法由过去预测的新信息，对非平稳性（尤其是趋势和尖峰）高度敏感；信息存储 M(X)=S(Xt)-S(Xt|X＜t) 表示当前状态中可由过去预测的部分，最能反映系统的可预测性，但受长程依赖影响显著（正相关增强、负相关削弱）。选择合适的估计器（线性、最近邻、核方法）配合适当的数据预处理（去趋势、标准化），对于准确刻画复杂系统的信息结构至关重要。

动力学系统理论

动力学系统理论从相空间几何结构与稳定性出发，直接研究扰动如何随时间演化，因此更强调可预测性的机制解释：系统为何可预测、误差为何增长、预测窗口为何有限。其核心思路是把预测问题转化为对轨道结构与扰动放大规律的分析。

稳定性与误差增长：Lyapunov指数刻画相邻轨道的平均发散/汇聚速率。最大 Lyapunov指数为正通常意味着对初值敏感，误差会指数增长，从而形成有限的预测时窗；相反，若系统呈现更强的收敛或弱敏感性，预测窗口往往更长。

相空间结构与复杂度：吸引子、分岔与混沌等结构决定了系统轨道的组织方式；分形维数等几何量用于描述吸引子的"有效自由度"，维数越高、结构越复杂，通常意味着更高的建模难度与更短的可预测时间尺度。

图20：Lorenz系统中的强混沌（红色，ρ<ρp≈180.72）、部分可预测混沌（绿色，ρp<ρ<ρC≈180.96）与层流（蓝色，ρ>ρC）的区分。从上到下：(a) Poincaré截面上的zn值；(b) 最大Lyapunov指数λm；(c) 交叉距离标度指数ν；(d) 有限时间交叉相关C12(t=200)。PD1和PD2标记倍周期分岔点，SSB表示系统对称性(x,y,z)↔(-x,-y,z)自发破缺对应的分岔。与传统最大Lyapunov指数相比，该方法对识别"部分可预测混沌"表现出更优越的区分能力，并强调了吸引子拓扑结构对长期可预测性的关键影响。

非平稳与多尺度情形的扩展：在实际系统中，可预测性往往具有显著的时变性、尺度依赖性与空间传播特征。为此，研究中会引入有限时间/有限幅度等"Lyapunov 变体"来刻画不同时间窗口、不同扰动幅度下的可预测性差异，并更贴近真实预测任务中的误差来源。

可预测性作为机制信号：当系统跨越分岔点或进入新的动力学机制时，稳定性结构会改变，常表现为可预测性指标的突变或趋势性变化，因此动力学视角也常被用于解释"为何出现转折"以及"转折前是否存在可识别的征兆"。

动力学系统理论的优势是解释力强、能够把"可预测性"与系统机制直接对应；但在高维系统、强噪声观测或存在模型误差时，严格的动力学量（如 Lyapunov指数）的估计与解释会更具挑战，往往需要与统计/信息论工具联用来提高稳健性。

图21：SINDy（稀疏识别非线性动力学）算法应用于Lorenz系统的示意图。首先收集系统的时间序列数据，包括状态 X 及其导数；然后构建状态的非线性函数库 Θ(X)，包含多项式、三角函数等候选项；应用稀疏回归（如LASSO或序贯阈值最小二乘）识别满足的最小项集 ∑。解向量 ∑ 中少数非零元素指示动力学方程右端的关键项。参数设置为 σ = 10、β = 8/3、ρ = 28，初始条件 (x0, y0, z0)T = (-8, 7, 27)T。

洛伦兹吸引子上的轨迹按所需自适应时间步着色，红色表示较小步长。非线性动力学稀疏辨识（Sparse Identification of Nonlinear Dynamics，SINDy）的核心假设是许多自然系统的演化由少数关键动力学项主导。通过在高维候选函数库中构建稀疏表示，该方法能够从数据中自动发现简洁、可解释且具有强预测性能的动力学模型，在物理和工程系统的广泛应用表明，数据驱动建模不仅能揭示系统的结构本质，也为高维复杂系统的可预测性分析提供了新途径。

图22：计算过程示意图，在Lorenz-63系统相空间中演示。该图展示了计算参考状态在预测时程 η 下的时间滞后递归指数的所有步骤。第二行面板提供了定义的相空间区域的放大视图。递归、前向递归和前向参考状态递归分别用蓝色实心点、蓝色空心点和橙色点表示。半径为的蓝色圆圈表示用于定义参考状态邻域的超球面，半径为的橙色圆圈对应前向参考状态。

TLR指数通过比较当前递归邻域经时间滞后 η 演化后的集合与目标邻域的重叠程度，定量刻画当前状态的局部可预测性：

越接近1，可预测性越高。该方法完全基于相空间几何，无需显式模型，特别适用于高维时空系统。更重要的是，可解释为条件概率，即给定当前状态位于邻域内，其未来状态仍落入未来邻域的概率，从而将可预测性与香农熵直接关联。研究表明，相比经典指标如非线性局部Lyapunov指数，时间依赖局部率（Time-dependent Localized Rate）在非线性区域表现更优。非线性局部Lyapunov指数（Nonlinear Local Lyapunov Exponent）假设误差指数增长，而时间依赖局部率通过递归点的实际演化直接捕获非线性效应，并能揭示可预测性的非单调衰减——在某些时间窗口内，由于吸引子结构，系统可能表现出暂时的可预测性回升。

图23：数据同化与预测方案示意图。(a) 一种将数值模拟与实验观测同步的方法示意。在两个信号 x1(t) 和 x2(t) 实现同步后，在 t = 0 时刻关闭开关，让数值模拟独立演化。(b) 开关关闭前后实验与模拟时间序列的对比，显示两个波形的发散过程。(c) 绝对差值 |x1 - x2| 的半对数图，揭示开关关闭后的指数发散。绝对差值经25 ns移动平均平滑以提供可靠的斜率估计。虚线曲线是将实验数据替换为数值模拟时间序列的结果，显示更接近的初始同步。

在初始同步阶段，通过分析模型轨迹相对于实验轨迹的发散速率，可以估计局部Lyapunov指数及其倒数——即该状态下的预测时程。该方法的关键在于融合实验数据与数值动力学模型，展示了同步现象用于混沌系统预测的实用可行性，为混沌通信、传感器网络和生物医学等领域的预测问题提供了新思路。

统计分析方法

Lyapunov指数和吸引子维数提供了机制解释。它们揭示了误差来源和预测的局限程度。但这些指标的估计往往需要已知动力学方程或足够长的干净数据。当我们面对的是短序列、强噪声、未知方程的真实数据时，需要更鲁棒的操作性工具，即那些不依赖精确模型、直接从统计结构中提取可预测性信息的方法。

统计分析方法更贴近操作性预测，将动力学观测序列视为随机过程的实现，通过统计结构（相关性、谱结构、协方差与条件分布等）来度量可预测性，并构造可用的预测模型或评估指标。与前两类方法相比，它更强调可计算性与可评估性。

相关结构与预测时窗：自相关函数、偏自相关与相关时间（decorrelation time）用于判断系统"记忆消失"的速度；相关时间更长通常意味着可利用的预测信息更持久。

图24：(上) 自相关函数；(下) 对应于阻尼振荡函数的功率谱。

频域刻画：功率谱用于识别主导周期与尺度能量分布；周期峰或低频占优往往对应更强的可预测结构，而宽谱与能量向高频扩散常对应更快的误差增长。

协方差结构与降维预测：主成分分析/经验正交函数（Principal Component Analysis/Empirical Orthogonal Function，PCA/EOF）等方法用于提取主导模态，减少维数并聚焦于更可预测的低维子空间；典型相关分析（Canonical Correlation Analysis，CCA）等相关分析方法可用于在多变量之间构造更有效的预测子集或检验预测关系。

预测性能的统计度量：在模型或数据驱动预测中，常用均方根误差（Root Mean Square Error，RMSE）、相关系数、概率得分（如 CRPS、对数得分等）来评估不同时间提前期的技能衰减，从而把"可预测性"落实到可比较、可复现的指标体系上。

图25：ϵ-对数得分随轨迹长度 T 的变化。蓝色实线表示基于 105 条轨迹计算的平均得分，阴影区域代表95%置信区间。红色虚线表示定理4.1定义的可预测性极限，蓝色虚线表示理论近似。彩色线条展示三条独立随机轨迹的得分演化。结果表明，该方法在短时程内即可达到稳定收敛，理论与实证结果吻合良好，展示了强鲁棒性和实用价值。ϵ-对数得分规则的核心创新在于：通过评估观测值 ϵ 邻域内的概率质量（而非点概率），在保持理论严格性的同时提高了对观测误差和模型偏差的容忍度。其定义为：

定理4.1进一步给出系统在给定容差 ϵ 下的最优可预测性：

其中第一项 dx log(2ϵ) 代表"允许误差范围"关联的信息容量，第二项是真分布与最优模糊预测分布之间的KL散度，反映模型相对于真实系统动力学的拟合误差。这一理论结果清晰界定了"预测精度"与"误差容差"之间的权衡，为系统可预测性上限提供了严格的定量基础。

统计方法的优势在于适配真实数据与工程评估流程，易与预测任务直接对接；但其结果往往更依赖"平稳性、线性近似或分布假设"等前提，对极端事件、强非线性机制转变等情形的刻画通常需要与动力学/信息论视角结合，才能同时兼顾可解释性与稳健性。

AI方法与动力学预测

上述三类经典方法——信息论、动力学系统、统计分析——有一个共同前提，即我们需要理解系统的结构（熵、Lyapunov指数、相关函数等），才能界定其可预测性。但如果我们愿意放弃理解，只追求预测，会发生什么？

机器学习和深度学习方法正是沿着这条路径，在动力学可预测性研究中取得了显著进展。神经网络、支持向量机、随机森林等方法被用于学习和预测动力学系统的演化规律。特别是深度学习方法如RNN、LSTM、Transformer等，能够有效捕捉动力学系统的长期依赖和复杂模式。

图26：DSDL（动力系统深度学习）模型对三种不同混沌动力系统的预测结果。(a) 洛伦兹系统的预测序列。浅灰色线表示数值解（真实状态），蓝色线表示训练集，红色线表示有效预测，深灰色线表示测试集中的无效预测。垂直黑色虚线指示有效预测时间（Effective Prediction Time，EPT）。训练集使用104个时间点，此面板仅显示最后103个点。(b) 洛伦兹吸引子的预测轨迹。(c) 与(a)相同，应用于超混沌洛伦兹系统。(d) 与(a)相同，应用于一个概念性的海洋-大气耦合洛伦兹系统。

有效预测时间（Effective Prediction Time，EPT）作为该框架的核心创新指标，其定义为模型预测误差首次超过预设阈值的时间。这与传统的平均可预测时间（Average Predictability Time，APT）相比，反映了具体深度学习模型的实际性能，捕捉相空间局部结构对预测失效的影响，并揭示预测能力衰减背后的时空不均匀性或者说跃变性。

信息瓶颈理论为理解AI方法在动力学预测中的性能边界提供了理论框架。通过分析AI模型在处理信息时的瓶颈和损失，可以评估其预测能力的极限，并指导模型设计优化。

图27：应用于弹簧-质量系统的"过去-未来信息瓶颈（Past-Future Information Bottleneck，PFIB）"曲线示意图。横轴代表模型保留的历史压缩信息，纵轴代表对未来状态的预测信息。黑色实线为理论上的最优信息瓶颈曲线（即在特定数据压缩程度下能达到的最高预测能力极限）。灰色的方块及下方的子曲线展示了不同维度的模型逼近这一理论极限的过程，直观揭示了动力学预测中"信息压缩"与"预测能力"之间的权衡关系。

然而，AI在动力学可预测性研究中仍面临可解释性、泛化能力和计算效率等理论挑战。研究者正在探索新的理论框架，如信息瓶颈与深度学习的结合、因果推断与深度学习的融合等，以解决这些挑战。

极端事件的可预测性

如果说常规预测是在问"明天最可能发生什么？"，极端事件预测则是在问"最不可能发生的事情，能否被提前察觉？"极端事件——极端天气、卒中发作、电网崩溃——虽然发生概率低，但影响巨大。它们往往在系统相空间的角落中孕育，在常规预测模型的盲区中爆发。降阶建模和前兆检测方法，正是为捕捉这些黑天鹅事件而设计的特殊工具。

降阶建模通过简化动力学系统，保留主导模式，提高了对极端事件的预测能力。前兆检测方法则通过识别系统状态空间中的异常模式，预警极端事件的发生。

图28：ε = 0.1 及不同预测阈值下的ROC特征曲线：(a) μ = 5，(b) μ = 6。实线为完整动力学结果，虚线为降阶动力学结果，对比展示了降阶模型在预测极端事件方面的有效性。

该方法采用基于前兆状态距离的预测框架：通过汇编历史极端事件前的状态分布，识别前兆中心 x*，定义欧氏距离度量。当 D < δ（δ 为阈值参数）时，预测极端事件发生。ROC曲线用于比较命中率和虚警率，不依赖事件频率分布。结果表明，对于完整模型和降阶模型，预测技能均显著优于随机猜测；且事件越极端，预测越容易。这表明在多尺度耦合下，适当设计的降阶模型能够捕获关键前兆结构，为由真实观测数据驱动的预警方法提供了理论支撑。

最优时间依赖模式（Optimal Time-Dependent modes，OTD模式）分析方法通过识别与极端事件最相关的时空模式，优化了对极端事件的预测。可以把OTD模式想象成追踪暴风雨前最不稳定的大气扰动方向。它实时监测系统中那些最容易触发极端事件的"不稳定种子"。这些模式通常反映了系统失稳前的临界行为。

图29：最优时间依赖模式（Optimal Time-Dependent modes，OTD模式）捕捉极端事件前兆示意图。该图展示了在非平稳的动力学系统中，OTD模式如何在随时间演化的过程中始终保持正交性。这种方法能够实时追踪系统相空间中最容易发生指数级增长的扰动方向，从而为高维系统（如流体湍流）中极端事件的爆发提供早期预警和可预测性分析的基础。

变分优化方法和极端轨迹识别为极端事件预测提供了系统性的优化框架。这些方法将极端事件预测转化为适当的变分问题，通过优化过程识别最可能导致极端事件的状态轨迹。

图30：极端事件预测。(a) 垂直虚线标记极端事件阈值 Dm≈ 0.194。水平虚线标记 λ = 0.4。四个象限分别对应：I，正确拒绝；II，假阳性；III，命中；IV，假阴性。(b) 对应极端事件阈值 De = 0.19 的极端事件概率 Pee。变分优化框架的核心思想是将极端事件的发生刻画为有限时间优化问题：在物理约束下，寻找使相关可观测量（如能量耗散率）快速增长的初始扰动。形式化表达为：

其中 Φ(t; u0) 表示从初始状态 u0 出发的轨迹，I(·) 是刻画极端事件的可观测量，允许集确保扰动保持在系统吸引子附近且具有非零发生概率。应用于二维Kolmogorov流，该框架揭示了极端耗散事件由特定的三波相互作用 (0, kf)、(1, 0)、(1, kf) 触发。模式 (1, 0) 在极端事件发生前即刻将能量传递给主导模式 (0, kf)，诱导能量输入和耗散同时激增。基于此机制，模式幅度 l(t) = |a(1, 0, t)| 被提出作为极端事件的前兆指标。统计分析表明该指标与未来极端耗散事件的条件概率之间存在显著非线性关系：当 l(t) < 0.3 时，系统几乎确定会在短期内经历极端耗散事件；而当 l(t) > 0.5 时，未来发生极端事件的概率接近零。由此导出的预测指标通常具有明确的物理意义和高特异性，适用于结构已知且模型准确的系统，为高维湍流系统中极端事件的预测提供了可解释的预测指标。

跨学科视角：

寻找复杂系统预测极限的普适规律

上述三类方法论——信息论方法、网络理论、动力学系统分析——构成了可预测性研究的三根支柱。它们分别从"不确定性量化"、"结构规则性"和"演化机制"三个角度，为我们提供了界定预测极限的工具。但当我们把这些工具带入真实世界的具体领域时，一个有趣的问题浮现：气候系统、生态系统、神经系统、经济系统——这些看似迥异的复杂系统，是否共享相同的预测极限规律？

无论是天气的阴晴圆缺，还是物种的繁衍兴衰，亦或是大脑神经的闪烁，不同领域的复杂系统在预测极限上展现出了惊人的跨学科共性。研究者们发现，非线性演化规律、结构约束、外部扰动以及观测不确定性，共同锁死了各类系统预测能力的"天花板"。而在这些共性之下，不同系统又演化出了各自独特的预测特征。

气候不仅受内部循环（如洋流、大气）影响，还受到强烈的外部强迫（如温室气体排放）。研究发现，全球变暖趋势实际上正在削弱诸如降水、海表温度等关键气候变量的动力学可预测性。为了应对这种复杂的非平稳状态，科学家提出了"总气候可预测性"的概念，将系统"初始状态带来的可预测性"与"外部环境强迫带来的可预测性"统一起来，为理解极端气候演变提供了全局工具。

然而，外部强迫并非总是削弱可预测性。在某些生态系统中，它反而能抑制混沌，带来意想不到的秩序。

在热带雨林的演替或碳循环等生态过程中，系统状态空间的高维性往往让生态系统未来轨迹看起来极度不确定。然而，生态学中存在一种奇妙的"混沌抑制"（Chaos suppression）现象：当引入某种规律性的外部环境强迫时，系统内部原本混乱无序的波动反而会被压制，使得长期的演化轨迹变得更加高度可预测。这表明，外部扰动有时并非预测的敌人，反而可能是建立秩序的推手。

在传染病学中，研究者利用排列熵等工具量化了疾病传播的"动力学熵壁垒"，证明了社交网络的异质性对传染病预测上限存在深刻的物理约束。而在微观的神经科学领域，研究者通过捕捉脑电图信号的多尺度复杂性特征，试图预测个体的神经和精神状态，揭示了动力学特征与临床表现之间的潜在映射。

凡此种种，跨学科的视角给我们带来了一个重要启示，即在真实世界中，不存在一把万能预测标尺。系统是趋于稳定、陷入混沌，还是存在滞后响应，都需要我们摆脱单一指标的依赖，将动力学系统理论、信息论度量与机器学习深度融合，为不同领域的复杂系统量身定制预测极限的分析框架。

应用领域：从理论到实践

理论方法的真正价值，最终要在真实世界中检验。熵缩放、网络谱、Lyapunov指数——这些抽象的数学工具，能否帮助我们预测一支冷气团明天会去哪里、一场疫情会在何时达到峰值？应用领域的案例代表了可预测性研究从实验室走向社会的棘手领域。

通信网络与推荐系统

在通信网络中，可预测性研究用于流量预测、拥塞控制和资源分配。通信网络流量的可预测性对于网络管理和优化至关重要。研究表明，网络流量具有一定的规律性和自相似性，这使得流量预测成为可能。

推荐系统的核心是预测用户对未见过项目的偏好。这种预测的准确性直接影响了推荐系统的有效性。可预测性研究可以帮助理解用户行为模式的规律性和复杂性，从而设计更有效的推荐算法。

金融与经济预测

在金融市场建模中，可预测性研究用于股价预测和风险评估。股价预测是金融领域的经典问题。研究表明，短期股价变化具有一定的可预测性，但长期预测受到市场随机性和外部冲击的严重制约。

在经济学建模中，可预测性研究用于GDP增长预测、商业周期预测和政策效果评估。经济系统的可预测性受到多种因素的影响，包括政策变化、技术创新和突发事件等。

图31：经济复杂性中异质动力学的四种演化模式。 (a) 适应度（代表国家生产能力）与人均收入平面上的宏观动力学分析，揭示了两个典型区域：一个是"层流区"（laminar regime，如图中绿色新兴经济体和蓝色发达经济体），这些国家的演化轨迹高度稳定且可预测；另一个是"混沌区"（chaotic regime，如图中红色和紫色区域），轨迹分散、不规则且可预测性极低。(b) 动力学流场图进一步凸显了不同经济体在发展轨迹可预测性上的巨大差异。

传播过程与地球系统

在传播过程建模中，可预测性研究用于信息扩散、疾病传播和社交网络影响分析。传播过程的可预测性对于理解和管理传播过程至关重要。研究表明，传播过程通常遵循特定的模式和规律，这些模式和规律可以被用于预测传播的动态行为。

图32：不同网络结构下流行病传播规模的不确定性随时间的演化。图中展示了从大世界网络(a)、小世界网络(b)到不同参数的无标度网络(d, e, f)下，流行病最终感染规模的标准差（纵轴，代表不确定性）随时间的变化。随着疾病的扩散，标准差逐渐增加，意味着未来结果的可预测性在迅速衰减。这说明物理网络的拓扑结构和疾病传播率共同决定了流行病可预测性窗口的长短。

在地球科学中，可预测性研究用于气候预测、地震预测和极端天气事件预警。地球系统预测是可预测性研究最具挑战性的应用领域之一。气候系统的可预测性时间尺度受到大气动力学混沌和边界条件变化的限制，目前气候模式能够较好地预测未来一周到一个月的气候变化。

政治科学领域

在政治科学中，可预测性研究用于选举结果预测、政策效果评估和冲突风险分析。政治系统的可预测性受到多种因素的影响，包括选民行为、政策决策和外部事件等。

图33：美国最高法院判决结果的平均可预测性分析。 (a-c) 代表假设法官完全独立投票的"理想法院"场景；(d-f) 代表真实的法院场景。紫色曲线是基于复杂网络（随机块模型）的预测结果，橙色曲线是简单的多数决预测。

一项研究结果表明，在真实的争议性案件（特别是图33.f）中，复杂网络模型的预测准确率远超简单多数决，证明了看似高度独立的司法决策背后，依然存在着稳定且高度可预测的隐性阵营结构。

以上仅列举了若干具有代表性的应用场景，类似的可预测性分析方法还广泛应用于政治科学、教育、学术建模、音乐建模等众多复杂系统中，此处不再一一展开。

未来展望：挑战与机遇

复杂系统可预测性研究正面临前所未有的发展机遇。数据科学的快速进展为理解复杂系统提供了丰富的数据驱动方法，计算能力的指数级增长使得处理大规模、高维系统成为可能。同时，人工智能技术的突破为开发新型预测算法开辟了广阔前景。

然而，研究也面临诸多挑战。理论框架的统一性问题尚未解决，不同类型系统（时间序列、网络、动力学）的可预测性理论需要更深层次的整合。高维系统的维度灾难（curse of dimensionality）问题限制了直接应用传统方法，需要开发更具适应性的新理论工具。

可预测性研究的未来发展越来越依赖于跨学科融合。与信息论、统计学、物理学和控制论等学科的结合已经产生了丰富的理论成果，而与计算机科学、神经科学和经济学的交叉融合正在开辟新的研究前沿。

特别值得关注的是，可预测性理论与人工智能的深度融合正在催生新的理论范式。一方面，可预测性理论为理解AI系统的性能边界提供了理论基础；另一方面，AI技术也为分析复杂系统可预测性提供了强大工具，这种双向互动预示着理论发展的新机遇。

未来研究有几个关键方向值得特别关注。多模态可预测性理论能够同时处理时间、网络和几何结构等多种数据类型；层级化可预测性研究理解从微观到宏观不同尺度系统的可预测性关系；实时自适应预测框架能够根据系统状态动态调整预测策略；理论结果的可计算性问题的研究开发高效近似算法；罕见事件和系统性风险的预测不仅需要理论创新，也需要更精细的数据和更强大的计算资源。

复杂系统可预测性研究作为复杂性科学的核心领域，已经建立了丰富的理论框架和方法体系，从时间序列、网络结构到动力学过程，多个层面的理论成果为理解和预测复杂系统行为提供了坚实基础。随着数据科学和人工智能技术的持续发展，可预测性理论必将在解释和预测复杂系统行为方面发挥更加重要的作用，为科学决策和智能时代提供更加坚实的理论支撑。

因果涌现第七季——从理论到应用

在神经系统中意识的生成、城市交通的拥堵演化、全球产业系统的协同与失稳之中，始终潜藏着一条贯穿微观与宏观的因果脉络：个体行为本身或许简单，却能在尺度跃迁中孕育出高度组织化、难以还原的整体结构。复杂现象并非微观规则的线性叠加，而是源于多尺度动力学作用下逐步形成的因果组织。正是在这一背景下，因果涌现理论被提出，并在因果涌现 2.0、工程化涌现以及多尺度因果抽象等工作中推进，逐渐发展出一套融合动力学分析、信息论度量以及谱方法与人工智能工具的研究框架，从而将研究重心从"复杂性本身"转向"因果结构如何出现、如何被度量并在现实系统中发挥作用"。

为系统梳理因果涌现领域的最新进展，北京师范大学系统科学学院教授、集智俱乐部创始人张江老师领衔发起「因果涌现第七季」读书会，组织对该主题感兴趣的研究者与探索者共同研读前沿文献、交流研究思路。读书会将于2026年2月22日起每周日上午（创建读书会暂定时间为10:00-22:00）线上开展，持续约10周，包含主讲分享与讨论交流，并提供会后视频回放，诚邀相关领域研究者及跨学科兴趣者参与。

详情请见：因果涌现第七季——从理论到应用

推荐阅读

1. 系统观下的复杂科学：拓扑学、线性代数与统计物理的互补角色

2. 通讯·物理:机器学习新框架助力破解复杂系统的动力学奥秘

3. 自然·物理：改变单个节点，让复杂系统恢复如初

4. 诚招系统科学/AI/物理背景的内容创作者

5. 集智学园精品课程免费开放，解锁系统科学与 AI 新世界

6. 高考分数只是张入场券，你的科研冒险在这里启航！

7. 加入集智字幕组：成为复杂科学知识社区的"织网人"

点击"阅读原文"，报名读书会

宙世代

一起剪

相关标签