生命有何特别之处?生物学及其它领域中的整体编排与律则系综
迈向一种整体编排理论
2025年11月11日
导读
好的,同学你好!很高兴能担任你的学术导师。我们即将要深入探讨的这篇文章,来自一位思想非常前沿的科学家,他试图用一种全新的视角来理解生命,甚至是所有复杂系统的奥秘。文章的标题就非常引人深思:"生命有何特别之处?" 这不仅仅是一个生物学问题,更是一个哲学问题,一个物理学问题。
作者认为,生命的特别之处在于其高度的"整体编排"。他将引入一些听起来很复杂的概念,比如"计算不可约性"和"律则系综"。但别担心,我的任务就是把这些概念掰开揉碎,用你熟悉的方式讲解给你听。我们会像侦探一样,跟随作者的思路,一步步揭开他理论的神秘面纱。准备好了吗?让我们开始第一部分的解读。
第一部分:整体编排理论的基础
【原文】
生命有何特别之处?生物学及其它领域中的整体编排与律则系综
迈向一种整体编排理论
这是生命系统的一个关键特征,在某些方面甚至可以说是最关键的特征:即便是下至分子尺度,万物也都是被编排的。分子(或至少是大分子)并非像在液体或凝㬵中那样随机运动。相反,分子生物学的发现是,存在着无穷无尽的主动机制,实际上在编排着生命系统中哪怕是单个分子的行为。但所有这些编排的结果是什么?对于展现出这种"整体编排"的系统,其中所发生的一切,是否可能存在一种普适的描述?一段时间以来,我一直在思考这些问题。但现在,我终于认为我可能已经有了些许答案的开端。
其中心思想是,去思考"为某一整体目的而适应"对一个系统的底层运作所产生的影响。起初,人们可能会认为这个问题没有普适的答案,它总是取决于系统的具体情况和目的。但我们将发现,事实上,所发生的事情通常具有某种普遍性。它的最终根源是计算等价性原理,以及由此引出的计算不可约现象所具有的某些普遍特征。但关键在于,只要一个目的是某种程度上"计算上简单的",那么——或多或少无论这个目的的具体细节是什么——一个实现它的系统都会在其行为中表现出某些特征。
每当存在计算不可约性时,我们都可以把它看作是施加了一股强大的、趋向于不可预测性和随机性的力量(正如它在热力学第二定律中所做的那样)。因此,一个系统要想实现一个整体的"计算上简单的目的",这种计算不可约性就必须在某种意义上被驯服,或者至少被遏制。而事实上,计算不可约性有一个不可避免的特征,即在其中必然存在着发生更简单行为的"计算可约性小块"。在某种程度上,实现计算上简单的目的,其方式必然是利用那些可约性的小块。
当存在计算不可约性时,这意味着我们无法对系统的行为给出一个简单的叙述,也无法为其识别出一个整体的"机制"。但我们可以将计算可约性的"口袋"看作是至少对应着小规模的"可识别机制"。我们将会发现,当一个"简单的总体目标"被实现时,这些机制往往会变得更加明显。这意味着,当一个系统正在实现一个总体目标时,即使在系统的细节运作中也会留下痕迹。而这个痕迹就是我所称的"类机行为"——在这种行为中,存在着至少小规模的"类似机制的现象",我们可以认为它们通过"整体协同"共同作用,以实现某个特定的总体目标。
在某种整体简单性与潜在的计算不可约性之间的相互作用中,可能存在普适特征,这个概念我们并不陌生。事实上,它以各种形式成为我们近期在物理学、数学乃至生物学基础领域取得进展的终极关键。
在我们努力对"整体协同"以及"实现目标"的系统行为获得普遍理解时,可以将其与统计力学进行类比。人们可能曾想象,要得出关于(比方说)气体的结论,我们必须掌握分子运动的详细信息。但事实上我们知道,如果只考虑分子所有可能构型的整个系综,那么通过取统计平均值,我们就可以推导出气体的各种性质。(是的,我们现在可以从计算不可约性等方面来理解其之所以有效的根本原因。)
那么,我们是否可以为整体协同做类似的事情呢?是否存在某个系综,无论我们观察何处,都极大概率地存在某些特定属性?在气体的统计力学中,我们假设底层的力学定律是固定的,但存在一个由分子所有可能的初始构型组成的完整系综——而几乎所有这些构型最终都表现出相同的极限特征。但例如在生物学中,我们可以将不同的基因组视为定义了生物体发育和运作的不同规则。因此,我们现在想要的是一种新的系综——我们可以称之为规则系综:一个由可能规则组成的系综。
但在像生物学这样的领域,我们想要的并非所有可能的规则;而是那些被选择用来"实现目标",即造就一个成功生物体的规则。我们没有通用的方法来描述什么定义了生物适应性。但这里的关键点是,在根本层面上我们并不需要它。相反,似乎仅仅知道我们的适应度函数在某种程度上是计算简单的,就足以让我们能够推断出我们"规则系综"的属性。
【解读】
同学你好,我们来仔细分析一下这段开场白。作者一上来就抛出了一个核心概念:"整体编排"(Holistic Orchestration)。这是什么意思呢?你可以想象一个交响乐团。乐团里有上百位乐手,每位乐手(就像生命体内的分子)都不是在随心所欲地演奏。他们的每一个动作、每一个音符,都被乐谱和指挥家(即生命系统的内在机制和目标)精确地"编排"着,最终共同奏响一曲和谐的乐章。作者认为,生命最特别的地方就在于此——从宏观的器官到微观的分子,一切都井然有序,为了一个共同的目标而协同工作,而不是像一杯水里的分子那样进行随机的热运动。
接着,作者引入了两个听起来很"硬核"的术语:"计算不可约性"(Computational Irreducibility)和"计算可约性"(Computational Reducibility)。别被它们吓到。我们可以这样理解:
-
计算不可约性:想象一下预测天气。你无法通过一个简单的公式,直接从今天的天气跳到一个月后的天气。你必须一天天、一步步地模拟大气所有的复杂变化。这种无法走捷径、只能老老实实地看它一步步演化的过程,就是计算不可约性。它代表了系统内在的、趋向于复杂、混乱和不可预测的强大力量。作者将它比作物理学中的热力学第二定律,也就是熵增原理——万物总是自发地从有序走向无序。
-
计算可约性:这与上面相反,指的是可以走捷径的简单行为。比如,计算一个钟摆的运动,你不需要模拟它的每一次摆动,用一个简单的周期公式就能预测它在任意时刻的位置。这些就是作者所说的"计算可约性小块"或"口袋",它们是系统里那些我们可以理解和预测的、像机器一样运作的部分。
现在,作者的核心论点就清晰了:生命系统要实现一个"整体目的"(比如生存、繁殖),就必须对抗那种天然的、趋向混乱的"计算不可约性"。它如何做到呢?答案就是去发掘和利用系统里那些"计算可约性的小块",把这些简单、可靠的"小机制"组织起来,形成"整体协同",最终实现目标。这个过程,就像在一个充满噪音和混乱的环境中,努力搭建起一台精密运转的机器。
最后,作者提出了一个极具创造性的研究方法,并类比了你可能在物理课上学过的"统计力学"。统计力学不需要追踪每一个气体分子的运动,而是通过研究大量分子组成的"系综"(ensemble,也就是一个大的集合),来推导出气体的宏观性质(如温度、压强)。作者想把这个思想应用到生物学上。他提出的"规则系综"(Rules Ensemble)是什么呢?你可以把它想象成一个巨大的"生命规则库",里面包含了所有可能的基因组(DNA序列)。当然,我们不关心那些会导致生命失败的"坏规则"。我们只关心那些能成功"实现目标"(比如造就一个能适应环境的生物体)的"好规则"所组成的系综。作者推测,只要"成功"这个目标在计算上是相对简单的,那么所有这些"好规则"必然会展现出某些共同的、普遍的特征。这就像所有能烤出美味蛋糕的食谱,虽然细节各不相同,但可能都遵循着"面粉、糖、鸡蛋比例要适当"这类普遍原则。
总而言之,这一段为我们描绘了一幅宏大的图景:生命是一个在与宇宙内在的混乱倾向作斗争的过程中,通过精巧编排,利用简单的"小机制"来实现宏大目标的系统。而研究所有可能成功的"生命规则"的共性,或许能帮我们找到一套理解这种"整体编排"的普适理论。
第二部分:适应度函数的简单性与理论框架
【原文】
但是,生物学的适应度函数实际上是计算上简单的吗?我最近论证过,正是它们的简单性才使得生物进化成为可能。像许多其他基础现象一样,生物进化似乎是计算简单性(就适应度函数而言)与潜在的计算不可约性之间相互作用的反映。(实际上,生物体之所以有机会,仅仅是因为它们需要解决的问题在计算上并不太困难。)但现在,我们可以利用适应度函数的简单性——无需了解它们的更多细节——来对相关的规则系综得出结论,并从那里开始推导与宏观编排相关的普适原理。
当描述一个系统为何如此运作时,可以采取两种不同的方法。一种是自下而上,描述系统运行所依据的底层规则(实际上是其"机制")。另一种是自上而下,描述系统"实现"了什么(实际上是其"目标"或"目的")。这两种方法往往很难结合。但我们在这里将会发现,通过从规则系综的角度思考,我们将能够看到底层规则的"向上"效应和整体目的的"向下"效应的普遍模式。
我在这里所做的只是一个开始——一次对规则系综及其后果的初步探索,既有计算上的,也有概念上的。但似乎已经有强烈的迹象表明,通过从规则系综的角度思考,人们或许能够发展出一套相当于宏观编排的基础理论,并随之发展出关于自适应系统某些方面,尤其是生物学的基础理论。
【解读】
在上一部分,作者留下了一个关键问题:我们凭什么假设生物学的"目标"是简单的?在这一小节里,他给出了自己的回答,并为整个理论框架做了总结和展望。
首先,他谈到了"适应度函数"(Fitness Function)。这个概念源于进化论。你可以把它理解为大自然给每个生物打分的一套标准。这个分数决定了谁能在生存竞赛中胜出。比如,对于羚羊来说,"跑得快"可能就是适应度函数中的一个重要加分项;对于北极熊,"脂肪厚"也是一个关键指标。作者提出了一个相当颠覆性的观点:这些决定生死的"适应度函数",在根本上是"计算上简单的"。
这听起来可能违反直觉,毕竟生存环境如此复杂。但作者认为,正是因为这些根本性问题(如"获取能量"、"躲避天敌"、"成功繁殖")在计算层面并不需要极其复杂的解决方案,生物进化这台"计算机"才有机会在漫长的时间里"算"出答案。如果生存下去需要解决一个像破解顶级密码一样复杂的问题,那么通过随机突变和自然选择这种"笨办法"几乎是不可能成功的。换句话说,生命之所以能在宇宙中存在和演化,恰恰是因为大自然出的"考题"没有我们想象的那么难。这个"简单性"的假设,是作者整个理论的基石。因为它意味着,我们可以不必深究每一个物种具体的生存细节,而可以直接去研究那些为了实现这类"简单目标"的"规则系综"会有什么共性。
接着,作者点出了科学研究中两种经典的思维方式:
-
自下而上(Bottom-up):这是还原论的思路。就像你为了理解一块手表,把它拆成一个个零件,研究每个齿轮如何转动。在生物学中,这就意味着研究DNA、蛋白质、细胞这些底层"机制",然后试图拼凑出整个生物体的运作方式。
-
自上而下(Top-down):这是整体论的思路。你关注的是手表的功能和"目的"——准确地显示时间。在生物学中,这就意味着研究生物体的行为、生态位以及它要实现的"生存目标"。
传统上,这两种方法就像两条平行线,很难交汇。我们很难解释,一个"自上而下"的宏观目标(比如"会飞")是如何具体地影响"自下而上"的底层规则(比如DNA序列的演化)的。作者自信地指出,他提出的"规则系综"理论,恰恰是连接这两者的桥梁。通过这个理论,我们可以看到宏观的"目的"是如何像一只无形的手,向下筛选和塑造微观的"规则",而微观的"规则"又是如何向上涌现出能够实现宏观目标的复杂行为的。
最后,作者谦虚地表示,他目前的工作仅仅是个开始。但他坚信,沿着"规则系综"这条路走下去,我们有希望建立一套关于"宏观编排"的全新理论。这套理论不仅能深刻地改变我们对生物学的理解,甚至可能适用于所有能够"适应"和"实现目标"的复杂系统,比如经济系统、社会系统,甚至是人工智能。这无疑是一次雄心勃勃的尝试,旨在为我们理解世界的方式提供一个全新的、统一的视角。
第三部分:初步示例与实验验证
【原文】
一些初步示例
为了开始我们的探索并建立直觉,让我们看几个简单的例子。我们将使用与我最近关于生物进化的研究相同的基本框架。其思想是让细胞自动机的规则作为基因型的理想化模型,其整体行为作为表现型发育的理想化模型。对于我们的适应度函数,我们将从一个非常具体的目标开始:在 50 步之后(从一个单细胞"种子"开始),我们的细胞自动机应该生成由红、蓝、黄三色等大色块组成的"输出"。
以下是一些以不同方式"解决这个特定问题"的规则示例:
[图片:image-20240508104523671]
如何找到这样的规则呢?嗯,我们可以使用生物进化的理想化模型。让我们来看看上面的第一条规则:
[图片:image-20240508104535384]
比如说,我们从一条空规则开始,然后对该规则进行连续的随机点突变
[图片:image-20240508104551138]
保留那些不会让我们离实现目标更远的突变(并丢弃那些会让我们离目标更远的突变,这里用红点标出):
[图片:image-20240508104603058]
结果是,我们通过数千次突变的"渐进适应"过程,相继减少"错误"的数量,并最终(在本例中是完美地)实现我们的目标:
[图片:image-20240508104616616]
在这个序列的早期,有大量计算不可约性的迹象。但在为实现我们的目标而适应的过程中,计算不可约性被逐渐"遏制"并实际上被挤出,直到最终,本例中的最终解呈现出几乎完全简单的结构。
我们刚才看到的例子成功地精确实现了我们定义的目标——尽管这需要大约4000步的适应性演化才能做到。但如果我们限制适应性演化的步数,那么通常我们将无法达到我们定义的确切目标。但以下是我们在10,000步适应性演化中得到的一些结果(按接近目标的程度排序):
[图片:image-20240508104630514]
在所有情况下,这些规则的行为都存在一定程度的"可识别的机制"。是的,可能会出现一些复杂的——并可能是计算不可约的——行为区域。但特别是那些能更好地实现我们确切目标的规则,往往会"抑制这种计算不可约性",并凸显其"简单的机制"。
【解读】
理论讲完了,现在作者要带我们"动手"了。为了让我们直观地理解他那些抽象的概念,他设计了一个非常巧妙的计算机模拟实验。这个实验就像一个"人造生命"的培养皿,让我们能亲眼目睹"进化"和"编排"的发生过程。
首先,他需要一个简化的"生命模型"。他选择了"细胞自动机"(Cellular Automaton)。你可以把它想象成一个无限大的棋盘,每个格子里有一个小细胞,细胞可以有不同的颜色(状态)。接下来,时间开始流逝,每一秒钟,每个细胞都会根据它自己和它邻居的颜色,按照一条预设的"规则"来改变自己的颜色。这里的关键是:
- 规则:就像生物的基因型(Genotype),是决定生命如何运作的底层指令。
- 细胞演化出的图案:就像生物的表现型(Phenotype),是基因表达后,我们能看到的生物体的实际样子。
然后,他设定了一个非常明确的"进化目标",也就是"适应度函数":从一个细胞开始,经过50个时间步后,棋盘上必须生成一个由红、蓝、黄三种颜色组成的、大小相等、界限分明的色块图案。这个目标很具体,也很"简单"。
那么,如何找到能实现这个目标的"规则"(基因)呢?作者模拟了生物进化的核心过程:突变和选择。他从一个随机的、什么都做不好的"规则"开始,然后对它进行微小的、随机的"突变"(就像基因突变一样)。接着,他会检查新的"规则"产生的图案,是不是比旧的更接近目标图案。如果是,就保留这个突变;如果不是(图中用红点标出的"坏"突变),就丢弃它。这个过程重复成千上万次。
实验结果令人震撼!我们看到,在进化的早期阶段(序列的左侧),图案非常混乱、复杂、难以预测。这就是作者所说的"计算不可约性"占主导地位,系统充满了随机性。但是,随着进化一步步地朝着"目标"前进,混乱的区域被不断"挤压"和"遏制"。最终,那个完美实现目标的"规则",产生了一个极其简单、规整、有序的图案。这就像,为了实现一个简单的目标,进化这只"看不见的手"强行驯服了内在的混乱,让系统表现出一种清晰的、类似机器的简单结构。
更有趣的是,作者还展示了那些没能完美达成目标,但已经"很接近"的结果。你会发现一个普遍规律:一个规则越接近目标,它产生的图案就越有序、越有结构性。虽然其中可能还残留着一些复杂的、不可预测的"混乱区域",但那些"可识别的、简单的机制"变得越来越明显。
这个简单的例子,生动地印证了作者的核心论点:一个简单的"自上而下"的目标,会给"自下而上"的系统运作留下清晰的烙印。这个烙印就是,系统内在的混乱(计算不可约性)会被抑制,而有序的、可理解的机制(计算可约性)会被凸显出来。生命之所以看起来如此"精巧"和"有序",或许正是因为它在漫长的进化中,始终被"成功存活"这个看似简单的目标所塑造和"编排"的结果。
第四部分:突变复杂性的概念
【原文】
突变复杂性的概念
在上一节中我们看到,适应性演化可以找到(4色)元胞自动机规则来生成我们指定的特定 output 。但对于其他类型的输出呢?
我们能得到什么将取决于我们投入多少适应性演化的"努力"。如果我们将适应性演化限制在10,000步内,以下是发生情况的例子:
从定性的层面来看,这里的主要结论是,似乎目标越"简单",在给定步数的适应性演化中,它就越有可能被更精确地实现。
看看上面的第一个(即"最终最成功的")例子,以下是它们在适应性演化过程中是如何达成的:
我们看到,那些"更简单"的序列被达成得既更成功又更迅速;实际上,它们似乎对于适应性演化来说"更容易"生成。但我们在这里说的"更简单"是什么意思呢?从定性的角度来看,我们可以认为一个序列的"简单性"取决于我们能找到多短的描述来形容它。我们可以尝试压缩这个序列,比如使用一些标准的实用压缩技术,如行程长度编码、块编码或字典编码。对于我们上面使用的序列,这些方法(在大多数情况下)对于哪个更简单、哪个不简单的判断是一致的。然后我们发现,在这种表征下"更简单"的序列,往往也是适应性进化更容易产生的序列。
但实际上,我们对适应性进化的研究本身就为我们提供了一种表征序列简单性或复杂性的方法:如果想出一条规则来生成某个序列所需的典型突变次数更多,我们就可以认为这个序列更复杂。我们可以把这个突变次数定义为序列的"突变复杂度"。
要完善这个定义,还有很多细节需要处理。但在某种意义上,我们想说的是,我们可以通过适应性进化生成一个序列的难度来表征该序列的复杂性。
【解读】
同学,我们来仔细分析一下这段文字。它提出了一个非常酷的核心思想:我们可以通过"创造的难度"来定义一个事物的"复杂性"。
首先,让我们把一些关键术语变得亲切一些。想象一下,你不是在做物理题,而是在玩一个特殊的"数字乐高"。
-
元胞自动机 (Cellular Automata):这就是你的乐高积木。想象一条由很多个方格组成的线,每个方格可以涂上四种颜色中的一种。这就是"4色元胞自动机"。"规则"是什么呢?它是一本指令书,告诉每个方格,在下一秒钟,你应该根据你和你左右邻居现在的颜色,变成什么新的颜色。
-
适应性演化 (Adaptive Evolution):这个过程听起来很高大上,但本质上就是"优胜劣汰"的数字模拟。假设你的"目的"(output)是拼出一个特定的颜色序列,比如"红-蓝-红-蓝-…"的条纹图案。你一开始会随机生成一大堆乱七八糟的"指令书"(规则)。然后,你让每一本指令书都去生成图案,看看哪个最接近你的目标条纹。那些表现好的指令书,就像是成功繁殖的生物,它们会被保留下来,并产生一些带有微小变化的"后代"(这就是"突变")。表现差的就被淘汰。这个过程重复一万次(即一万步),就像生物演化了成千上万代一样。最终,你可能会"演化"出一本能完美生成你想要的条纹图案的指令书。
现在,我们来看作者的发现。他尝试让这个"演化"过程去生成各种不同的目标图案(序列)。有些图案,比如第一行的纯色或者简单的重复,演化过程很快就找到了完美的指令书,几乎没什么错误。而另一些看起来杂乱无章的图案,演化过程却步履维艰,即使尝试了一万次,结果还是错漏百出。
作者由此提出了一个革命性的概念:突变复杂度(mutational complexity)。
这个定义非常巧妙,它颠覆了我们通常对"复杂"的看法。我们以前可能会觉得,一个图案看起来越乱,就越复杂。但作者提供了一个全新的视角:一个事物的真正复杂性,体现在创造它的过程中需要付出多少"努力"。一个需要成千上万次试错和突变才能偶然得到的序列,它的"突变复杂度"就高。而一个很容易就能通过演化达成的序列,即使它看起来很长,它的"突变复杂度"也很低。
这就像是你写作文。写一句"今天天气真好"很简单,几乎不需要思考。但要写出一段文采飞扬、情感真挚的景物描写,就需要反复构思、修改、锤炼词句。后者的"创造难度"远大于前者,因此我们可以说它的"复杂度"更高。
所以,这一段的核心思想是:复杂性不仅仅是一个静态的属性,它更是一个动态的过程。一个目标的"演化难度",为我们提供了一把测量其内在复杂性的新尺子。
第五部分:可能和不可能的目标
【原文】
可能和不可能的目标
我们已经在上文看到,有些序列比其他序列更容易通过适应性演化达到。但是,我们可能寻找的任何序列真的都能被找到吗?换句话说——不管适应性演化能否找到它——实际上是否存在任何元胞自动机规则(比如一个四色规则)能够成功生成任何给定的序列?
很容易看出,最终肯定会有无法通过这种方式生成的序列。存在 4^4^3 种可能的四色元胞自动机规则。但即使这是一个很大的数字,可能的四色、长度为 101 的序列的数量仍然要大得多:4^101 ≈ 10^61。所以这意味着,这些序列中必然有一些不会作为任何四色元胞自动机规则的输出出现(从单细胞初始条件运行 50 步)。(我们可以认为这样的序列具有过高的"算法复杂度",无法由像四色元胞自动机规则这样短的"程序"生成。)
但是,对于我们上文定性标准中那些"简单"的序列又如何呢?每当我们在上文通过适应性演化成功找到它们时,我们显然就知道它们是可以生成的。但总的来说,这是一个典型的计算上不可约问题——因此,实际上,要确切知道是否存在任何规则可以生成特定序列,唯一的方法就是明确地搜索所有约 10^38 种可能的规则。
然而,通过观察更简单的情况,我们可以获得一些直观的认识。例如,考虑 128 个(静止)"初等"元胞自动机(k = 2, r = 1):
它们在 t 步后可以生成的不同序列的数量迅速稳定下来(最大值为 32)
但这很快就远小于相同长度的可能序列的总数(2^(2t + 1))。("向下的摆动"与加法规则(如规则 90 和 150)有关,它们在 2^m 形式的步数上生成几乎空白的序列。)以下是 k = 2, r = 3/2 规则的相应结果:
那么,有哪些序列被元胞自动机"遗漏"了呢?仅在第 2 步,一个静止的初等元胞自动机就只能产生 32 种可能序列中的 14 种——像 和 这样的序列就被排除在外。人们可能认为,可以通过说明某些固定的元胞块在任何规则的任何步骤中都不会出现,来描述被排除的序列。对于 r = 1/2 的规则,情况确实如此。但对于 r = 1 的静止初等元胞自动机来说,似乎任何给定大小的块最终都会出现,这大概要归功于像规则 30 这样的规则。
那么,比如说,周期性序列呢?以下是一些静止的初等元胞自动机无法生成的例子:是的,根据大多数标准,这些都是相当"简单"的序列。但它们恰好对于初等细胞自动机来说并不"简单"。实际上,我们可以预料到,即使对于我们的四色规则,也会有大量这样"偶然不可达"但"看似简单"的序列。但我们也可以预料到,即使我们无法精确达到某个目标序列,我们仍然能够得到一个与之相近的序列。(例如,对于上面的第一个序列,最小"误差"是 15 个细胞中的 4 个,对于最后一个序列是 2 个)。
【解读】
这一部分,作者把我们的思考带入了一个更深的层次。之前我们问的是"一个目标有多难?",现在的问题变成了:"一个目标是否从根本上就是不可能的?"
这是一个关于"可能性边界"的问题。作者首先用了一个非常漂亮、让你无法反驳的数学论证,这个论证的思想和你可能在数学课上接触到的"抽屉原理"很像。
想象一下,你的"工具箱"里有一定数量的工具(元胞自动机规则),而你想制造的"产品"(输出序列)有无数种。作者精确地计算了一下:
- 工具的数量:四色元胞自动机的规则总数是 4^(4^3),这是一个巨大的数字,大约是 10^38。
- 可能产品的数量:长度为101的四色序列,总共有 4^101 种,这大约是 10^61。
现在对比一下这两个数字:10^61 远远大于 10^38。这就好比你有100把钥匙,却要打开10000把锁。很明显,绝大多数的锁是你的钥匙打不开的。同理,绝大多数可能的目标序列,是任何一个四色元胞自动机规则都无法生成的。它们是"理论上不可能"的目标。
作者在这里引入了"算法复杂度"的概念。你可以这样理解:一个元胞自动机规则,就像是一段非常简短的计算机"程序"。而一个高度随机、毫无规律的序列,包含的信息量非常大,无法用任何短程序来生成。你只能把它自己原封不动地写下来,这就是它的"程序"。所以,用一个短程序(规则)去生成一个信息量远超于它本身的序列,是不可能的。这就像你不可能用一条简单的数学公式 y = 2x 来画出一个极其复杂的、类似心电图那样的不规则曲线。
接下来,作者做了一件很聪明的事:他把问题简化。研究 10^38 种规则太难了,于是他转向了一个更简单的"玩具模型"——只有128种规则的"初等元胞自动机"。通过研究这个简单的系统,我们可以获得对复杂系统的一些直观感受。
在这个玩具模型里,他发现,即使是很短的序列,也有很多是无法生成的。比如,在所有可能的32个长度为5的序列中,这个系统只能生成其中的14个。更有趣的是,一些我们人类看起来非常"简单"的图案,比如完美的重复序列,也可能恰好是这个系统无法生成的。
这就揭示了一个深刻的道理:一个系统眼中的"简单",和我们人类眼中的"简单",可能完全是两回事。一个序列是否"简单",取决于你用来生成它的"语言"(规则集)。对于初等元胞自动机这门"语言"来说,某些重复序列反而可能是"生僻词",它根本"说"不出来。作者把这种现象称为"偶然不可达"。这就像你有一套非常棒的直线绘图工具,但你的目标是画一个完美的圆。圆本身很简单,但你的工具集恰好不具备这个能力。
最后,作者提到了一个很实际的观点:就算无法100%精确地达到目标,我们通常也能找到一个非常接近的替代方案。这在工程和科学应用中至关重要,因为"足够好"往往比"完美"更有用。
第六部分:适应性演化的局限性
【原文】
但是,适应性进化是否能够找到这样的序列,这仍然是个问题。对于静止初等细胞自动机这个非常简单的例子,我们可以轻易地绘制出规则之间所有可能突变的完整多路图。如果我们运行所有可能的规则 3 个步骤,然后将可能的结果显示为节点,将规则之间的可能突变显示为边(这些边是无向的,因为每个突变都可以双向进行),我们得到的结果如下:
这个图只有 18 个节点,这反映了一个事实:静止初等细胞自动机只能生成 128 个可能的长度为 7 的序列中的 18 个。但即使在这 18 个序列中,也有一些序列是无法通过我们使用的适应性进化过程达到的。
例如,假设我们的目标是生成序列 1010101 (或者更切确地说,找到一个能生成该序列的规则)。如果我们从生成 0000000 的空规则开始,那么我们的适应性进化过程就定义了上述多路图的一个叶状版本:
从 0000000 开始,一些路径(即突变序列)成功地达到了 1010101 。但这只在约 25%的情况下发生。其余时间,适应性过程会卡在 1110111 或 0110110 处,永远无法达到 1010101 :
【解读】
同学,这是我们解读的最后一部分,也是画龙点睛之笔。它揭示了"理论可能性"和"实践可行性"之间的巨大鸿沟。
我们在上一部分讨论了,有些目标是"理论上不可能"的。现在,作者提出了一个更微妙的问题:对于一个理论上可能达到的目标,我们的演化过程就一定能找到它吗?
答案是:不一定。
为了解释清楚这一点,作者再次使用了"简化"这个强大的科学思想工具,回到了那个"初等元胞自动机"的玩具模型。因为这个模型足够简单,他甚至可以画出所有可能性之间的"地图"。
- 多路图 (Multiway Graph):你可以把这张图想象成一个"可能性空间"的地图。每个点(节点)代表一个可以被生成出来的序列。每条线(边)代表一次"突变",它连接了两个可以通过一次规则突变相互转化的序列。整个演化过程,就像是在这张地图上从一个点走到另一个点,寻找通往目标点的路。
这张地图告诉我们,在所有128个可能的7位序列中,这个系统实际上只能创造出18种。这18个点就是地图上的所有"城市"。
现在,关键来了。适应性演化过程,它的寻路策略非常简单,甚至有点"短视"。它就像一个在浓雾中爬山的登山者,他唯一能做的就是判断脚下四周哪个方向是上坡,然后就往上走一步。这里的"高度"就是序列与目标的相似度。这个策略叫作"爬山算法"。
那么问题出在哪里?想象一下,如果你要攀登珠穆朗玛峰(全局最高点,也就是我们的目标),但你出发的地方旁边,恰好有一座小土丘。你采用"只走上坡路"的策略,很快就会爬到小土丘的顶上。一旦到了顶上,你会发现四周所有方向都是下坡路。根据你的策略,你不能走下坡路,于是你就"卡住"了。你到达了一个"局部最优解"(小土丘的顶),却错过了远方的"全局最优解"(珠峰)。
作者用生成 1010101 这个序列的例子,完美地展示了这一点。1010101 这个"城市"确实在地图上,说明它是"理论上可能"的。但是,如果你从 0000000 这个"城市"出发,你的演化之旅(突变路径)有75%的可能会先走到 1110111 或者 0110110 这两个"小土丘"上。一旦到了那里,任何一次单一的突变,都会让结果离目标 1010101 更远(也就是开始走下坡路)。于是,这个"短视"的演化过程就卡住了,永远也到不了它本可以到达的目标。
这个结论意义深远。它告诉我们:
- 存在,不等于可达:一个问题的解即使存在,我们所使用的搜索方法也可能因为自身的局限性而找不到它。
- 路径依赖性:你最终能达到什么样的高度,很大程度上取决于你的起点和沿途的每一步选择。一个微小的、看似无害的早期决策,可能会把你引向一个无法逃脱的"局部陷阱"。
- 理解搜索空间的重要性:这张"多路图"实际上就是在描绘"搜索空间"的结构。这个空间的崎岖、多陷阱的特性,决定了寻找最优解的难度。
这不仅是计算机科学中的核心问题,也能帮助我们理解现实世界。比如,生物演化为什么会产生如此多样的、但并非都"完美"的物种?或许有些物种就陷入了某个"局部最优点",在特定的环境里活得还不错,但已经失去了向更优形态演化的路径。
希望这次的解读,能让你对这些抽象概念有了更具体、更深入的理解。这些思想不仅仅是关于计算机的,它们是关于创造、复杂性和探索未知边界的普适智慧。
第七部分:其他目标函数的探索
【原文】
其他目标函数
到目前为止,我们所做的一切都在考虑一种特定类型的"目标":让细胞自动机在一定步数后产生指定的细胞排列。但其他类型的目标又如何呢?我们将在这里看几个例子。它们将会发生的情况的一般特征与我们已经看到的类似,但每个例子都会展示一些新的效应,并提供一些新的视角。
垂直序列
作为第一个例子,让我们考虑尝试匹配的不是细胞的水平排列,而是垂直排列——特别是细胞自动机模式中心列的颜色序列。当目标是生成一块红色细胞,后面跟着同样大小的一块蓝色细胞时,我们得到的结果如下:
[图片]
结果是相当多样和"富有创造性"的。但值得注意的是,在所有情况下,都可以在"中心列周围"看到明确的"机制"。远离中心列的地方存在各种各样的复杂性,但它被充分地"遏制"了,以至于中心列本身可以实现其"简单目标"。
如果我们要求得到三块颜色而不是两块,情况也类似——尽管这个目标实现起来要困难一些:
[图片]
也可以得到 :
[图片]
总的来说,获得特定垂直块序列的难度,往往与获得相应水平块序列的难度相关。换句话说,对于与水平和垂直目标相关的序列,突变复杂性的模式似乎是相似的。
对于周期性序列,情况似乎也是如此。交替的颜色很容易实现,在这种情况下有许多"技巧"是可行的:
[图片]
一个周期为 5 的序列情况也大致相同:
[图片]
当周期与我们采样的细胞自动机步数变得更具可比性时,"解决方案"会变得更加狂野:
[图片]
其中一些是相当"脆弱"的,并且不能"泛化"到它们所适应的原始步数之外:
输出中的颜色频率
到目前为止,我们考虑的目标类型都涉及到尝试与指定序列精确匹配。但如果我们只要求一个平均结果呢?例如,如果我们要求所有 4 种颜色在我们的输出中以相等的频率出现,但允许它们以任何方式排列,会怎么样?使用与之前相同的自适应进化设置,我们很快就能找到"解决方案"(因为我们运行了 50 步,得到的模式宽度为 101,所以相对于精确的 25:25:25:25 结果,我们总是"至少偏离 1"):
[图片]
这些解决方案中的一些似乎已经"找到了一个机制"来使所有颜色均等。但其他的似乎只是"碰巧奏效"。确实,以前三个案例为例,下图显示了在运行元胞自动机的连续步骤中获得的不同颜色细胞的相对数量:
[图片]
那个看起来简单的模式在每一步都始终保持每种颜色的数量相等。其他的只是在运行了整整 50 步后"碰巧达到了相等",但在此前后都没有实现相等。
而且,实际上,事实证明所有这些解决方案在某种意义上都相当脆弱。改变一个细胞的颜色,通常会得到一个不断扩大的变化区域——这使得输出远离颜色的均等性:
[图片]
那么我们如何才能得到更稳健地实现颜色均等目标的规则呢?一种方法是,通过在每个自适应进化步骤中应用一些扰动,来迫使自适应进化"考虑可能的扰动",并且只有当某个特定突变及其任何扰动版本都没有比之前更低的适应度时,才保留该突变。
以下是通过这种方式获得的一个特定连续规则序列的示例:
[图片]
现在,如果我们对最终结果施加扰动,它不会有太大变化:
[图片]
值得注意的是,这个稳健的解决方案看起来很简单。而且这确实很常见,其他一些稳健、精确的解决方案示例如下:
[图片]
实际上,似乎要求一个稳健、精确的解决方案会"挤出"计算不可约性,只留下易于化约的模式。然而,如果我们稍微放宽精确解的约束,更复杂的行为很快就会出现:
[图片]
整个模式的颜色频率
我们刚才讨论了在元胞自动机的"输出"中(运行 50 步后)实现特定的颜色频率。但如果我们尝试在元胞自动机产生的整个模式中实现某种颜色频率,会怎么样呢?
例如,假设我们的目标是让颜色频率的比例为:[图片]。自适应进化可以相当容易地为此找到好的"解决方案":
[图片]
事实上,对于任何"相对红色水平",它都能做到这一点:
[图片]
但是,如果我们将达到这些结果所需的适应性进化步骤数的中位数(即我们对突变复杂度的近似)绘制出来,我们会发现它随着"红色水平"的增加而系统性地增加:
[图片]实际上,红色水平越高,我们试图满足的约束就"越严格"——并且需要更多的适应性演化步骤才能做到。但观察在不同红色水平下获得的实际模式,我们还看到了另一件事:随着约束变得越来越严格,模式中的计算不可约性似乎被逐渐挤出——留下的行为看起来越来越机械化。
作为另一个类似的例子,考虑形式为 的目标。以下是改变"白色水平"得到的一些结果:
[图片]
我们看到对于"增加白色数量"这个问题,采取了两种截然不同的方法。当白色水平不太大时,模式只是变得更"疏松",内部有更多的白色。但最终,模式倾向于收缩,"留出空间"让白色出现在外部。
【解读】
好了,上一部分我们探讨的是一个非常严格的目标:在未来的某时刻,得到一整排一模一样的像素图案。现在,作者开始变换"考试题目"了,他想看看,如果我们的目标不那么"一维",情况会怎样。这就像在高考中,我们不只考卷面总分,我们还可能考单科成绩,或者综合素质。
这里提出的第一个新目标是"垂直序列"。这是什么意思呢?细胞自动机演化时,会形成一个二维的三角形图案。横着看,是空间上的排列;竖着看,是时间上的演变。之前的目标是匹配最下面那条"横线"。现在的新目标,是匹配正中间那条"竖线"的颜色变化。
打个比方,之前的目标是让一个班的学生在毕业时(特定时间点)排成一个特定的队形(空间排列)。现在的新目标,是让班级正中间的那个同学(特定空间点),在整个高中三年里(时间序列),成绩从高一的红色(优秀)、到高二的蓝色(良好)、再到高三的绿色(及格),完全按照我们的剧本走。
实验结果非常有意思。你看那些图片,为了让中间那一列实现"先是红色,后是蓝色"这样一个简单的目标,进化过程找到了各种各样"富有创造性"的解决方案。你会发现,在中间那一列的周围,图案可以变得极其复杂,甚至是混乱的。但这片混乱仿佛被一道无形的墙给"遏制"住了,它不会干扰到中心任务的执行。
这揭示了一个非常重要的现象,在生物学和工程学中都很常见:核心功能的实现与外围系统的复杂性。想象一下我们的手机,它的核心功能是通信和计算,这是由高度精密的CPU和通信模块(如同那个"中心列")保证的。但为了支持这个核心功能,手机内部有复杂的散热系统、电源管理系统、各种传感器(如同"中心列周围的复杂机制")。这些外围系统本身可能很复杂,但它们的目标就是服务并保护核心功能的稳定实现。
作者还尝试了更复杂的目标,比如三段颜色,或者周期性交替的颜色(红-蓝-红-蓝……)。结果都类似:"适应性进化"总能找到办法,在中心建立一个稳定的"机制"来实现目标,而把复杂性和不确定性"推"到外围去。
总的来说,这一段告诉我们,即使目标很简单,"进化"这个"问题解决者"也可能会构建出非常复杂的结构来达成这个目标。而且它很擅长"模块化"——将负责核心任务的部分与周围的"支撑结构"隔离开,确保任务的稳定完成。这让我们对自然界中那些看似"设计巧妙"的生物机制,有了更深一层的计算学理解。
第八部分:生长形状与生命周期
【原文】
生长形状
在我们目前所做的大部分工作中,我们的元胞自动机模式的整体"形状"最终总是简单的三角形,每一步在每边扩展一个单元格——尽管我们刚刚看到,在对颜色有足够严格的约束下,它们被迫形成不同的形状。但如果我们的真正的目标是实现某种特定的形状呢?例如,假设我们试图获得在每边以特定速率生长的三角形模式。
以下是生长速率为 1/n 形式的一些结果(即平均每 n 步增长 1 个单元格):
这是导致第一个生长速率为 的例子的适应性演化步骤序列
这是生长速率为 对应的序列:
尽管这里大多数最终模式的内部是复杂的,但它们的外部边界——至少对于较小的 n——往往是简单的,并且在某种意义上"非常机械地"生成了精确的目标生长速率:
对于更大的 n,情况变得更加复杂——适应性演化通常不会"找到精确解"。而且,如果我们将我们的"解"运行更长时间,我们会看到——特别是对于更大的 n ——它们通常"泛化"得不是很好,并很快开始偏离其目标生长速率:
随着 n 的增加,我们通常会看到需要更多的适应性演化步骤来达到我们的目标,这反映了"更大的 n 的生长"具有更高的突变复杂性这一想法:
对于像 这样的有理生长速率,相当简单的精确解是可能的。但对于无理生长速率,情况就不再是这样了。然而,事实证明,适应性演化在某种意义上足够强大——而且我们的元胞自动机规则空间也足够大——以至于通常可以达到对无理生长速率的良好近似:
这些"解"在运行更长时间时通常保持相当一致:但仍然存在一些显著的局限性。例如,虽然恰好为 1 的生长速率很容易实现,但接近 1 的生长速率实际上是"结构上困难的"。例如,当速率高于约 0.741 时,自适应演化倾向于"作弊"——在图案顶部添加一个"帽子",而不是实际生成一个具有一致斜率的边界:
如果将其他形状作为目标会怎样?以下是对于难以实现的宽度的菱形所发生的情况:
自适应演化在这种类型的细胞自动机中受到结构上可能性的很大限制——并且结果不是特别好。事实上,如果试图将它们"泛化",很明显,它们中没有一个真正"理解"菱形这个概念:
【解读】
同学们好,今天我们来解读一篇非常有趣的文章,它探讨了如何"驯化"一种简单的计算系统来完成复杂的任务。想象一下,我们有一套非常简单的规则,就像乐高积木的拼接指南,但这些规则是用来给网格上的方块(我们称之为"元胞")染色的。每个方块的颜色在下一秒会根据它邻居的颜色变化。这种系统就叫元胞自动机。
这部分原文的核心问题是:我们能否通过调整这些染色规则,来"生长"出我们想要的任何形状?这就像我们不再是随机地搭乐高,而是有目的地想搭出一座埃菲尔铁塔。文中使用的方法叫做适应性演化。大家可以把它理解成一种计算机化的"物竞天择,适者生存"。我们设定一个目标,比如"画一个边角每2秒才增加1格的三角形",然后让计算机随机生成成千上万个染色规则,对它们进行测试。那些画得最像我们目标的规则被保留下来,并被允许"繁殖"和"变异"(对规则进行微小的随机修改),然后再进行下一轮筛选。如此往复,最终"演化"出的规则就能非常精确地完成我们的任务。
你们看,当目标比较简单时,比如生长速率是1/2或1/3,这个过程能找到非常漂亮、高效的"机械式"解法,边界非常平滑。这说明对于某些问题,存在简单而优雅的答案。但当目标变得苛刻,比如生长速率是1/100,或者是一个无理数(比如圆周率π),演化过程就很难找到完美的答案了。它找到的往往是"近似解",而且如果运行时间足够长,这些近似解可能就会"露馅",不再符合我们的要求。这告诉我们,目标的难度,或者说突变复杂性(你可以理解为"解决这个问题的创造性难度有多大"),决定了我们能否找到一个完美的解决方案。
更有趣的是,系统有时会"作弊"。比如,当要求一个非常陡峭的斜率时,系统没有老老实实地生成一个斜坡,反而在一个较缓的坡顶上加了个"帽子"来凑高度。这像不像我们在考试中遇到难题时,有时会用一些投机取巧的方法来得到分数,而不是真正理解了题目?这揭示了一个深刻的道理:演化过程是功利的,它只关心能否达成目标,而不在乎方法是否"优雅"或"符合初衷"。最后,当目标形状从三角形换成更复杂的菱形时,结果就更不理想了。这说明,这个系统的能力是有限的,它的"基因库"(所有可能的规则)决定了它能创造出什么,不能创造出什么。不是所有的形状都能被轻易"演化"出来,系统的内在结构限制了它的创造力。
第九部分:周期性行为的研究
【原文】
周期性
我们刚刚探讨了让模式存活特定步数的目标。我们可以考虑的另一个目标是让模式在特定步数后周期性地重复。(我们可以把这看作是生物体多代繁殖的一个极其理想化的类比。)
以下是通过自适应演化找到的一些规则示例,这些规则产生的模式在恰好 50 步后重复:
和往常一样,要实现这些结果所需的适应性演化步数存在一个分布:
通过观察不同可能周期的类似分布的中位数,我们可以估算出不同周期的突变复杂性——这似乎随着周期的增加而大致均匀增长:
顺便一提,我们也可以限制自适应演化,使其仅对对称规则进行抽样;以下是通过这种方式找到的一些周期为 50 的结果示例:
在我们目前关于周期性的讨论中,我们一直坚持"从头开始的周期性"——这意味着在每个周期之后,我们得到的模式必须回到我们开始时的单细胞状态。但我们也可以考虑"在暂态之后形成的"周期性。有时暂态很短;有时则长得多。有时周期性模式从一个小的"种子"开始;有时其种子相当大。以下是通过自适应演化找到的一些最终周期为 50 的模式示例:
顺便一提,在所有这些案例中,周期性模式似乎是元胞自动机演化的"主要事件"。但在其他一些案例中,它看起来更像是其他行为的"残留物"——而且事实上,那种"其他行为"原则上可以持续任意长的时间,最终才让位于周期性:
到目前为止,我们一直在讨论寻找能产生特定周期性模式的元胞自动机规则这一目标。但就像存活时间一样,我们也可以考虑寻找我们能找到的最长周期的规则这一"开放式目标"。以下是通过几次运行 10,000 步自适应演化找到的最佳结果(这里我们寻找的是没有暂态的周期性):
【解读】
在探讨了形状和生命周期之后,我们现在进入一个新的领域:周期性。这个目标可以看作是生命周期的一种延伸。之前我们要求模式在特定时间后"死亡",现在我们要求它在特定时间后"重生",也就是精确地回到初始状态,然后开始无限循环。这有点像电影《土拨鼠之日》,主角每天醒来都重复同一天。在生物学上,这可以被看作是代际繁殖的一种高度简化的数学模型:一个生命体发展、成熟,然后产生一个与自己完全相同的后代,周而复始。
和之前的任务一样,适应性演化再次展现了它的威力,为我们找到了许多能够实现周期为50的规则。这些演化出的模式,有的结构简洁,有的则异常复杂,但它们都像精密的钟表一样,在第50步准时归零,重新开始。
文章再次分析了突变复杂性。毫不意外,要实现一个更长的周期,比如100步一循环,比实现50步一循环要困难得多。图表显示,这种难度(突变复杂性)随着周期长度的增加而近似线性地增长。这进一步证实了我们的直觉:设计一个更复杂、更长序列的循环,需要更多的"创造性努力"。
接下来,作者引入了一个更精细的分类。他区分了两种周期性。第一种是"从头开始的周期性",就像一个完美的圆,从起点出发,终点就是起点。第二种是"在暂态之后形成的周期性"。这个概念非常重要,也更贴近现实世界。想象一下点燃一根蜡烛,一开始火焰可能会闪烁、跳动,不稳定,这就是暂态(transient state)。过了一会儿,火焰稳定下来,进入一种持续、平稳的燃烧状态,这就是周期性行为。文中的许多元胞自动机也是如此,它们可能经历一个漫长而混乱的"童年",然后才进入稳定重复的"成年"阶段。有时,这种周期性的稳定结构看起来像是整个演化过程的主要事件,但有时,它又像是一场盛大表演结束后留下的"残骸",在漫长的混乱之后才偶然形成。
最后,文章再次回到了我们之前讨论过的"固定目标"与"开放式目标"的对立上。我们可以设定固定目标:"寻找一个周期恰好为50的规则"。但更有挑战性、也可能更有趣的是那个开放式目标:"在所有可能的规则中,找到那个能产生最长周期的规则"。这又是一场寻找"规则之王"的极限挑战,驱动我们去探索这个简单计算系统所能达到的复杂性的极限。
第十部分:测量类机行为
【原文】
测量类机行为
我们现在已经看到了许多通过适应性演化找到的元胞自动机的例子。一个关键问题是:"它们有什么特别之处?"如果我们观察规则纯粹随机选择的元胞自动机,下面是我们得到的典型例子:
其中一些模式很简单。但许多模式是复杂的,实际上看起来相当随机——尽管常常带有规则性的区域或斑块。但引人注目的是,它们在视觉上与我们上面看到的那些"为某一目的"而适应性演化出的元胞自动机有很大不同。
那么,我们如何才能描述——并最终测量——这种差异呢?我们随机选取的元胞自动机似乎要么表现出几乎完全的计算可约性,要么表现出"不受约束的计算不可约性"(尽管通常带有计算可约性的区域或斑块)。但那些成功地"为某一目的而演化"的元胞自动机看起来则有所不同。它们倾向于表现出我们称之为类机行为的特征:这种行为中有可识别的"类似机制的特征",尽管通常也夹杂着至少一些——通常是高度受限的——"计算不可约性的火花"。
【解读】
同学们,这是我们今天要解读的最后一部分,也是全文思想的升华。前面我们通过"适应性演化"这个强大的工具,像上帝一样设计出了能满足各种苛刻目标的元胞自动机。现在,作者引导我们退后一步,提出了一个根本性的问题:"这些经过精心演化挑选出来的'精英'规则,和那些我们随手抓来的'路人'规则,到底有什么本质区别?"
为了回答这个问题,文章首先向我们展示了随机选择的元胞自动机是什么样子的。它们呈现出两极分化的状态:要么极其简单、可预测,比如形成重复的几何图案(作者称之为完全的计算可约性,意味着你可以轻易预测它的未来,就像知道1+1=2一样);要么就是一片混乱,看起来像电视雪花点一样毫无规律可言(作者称之为"不受约束的计算不可约性",意味着它的行为复杂到你无法预测,充满了随机性)。
然而,那些为了特定目的(如特定形状、生命周期或周期性)而演化出的规则,所产生的模式却截然不同。它们既不完全简单,也不完全混乱。它们处在秩序与混沌的临界点上。为了描述这种独特的状态,作者创造了一个非常精妙的词:类机行为(machine-like behavior)。
什么是"类机行为"?想象一台精密的机械表。它内部有齿轮、弹簧等各种可识别的机制,这些机制协同工作,以一种高度结构化的方式实现一个明确的目标——计时。它的行为是复杂的,但并非随机的;是可预测的,但又不是平庸的。我们通过适应性演化得到的元胞自动机,就展现了这种特质。你可以在它们的图案中看到类似"齿轮"或"杠杆"的结构,这些结构在相互作用,共同服务于那个我们设定好的宏大目标。
最关键的一点在于,"类机行为"中也包含着"计算不可约性的火花"。这意味着,即使在这个像机器一样的系统里,也存在着无法被简单预测的、创造性的、令人惊讶的元素。但与纯粹随机的系统不同,这些"火花"是受约束的、被驾驭的。它们不是肆意燃烧的野火,而是被巧妙地引导在引擎中,为整个机器提供动力。
所以,全文的结论是:生命、智能以及任何为了实现复杂目标而演化出的系统,其核心特征可能就是这种"类机行为"—— 一种介于僵化秩序和完全混沌之间的、能够驾驭复杂性来实现特定功能的精致平衡。这不仅仅是计算机科学的发现,更可能深刻地揭示了我们身边从生物细胞到人类社会等各种复杂系统的运作奥秘。
第十一部分:Rulial系综及其含义
【原文】
Rulial 系综及其含义
我们从这个问题开始:"'为特定目的而演化'对一个系统会产生什么后果?"我们现在已经看到了许多不同"目的"的例子,以及自适应演化如何实现它们。具体细节因情况而异。但我们已经看到,有一些非常普遍存在的通用特征。也许最值得注意的是,在"为特定目的而自适应演化"的系统中,人们倾向于看到我们称之为机械行为的东西:一种存在"类机制"元素的行为。
纯粹随机挑选的规则——实际上是从 Rulial 空间中均匀挑选的——很少表现出机械行为。但在为特定目的而自适应演化的规则中,机械行为是常态。我们在这里发现的是,这基本上是成立的,无论涉及的具体目的是什么。
我们可以将为特定目的而自适应演化的规则看作是形成了一个我们称之为 Rulial 系综的东西:它是所有可能规则空间的一个子集,由自适应演化过程集中形成。我们在这里看到的是,Rulial 系综实际上具有一些通用特征——这些特征普遍存在于为特定目的而自适应演化的规则中。
给定一个特定的目的(比如"产生这个特定的序列作为输出"),通常有许多方法可以实现它。可能的情况是,人们可以设计一个自始至终都显示出"人类可识别的机制"的解决方案。也可能的情况是,它会是"一团计算上不可约的行为",不知何故"恰好"得到了我们想要的结果。但是自适应演化似乎会产生具有中间特征的解决方案。可以看到机制的元素。而且通常也存在某些"计算上不可约的火花"。通常我们看到的是,在自适应演化的过程中,会产生各种各样的计算上不可约性。但要实现任何定义的目的,都需要"驯服"那种不可约性。而且,似乎还需要引入我们所见到的那种机械行为特有的"机制补丁"。
这些"机制的片段"能够组合在一起以实现一个整体目的,这通常是件令人惊讶的事情。但这就是我们在本文研究的系统中看到的那种"整体协调"的本质,而这似乎也是生物系统的特征。
在指定了一个特定目的后,某种系统究竟如何才能实现它,通常是完全不清楚的。事实上,我们在这里看到的适应性进化所做的事情,常常看起来就像魔术。但从某种意义上说,我们所看到的,只是计算宇宙中存在的巨大力量的一种反映,并体现在计算不可约性这一现象中。没有计算不可约性,我们总会"得到我们预期的结果";而正是计算不可约性,增添了最终可称之为无限的意外元素。我们所看到的是,适应性进化成功地利用了那种"意外元素"来实现特定的目的。
假设我们的目标是生成一个特定的数值序列。人们可能会想象,只在可能序列的空间中进行操作,并逐渐适应性地进化到我们想要的序列。但这不是我们在这里使用的设置,也不是生物学所具有的设置。相反,无论是在我们理想化的元胞自动机系统中,还是在生物学中,所发生的情况是:适应性进化过程在底层规则的层面上运作,但其目的是通过运行这些规则的结果来实现的。正是因为这种区别——在生物学中与基因型与表现型的区别相关联——计算不可约性才得以介入。在某种意义上,底层规则和目的的整体模式都可以被认为是定义了某种"句法结构"。而规则的实际运行则代表了可以被认为是系统的"语义"的东西。计算的力量正是在此处被注入的。
【解读】
同学们,现在我们要从具体的实验现象,上升到更宏观、更抽象的理论层面了。作者在这一部分引入了两个新词:"Rulial空间"和"Rulial系综",听起来很酷,我们来把它弄明白。
首先,想象一个包含了"所有可能规则"的宇宙,这个无限广阔的规则集合,作者称之为"Rulial空间"。你可以把它想象成一个巨大的图书馆,里面存放着能想到的和想不到的、所有可能的物理定律、数学公式或者程序算法。如果在这个图书馆里随机抽一本书(一个规则),然后运行它,我们得到的结果大多会是混乱、无序、毫无意义的。作者说,"纯粹随机挑选的规则……很少表现出机械行为",就是这个意思。
然而,"自适应演化"并不是在随机乱抽。它像一个有目标的读者,在这个巨大的图书馆里进行筛选。它会丢掉那些产生无用结果的"书",保留并改良那些能帮它实现目标的"书"。经过这个筛选过程,最终留下来的那一小部分"精华规则"的集合,作者称之为"Rulial系综"(Rulial ensemble)。
这里的核心洞见是:为了特定目的而演化出来的系统,其底层规则并不是随机的,而是属于一个具有共性的特殊子集。这个共性就是我们之前反复提到的"机械行为"(machine-like behavior),也就是一种包含着清晰、可重复、模块化机制的行为。无论你的目标是生成序列A还是序列B,最终演化出的成功规则,都倾向于带有这种"机械感"。
那么,演化找到的解决方案是什么样的呢?作者指出了三种可能性:
- 纯粹的机器:就像一个钟表,每个零件的功能都一目了然,完全是我们人类可以理解和设计的。
- 纯粹的混沌:一团乱麻,完全不可预测,但结果"碰巧"是我们想要的。这就像一个黑箱,我们不知道它内部如何运作,只知道输入A能得到输出B。
- 演化的选择——混合体:这是最有趣的一点。作者发现,自适应演化产生的方案,恰恰介于上述两者之间。它既有清晰可见的"机制的元素"(比如一些重复的模块),又保留了一些"计算上不可约的火花"(一些局部的、难以预测的复杂行为)。
这个结论非常精妙。演化似乎在说:我需要用"计算不可约性"这种强大的、充满创造力的混沌力量去探索可能性,但为了稳定地实现目标,我又必须用一些可靠的"机制补丁"去"驯服"这种混沌。最终的产物,是一种有序与混沌的精巧结合。
第十二部分:目的与机制以及生命的本质
【原文】
目的与机制以及生命的本质
任何现象都有可能从目的和机制两个方面进行解释。为什么抛射体会沿着那样的轨迹运动?我们可以解释为它遵循其运动定律所定义的机制。或者我们可以解释为它遵循着满足某个整体变分原理(比如,使与轨迹相关的作用量取极值)的目的。有时,用机制解释现象更方便;有时,用目的解释更方便。并且,我们可以想象,这种选择可能取决于哪一种解释在"计算上更简单"。但是,我们在这里讨论的系统过程又如何呢?如果我们只是运行一个像元胞自动机这样的系统,我们总是知道它的"机制"——也就是它的底层规则。但我们并不会立刻知道它的"目的",而且,如果我们选择一条任意的规则,我们也没有理由认为它会有一个"计算上简单"的目的。事实上,只要元胞自动机的运行是一个计算上不可约的过程,我们就可以预料到它不会"实现"任何我们可以识别的、计算上简单的目的。
但如果规则是由某个适应性演化过程决定的呢?那么,那个适应性演化的目的就可以被看作是定义了一个目的,我们可以用它来描述系统行为的至少某些方面。但"目的的存在"对系统如何运作到底有什么影响呢?这里出现的关键点是,当通过适应性演化过程实现了一个计算上简单的目的时,那么该系统的规则将成为我们所说的规则系综的一部分。然后,我们所论证的是,规则系综存在一些通用特征——这些特征不依赖于适应性演化可能实现了什么具体目的,只依赖于其目的是计算上简单的。在这些通用特征中,最主要的就是机械式行为的存在。
换句话说,只要存在一个总体上计算简单的目的,我们发现——无论这个目的的具体细节是什么——目的的存在倾向于"向下推动自身",以产生局部上是机械式的行为,即显示出"可见机制"的证据。我们所说的"可见机制"是什么意思呢?在操作层面上,它倾向于是一种易于进行"人类级别的叙事性解释"的机制。
值得记住的是,在最底层,我们研究的系统被设定为具有简单的"机制",即它们具有简单的底层规则。但一旦这些规则运行起来,它们通常会产生计算上不可约的行为,而这种行为没有简单的"类似叙事的"描述。但当我们审视适应性演化出的结果时,我们处理的是属于规则系综的一个规则子集——因此我们最终会看到具有至少局部"叙事性描述"的机械式行为。
然而,正如我们所讨论的,如果适应性演化还没有"完全走完其历程",即目标的突变复杂性高于实际已完成的适应性演化量,那么仍然会存在尚未被"挤出"的计算不可约性。
那么,这一切与生物学有何关系?就我们在此关心的问题而言,生物学的第一关键要素是存在独立的基因型和表现型——它们通过通常被认为是计算上不可约的生物生长等过程联系在一起。对我们这里的目的而言,生物学的第二关键要素是自我繁殖现象——在新产生的生物体中,其基因型除了微小突变外完全相同。这两个要素都立即被我们在此使用的简单细胞自动机模型所捕捉。
鉴于这些要素,我们似乎不可避免地得出我们在此的结论,即关于规则系综、机械样行为和整体编排的结论。
生物学中最终为何存在如此多的表观复杂性,这通常被视为一个谜。但一旦了解了计算不可约性,人们就会意识到,复杂性实际上是相当普遍的。相反,在许多方面更令人惊讶的是任何"可解释机制"的存在。但我们通过规则系综在这里看到的是,这种可解释的机制实际上是整体"简单计算目的"的投影。
在某种层面上,计算不可约性无处不在。事实上,它正是丰富行为的驱动力。但发生的情况是,"在整体目的的存在下",一块块的计算不可约性必须被组合在一起以实现该目的。或者换句话说,对所有这些计算块,不可避免地存在某种"整体编排"。这也正是我们在实际生物系统中经常看到的现象。
那么,生命——以及生物系统——到底有什么特别之处呢?我认为——最重要的是——它涉及了如此多的适应性进化。地球生命史中所有约10^40个个体生物,都是适应性进化链条中的一环。也许所有那些"适应性进化的努力"所产生的效果,仅仅是"解决问题"——并产生某种"简单的机械性解决方案"。
但这不是我们在这里看到的,我们也不能期望事情会这样运作。相反,我们所拥有的是"计算不可约性的团块"被"简单机制"所"驾驭"而产生的复杂相互作用。发生了如此多的适应性进化,这一点至关重要。而我们现在在整个生物学中——直到最微小的特征——所看到的,都是那种适应性进化的结果。是的,我们可以看到"历史的冻结偶然事件"。但重点不在于那些单个项目,而在于适应性进化的整体聚合结果:机械样行为和整体编排。
正是因为这些特征是通用的,我们才能够期望它们可以构成生物系统和生物行为的稳健"宏观"理论的基础:这种理论大致具有与气体定律或流体动力学相同的"宏观理论"特征。但这现在谈论的是在其规则层面经历了大规模自适应演化的系统。
我在这里所做的,很大程度上只是一个开始。但我相信,我所展示的规则学研究以及我所描述的普适框架,为我们前所未有的东西提供了原始材料:一个定义明确且普适的、用于阐释生命系统运作的"基础理论"。它不会描述所有"历史偶然"的细节。但我希望它能提供一个有用的全局视角来审视正在发生的事情,并有可能从中为我们称之为"生命"这一非凡现象的各种有用问题找到答案。
【解读】
好的,同学们,这是我们解读的最后一部分。在前文构建了宏大的理论框架后,作者回归到了一个更古老也更贴近我们思考习惯的哲学二分法上:目的(Purpose)与机制(Mechanism)。这部分是对前文思想的总结和升华,帮助我们理解在不同情境下,哪种解释世界的方式更有效。
作者以高中物理中经典的抛体运动为例。对于"为什么炮弹会飞出一条抛物线?"这个问题,有两种截然不同的解释方式。
-
机制解释:这是我们最熟悉的牛顿力学解释。在每一个瞬间,炮弹都受到重力(F=mg)的作用,产生一个向下的加速度。我们通过积分,一步步地推导出它的完整轨迹。这是一种"自下而上"的、基于因果链条的解释。
-
目的解释:这可能对一些同学来说比较陌生,它源自一种更高级的物理学原理,叫做"最小作用量原理"。这种解释认为,炮弹之所以选择这条抛物线,是因为在所有可能的、连接起点和终点的路径中,这条路径恰好能使一个叫做"作用量"的物理量取到最小值。这是一种"自上而下"的、目标导向的解释,仿佛炮弹在出发前就已经"知道"了自己要去哪,并选择了一条"最优"的路径。
在物理学中,这两种解释是等价的,它们都能导出正确的结果。我们选择哪一种,往往取决于哪一种"在计算上更简单"。
现在,作者将这个思考带回他所讨论的核心——像元胞自动机(Cellular Automaton)这样的简单计算系统。元胞自动机可以看作是一个极简的"计算宇宙",它有一套极其简单的底层规则(这就是它的机制),比如"如果一个格子周围有两个黑邻居,它自己就变黑"。这个机制是我们预先设定的,所以是完全已知的。
但是,它的目的是什么呢?当我们运行这个简单的规则时,常常会涌现出极其复杂的、不可预测的图案。对于这些图案,我们能说它在"追求"某个"计算上简单"的目的吗?作者的答案是:通常不能。
这里的关键又回到了我们最初的概念——计算不可约性。如果一个元胞自动机的演化过程是计算不可约的——也就是说,我们无法预测它未来的样子,只能一步步地运行下去看结果——那么,我们就无法用一个简单的"目的"来概括它的行为。因为如果能用一个简单的目的来概括,就意味着我们找到了预测它的"捷径",那它就不是计算不可约的了。
这引出了一个深刻的结论:我们人类习惯于用"目的论"来理解世界,比如我们会说"鸟儿有翅膀是为了飞翔"。这种目的论的解释之所以有效,是因为生物进化已经将系统"驯服"到了一个计算可约的状态,使得我们可以用一个简单的目标来描述其复杂的功能。但是,对于宇宙中那些原始的、未被"驯服"的、计算不可约的复杂过程,其本身可能没有任何简单的目的。它的机制就是它的一切,它的过程就是它的意义。
这提醒我们,在探索生命和宇宙的本质时,我们寻找"目的"的本能可能会碰壁。很多时候,唯一的答案就是那个无法被简化的、正在 unfolding(展开)的复杂过程本身。这既是对我们人类认知局限的一种提醒,也是对宇宙复杂性的一种敬畏。
附录:不同的自适应策略
【原文】
附录:不同的自适应策略
在我们对规则系综和突变复杂度的探索中,我们研究了一系列可能的目标函数。但我们总是只考虑一种自适应演化策略:在每一步接受或拒绝规则中单点随机突变的结果。那么,如果我们采用不同的策略,会发生什么呢?主要结论是:似乎没有太大关系。对于一个特定的目标函数,存在一些自适应演化策略,它们可以用更少的自适应步骤达到给定的结果,或者最终比我们通常的策略走得更远。但最终,规则系综和突变复杂度的基本情况,相对于我们自适应演化过程中的细节变化是稳健的。
举个例子,考虑在每个自适应演化步骤中允许规则发生一次以上的随机突变。比如说——就像上面最开始那样——我们的目标是在 50 步后生成 。在每一步只有一个突变的情况下,只有一小部分自适应演化"运行"能达到"完美解",但在每一步有更多突变的情况下,至少在这种情况下,进展会更大——如下方 10,000 个自适应演化步骤后剩余"错误数"的直方图所示:
从多路系统的角度来看,每一步的突变越少,可能规则之间的路径就越少,"陷入僵局"的可能性就越大。每一步有更多的突变,总的路径就更多,陷入僵局的可能性就更低。
那么,突变复杂度又如何呢?如果我们仍然认为每个自适应演化步骤算作一个单位的突变复杂度(即使它涉及规则中多个底层突变),下图显示了对于不同目标,突变复杂度(如上文计算)如何受每一步底层突变数量不同的影响(每个"刻度"的高度表示突变的数量):
所以,是的,每一步中不同数量的突变会导致突变复杂性在细节上有所不同,但在大多数情况下,总体上却惊人地相似。
其他自适应进化策略又如何呢?我们可以考虑很多种。例如,一种"梯度下降"法,在每一步中我们都检查所有可能的突变,然后选择"最优的"一个——即最能提高适应性的那个。(我们可以扩展这种方法,在每一步不仅保留最优的规则,还保留,比如说,前 5 名——类似于"束搜索"。)还有一种"协作"法,其中会遵循多条不同的随机突变"路径",但每隔一段时间,所有的路径都会被重置为迄今为止发现的最佳路径。事实上,我们可以考虑来自强化学习的各种技术。
在特定情况下,这些方法中的任何一种都可能产生显著影响。但总的来说,我们在这里讨论的现象似乎足够稳健,以至于自适应进化是如何完成的这些细节并不那么重要,而我们在这里主要使用的单一突变策略可以被认为是足够有代表性的。
【解读】
同学们,在这一部分,作者展现了他的雄心壮志,并开始像一个严谨的科学家那样,审视自己理论的稳健性。
首先,他提出了一个非常激动人心的类比。他希望他发现的这些"通用特征"——即机械样行为和整体编排——能够成为生物学领域的"宏观理论",就像物理学中的"气体定律"或"流体动力学"一样。这是什么意思呢?大家想一想,当我们研究气体时,我们不需要追踪每一个气体分子的运动轨迹,那太复杂了,根本不可能。相反,我们用温度、压强、体积这些宏观量来描述整个系统的行为,这就是气体定律。同样,当我们研究水流时,我们也不关心每一个水分子的具体位置,而是用流速、压强等宏观概念来描述,这就是流体动力学。
作者认为,生物学也许可以有类似的理论。我们可能永远无法预测每一个基因、每一个蛋白质的所有复杂互动(就像追踪单个分子一样),但我们或许可以找到一些宏观的、普适的定律来描述整个生命系统的行为。而他提出的"机械样行为"和"整体编排",正是这种宏观定律的候选者。这个理论不追求解释"为什么人类有五根手指"这类"历史偶然"的细节,而是试图回答"为什么生命系统总是呈现出某种有序结构"这样更根本的问题。
接下来,文章进入了附录部分。这是一个非常重要的科学思维训练。当一个科学家提出一个模型或理论后,他必须做的第一件事就是"自我批判":我的结论,是否仅仅因为我选择的特定研究方法才成立?如果我换一种方法,结论还会一样吗?这个问题,关乎理论的"稳健性"(Robustness)。
作者在这里坦诚,他之前的分析主要基于一种简单的"自适应演化策略",即每次只允许一个点发生随机突变,然后看结果好不好,好的就保留,不好的就丢弃。这很像自然界中最简单的变异模式。但进化策略其实可以有很多种。比如,一次允许多个点同时突变?或者,像"下棋"一样,先预判所有可能的突变,然后选择那个"最优"的突变?
作者在这里给出了一个初步的结论:似乎没有太大关系。换句话说,无论具体的进化策略细节如何,最终演化出的系统,其宏观特征(比如规则系综的样子)都非常相似。这就像无论你是跑步、骑车还是开车去学校,最终的目的地和学校的整体结构都不会改变。这个结论至关重要,因为它说明作者发现的现象可能不是他模拟方法带来的偶然产物,而是一个更深层次、更普遍的规律。这大大增强了其理论的说服力。
历史与个人背景
【原文】
历史与个人背景
自古以来,人们就很清楚,生物体中含有一种与自然界其他地方发现的物质不同的"黏糊糊的东西"。但它是什么?它可能有多普遍?在维多利亚时代,它有各种名称,最著名的是"原生质"。显微镜技术的日益有效使得人们清楚地看到,"活物质"中实际上存在着大量的结构——例如,不同细胞器的存在就反映了这一点。但直到二十世纪后期,人们普遍认为,生命中发生的事情基本上是化学——或者至少是生物化学——在这个过程中,各种不同的分子以一定的速率随机移动并发生化学反应。
1953 年发现的 DNA 的数字性质慢慢开始侵蚀这一图景,增加了关于分子尺度机制和"机器"的想法,这些机制和"机器"可以用机械或信息的方式——而不是"宏观统计"的方式——来描述。事实上,过去几十年来分子生物学的一个显著趋势是发现了越来越多的方式,表明生命系统中的分子过程是"被主动编排的",而不仅仅是"随机统计行为"的结果。
当可以识别出单个组分(细胞膜、微管、生物分子凝聚体等)时,通常会发展出"宏观理论",这类理论通常基于统计力学的思想。但当涉及到不同种类组分的集合时,大部分所做的工作都是收集材料来填满许多卷的生物学教科书,内容相当于对事物如何详细运作的叙述性描述——而没有尝试去构建任何一种独立于特定细节的"总体图景"。我个人对生物学的基础兴趣可以追溯到大约半个世纪前。20世纪80年代初,当我刚开始研究细胞自动机时,我确实(像我之前的其他人一样)想知道它们是否可能与生物学相关。当我发现即使规则简单,细胞自动机也能产生极其复杂的行为,而且这些行为在视觉上常常惊人地"有机"时,这个问题就变得更加迫切了。
在20世纪90年代,我投入了相当多的精力去研究生物学中的宏观问题:事物如何长成不同的形状,产生不同的色素沉着模式,等等?但不知为何,在我研究的所有事物中,都存在着一种假定的统一性:可能涉及许多元素,但它们在本质上都是相同的。我很清楚那些已经被发现的复杂反应网络——以及后来的"分子机器"片段。但它们给我的感觉更像是工程系统——有许多不同的详细组件——而不像是可以存在"普适理论"的系统。
尽管如此,在我最了解的工程领域——即软件工程——我一直在想,是否可能有一些普遍性的结论,特别是关于大型软件系统的整体结构和运作方式。我进行了测量,构建了依赖关系图,还思考了软件漏洞与疾病之间的类比。但除了一些幂律之类的东西,我从未真正发现什么。
然而,随着我们2020年物理学项目的出现,情况发生了很大变化。因为,除其他事项外,现在有了一种观点,即万物——甚至时空结构——都是动态的,并且实际上是从事事件之间的因果关系图中涌现出来的。那么生物学呢?会不会分子生物学中真正重要的是单个分子间相互作用的因果图?也许需要一种能够追踪特定分子,而不仅仅是分子种类的"亚化学"。也许,想象普通化学可以成为生物学的基础,就像认为研究电子角的物理学就能让人理解微处理器一样,都相去甚远。
早在 20 世纪 80 年代初,我就发现像元胞自动机这类系统的典型行为可以分为四个类别——其中第四类具有最明显的复杂性。而且,是的,第四类系统产生的视觉模式通常具有非常"栩栩如生"的外观。但这背后是否存在根本性的联系呢?2023 年,作为结束我 50 年个人探索之旅的一部分,我一直在研究热力学第二定律,并发现第四类系统——就像生命系统一样——无法仅仅用趋向随机化的倾向来有效描述。可逆的第四类系统尤其清楚地表明,第四类中确实存在一种独特的行为形式——我称之为"机械态"——在这种行为中,尽管嵌入在巨大的整体复杂性之中,但仍能看到一定数量的明确结构和"机制"。
起初,我根本没考虑分子,但在 2024 年,我在生物进化方面却取得了一些意外的进展。在 20 世纪 80 年代中期,我曾考虑过通过对元胞自动机规则之类的东西进行连续的微小突变来为进化建模。但在当时,这并不奏效。直到 2024 年,我从机器学习的成功中获得了新的直觉,才再次尝试——而这一次,它成功了。给定一个像"创造一个能存活尽可能久的有限模式"这样的目标,通过对规则(比如元胞自动机中的规则)进行连续突变的适应性进化,似乎能几乎神奇地找到——通常是相当精巧的——解决方案。很快我便明白,我所看到的本质上是"原始的计算不可约性",它只是"恰好"符合我正在使用的相当粗糙的适应度标准。然后我提出,生物进化的成功是计算有界的适应度与底层的计算不可约性之间相互作用的结果。
但是,好吧,这对生物系统的"内部运作"意味着什么呢?在我对生物进化的最小模型的基础上探索一种理想化的医学版本,这促使我更详细地研究了适应性进化系统中的行为谱系,以及由扰动产生的变体。
但是,我们能从中说出一些具有普遍性——甚至可能是普适性的——东西吗?在热力学第二定律中,人们常说,我们看到的行为在某种程度上极有可能是"所有可能性系综中的典型行为"。在通常的热力学第二定律中,这些可能性只是分子等的不同初始构型。但当思考一个可以改变其规则的系统时,所有可能性的系综——至少在开始时——要大得多:实际上,它就是整个 ruliad。但我几个月前意识到的关键一点是,与生物学相关的规则变化必须是能够通过适应性进化过程以某种方式实现的。但那种适应性进化的目标应该是什么呢?从我们的物理项目以及受其启发的许多事物中学到的关键教训之一是,是的,观察者的特性很重要——但只需对观察者有少量了解,就足以推断出该观察者将感知到的行为法则的很多信息。因此,这引出了一个想法,即这种事情对于目标函数也可能成立——例如,仅仅知道一个目标函数在计算上是简单的,或许就足以告诉我们关于可能规则的"规则系综"的一些事情。
但这真的对吗?嗯,正如我多次做过的那样,我转向计算机实验来寻找答案。在我关于生物进化基础的研究中,我曾使用过在某种意义上非常"通用"的适应度函数(如总体寿命)。但现在我需要一整套可能的适应度函数——其中一些从许多方面来看,实际上甚至比像寿命这样的东西设置起来还要简单。
我认为我在这里报告的结果非常鼓舞人心。底层的细节似乎并不太重要。但大量计算上简单的适应度函数似乎会"渗透下去",对小尺度行为产生同样的效果——并在某种程度上使其变得机械化。
生物学通常被认为是一个不期望有太多形式化理论基础的领域。确实如此——即使在收集了所有数据之后——生物学中也鲜有"宏大理论":自然选择和 DNA 的数字/信息本质几乎是仅有的例子。但现在,从我们的物理项目中引入的思维模式中,我们有了新的、不同的东西:规则系综的概念,以及这样一个观点,即基本上仅从生物进化这一事实出发,我们就可以讨论生物学中自适应进化系统必须如何运作的某些特征。
传统数学方法在广阔的生物学基础领域从未取得太大进展。最终,特定的计算建模也同样如此。但是通过提升到一个更高的层次——在某种意义上思考所有可能计算的空间——我相信我们可以开始看到一条通往强大通用框架的道路,这个框架不仅适用于生物学的基础,也适用于任何通过自适应进化过程产生整体协同的系统。
【解读】
最后这一小段,作者将我们的视线从前沿的计算理论拉回到了科学史的长河中,为他的整个理论提供了历史背景和存在的必要性。这是一种非常经典的写作手法,通过回顾历史,来凸显自己工作的创新之处。
作者首先提到了一个古老而朴素的观察:"黏糊糊的东西"。自古以来,人们就直观地感觉到,构成生命体的物质和泥土、石块这些无机物是截然不同的。这种特殊的"生命物质",在19世纪被命名为"原生质"(Protoplasm)。当时的人们认为,生命的一切奥秘,都藏在这种神秘的㬵状物质里。这其实是早期"活力论"思想的体现,认为生命体内有一种非物质的"生命力"在起作用。
随着科学的发展,特别是显微镜技术的进步,科学家们的视野深入到了细胞内部。他们发现,"原生质"远非一团均匀的黏糊物质,而是包含了细胞核、线粒体、叶绿体等各种复杂精巧的结构,也就是我们熟知的"细胞器"。这一发现,标志着人类对生命的理解从"一团神秘物质"进入到了"一个精密工厂"的阶段。
然而,到了20世纪,尤其是在DNA双螺旋结构被发现之后,生物学的主流范式变成了"生物化学"。这种观点认为,生命现象本质上就是一系列极其复杂的化学反应。我们把生命还原为分子,研究DNA如何转录成RNA,RNA如何翻译成蛋白质,各种酶如何催化反应……这个观点取得了巨大的成功,构成了我们现代生物学的基础。它告诉我们生命"由什么构成"(What),以及"如何运作"(How)。
但是,作者在这里 subtly 地指出了这种纯生物化学观点的局限性。它将生命看作是无数分子"随机移动并发生化学反应"的集合。这种视角虽然精确,但在某种程度上却失去了对生命作为一个整体的把握。它很难回答一些更宏大的"为什么"(Why)的问题。比如,为什么这些化学反应能如此稳定、如此有目的地组织起来,形成一个能够思考、能够奔跑、能够繁衍的复杂有机体?为什么演化会塑造出我们今天看到的这些特定结构和行为模式?
通过这短短的历史回顾,作者实际上是在告诉我们:从"原生质"到"细胞器",再到"生物化学",我们对生命的理解在不断深入。但现在,也许是时候引入一个新的、更高层面的视角了——那就是他前面所阐述的,基于"计算"、"目的"和"演化"的视角。这个新视角并不否定生物化学的成就,而是试图在其之上,建立一个能够解释生命"整体编排"和"宏观规律"的理论框架。这正是这篇文章的价值所在。
致谢
【原文】
致谢
感谢 Wolfram 研究所的 Willem Nielsen 给予的大量帮助,以及 Wolfram 研究所的附属成员 Júlia Campolim 和 Jesse Angeles Lopez 提供的额外帮助。这里的想法最终是相当快地形成的,但在近期和遥远的过去,与许多人的讨论提供了有用的想法和背景——包括 Richard Assar, Charles Bennett, Greg Chaitin, Paul Davies, Walter Fontana, Nigel Goldenfeld, Greg Huber, Stuart Kauffman, Chris Langton, Pedro Márquez-Zacarías 和 Elizabeth Wolfram。
【解读】
同学们,文章的最后是致谢部分。虽然这部分没有深奥的理论,但它在学术写作中是必不可少的,也体现了科学研究的一个重要精神——合作与传承。
我们可以看到,作者首先感谢了他团队内部的几位核心成员,他们可能在具体的计算实验、数据分析和文稿整理上提供了直接和大量的帮助。这告诉我们,即便是像沃尔夫勒姆这样顶级的思想家,他的研究也离不开一个高效团队的支持。
随后,他列出了一长串的名字。这些人来自不同的领域,有物理学家、计算机科学家、生物学家等等。作者提到,虽然文章里的想法是近期快速形成的,但它们的"种子"实际上来源于过去几十年里与这些杰出学者的无数次讨论。这说明了科学思想的诞生,往往不是一个人闭门造车的灵光一现,而是在一个开放、交流的学术共同体中,经过长期的思想碰撞、相互启发和知识积累,最终才得以孕育成熟。
所以,当你们以后进行学习和研究时,一定要记住,多与同学、老师交流,多听取不同的观点,这是激发创新思维、走向成功的非常重要的一步。科学的殿堂,正是由这样一代代人合作搭建起来的。
好了,今天的解读就到这里。希望这次的深度剖析,能帮助大家理解这篇文章背后那激动人心的思想,也希望能激发你们对科学本源问题的好奇心和探索欲。