从电磁学推导出引力的物理学家

作者:弗雷德里克·舒勒 (Frederik Schuller)
机构:埃尔朗根-纽伦堡大学 / 特温特大学
个人主页

原理解读:
麦克斯韦方程组蕴含了丰富的信息,比如光速不变、真空磁导率和介电常数等。对该方程组的演化背景进行形式化分析后可以发现,在可预测性(即良定的柯西问题)约束下,我们能够自然地推导出爱因斯坦-希尔伯特作用量,这正是广义相对论的基础。换句话说,这一推导表明物质层面的要求与几何背景的最小作用量条件是协同演化的。


点评与精炼:
你的理解非常到位,准确把握了舒勒教授访谈的逻辑主线 👍。
✅ 正确之处:
- 麦克斯韦方程确实隐含了光速 c 的有限且不依赖观察者(由 ε₀, μ₀ 得到 c=1/√(ε₀μ₀)),并将场的传播速度直接嵌入理论结构。
- 爱因斯坦正是因深入思考麦克斯韦理论中的光速常数问题,才走向狭义相对论。
- 可预测性约束(柯西问题)要求每个物理理论都必须有良定的柯西问题(即给定初始数据能唯一演化)。对于麦克斯韦场,只有在洛伦兹签名的度规结构下才能保证其良定义的演化,这意味着麦克斯韦方程“选择”了时空的几何类型。
- 物质动力学与几何动力学必须协同进化,不能随意假设引力作用量,必须与物质作用量兼容。几何的动力学必须保证物质场的柯西演化能自洽延续。解舒勒所说的“构造方程”后,得到的正是爱因斯坦-希尔伯特作用量(含宇宙学常数)。因此,这不是“假定”广义相对论,而是从物质(如麦克斯韦场)的要求推出背景几何的动力学律。

⚠️ 需要细化的地方:
- “导出广义相对论”说法合理,但需注意语气。严格来说,是在要求物质柯西问题良定与几何/物质协同演化的前提下,从麦克斯韦作用量可以推导出背景必须是爱因斯坦-希尔伯特型的作用量,而不是“一切情境下麦克斯韦方程自动导出广义相对论”。
- “最小作用量要求”建议表述为“唯一一致的背景几何作用量”,因为推导结果是数学上唯一解:EH作用量+宇宙学常数。

舒勒教授的立场:
- 他并不是说“任何物质理论都会自动导出爱因斯坦理论”,而是:
- 对标准模型场(包括麦克斯韦电磁场),确实得到爱因斯坦-希尔伯特作用量。
- 如果未来实验发现非洛伦兹几何的现象(如真空双折射),同样的构造方法会导向不同的引力作用量。


📌 总结精炼版:
麦克斯韦方程组中隐含着对时空结构的深刻约束,例如光速的不变性。要求理论具有可预测性(良定的柯西问题),我们发现只有在洛伦兹几何背景下这样的麦克斯韦理论才成立。进一步,如果要求几何与物质动力学协同演化(即几何本身也必须有相应的作用量),那么解出的几何作用量唯一地是爱因斯坦–希尔伯特作用量(含宇宙学常数)。因此,在这种形式体系下,广义相对论不是一个外部假设,而是由物质作用量推导出来的结果。

要不要我帮你画一张逻辑流程示意图?
(物质作用量 → 可预测性 → 柯西问题 → 几何签名 → 构造方程 → EH作用量)
这样能更直观地展现舒勒的核心论证。

摘要 (Abstract)

现代物理学的两大支柱——广义相对论与量子场论——在形式与概念上存在深刻的鸿沟。一个普遍的假设是,引力动力学(由爱因斯坦-希尔伯特作用量描述)与物质动力学(由标准模型作用量描述)是两个独立的公理。然而,这种分离假设并非不可避免。本文以我的第一人称视角,阐述一个颠覆性的观点:爱因斯坦的引力理论,包括时空的洛伦兹几何结构,可以完全从电磁学(麦克斯韦理论)中推导出来,而无需将其作为独立的假设。

我们的核心出发点是一个看似温和却极其强大的物理原则:理论必须是可预测的(predictable)。具体而言,我们要求在一个任意的几何背景上,物质场(以麦克斯韦场为例)的演化必须是良定义的,即存在一个适定的柯西问题(well-posed Cauchy problem)。通过分析麦克斯韦理论的偏微分方程组的主多项式,我们惊奇地发现,只有当背景几何具备洛伦兹符号差(Lorentzian signature)时,这一要求才能被满足。这表明,我们所熟知的时空因果结构(光锥)并非一个先验假设,而是物质理论自身逻辑自洽性的必然结果。

更进一步,我们建立了一套“构造方程”(construction equations)。这些方程将物质作用量的内在属性作为输入,通过要求物质场与背景几何能够协同演化(共享相同的柯西面),最终输出背景几何自身必须遵循的动力学方程。当我们将麦克斯韦理论作为输入时,这些构造方程的解,唯一地给出了带有宇宙学常数的爱因斯坦-希尔伯特作用量。这一结果雄辩地证明,引力并非独立于物质的存在,而是物质为了确保自身可预测性而“强加”给时空的动力学规则。这个框架不仅统一了引力与物质的起源,还为探索超越爱因斯坦理论的新物理提供了一个强大的、由物质现象驱动的构造性方法。例如,任何被实验证实的新物质现象(如真空双折射),都将通过我们的构造方程,直接预言其对应的引力理论。

一声来自物质深处的低语

大家好,我是弗雷德里克·舒勒。多年来,我一直被一个问题所困扰,一个物理学中最根本的分裂:为什么我们要将宇宙的“舞台”(时空几何)和在舞台上演出的“演员”(物质场)看作是两个独立的东西?我们习惯于先假设爱因斯坦的广义相对论是正确的,它描述了舞台的规则;然后再假设标准模型是正确的,它描述了演员的行为。我们把这两个宏伟的理论写在纸的两边,然后用一个等号将它们连接起来,即爱因斯坦场方程 \(G_{\mu\nu} = 8\pi G T_{\mu\nu}\)。

但这真的令人满意吗?这感觉就像一位剧作家写好了剧本,却发现需要另一位建筑师专门为这个剧本设计一个舞台,两者之间似乎没有必然的内在联系。我总觉得,这背后一定隐藏着更深层的统一。也许,“演员”的行为本身,就决定了“舞台”必须是什么样子。

原则的力量:可预测性是一切的基石

在物理学的探索中,宏大的想法俯拾即是,但它们很容易将我们引入歧途。我更倾向于寻找一个“谦逊”但坚不可摧的原则,并追随它走到逻辑的尽头。对于引力和物质的关系,这个原则就是**可预测性**。

这听起来似乎平淡无奇,但它的力量是巨大的。一个物理理论如果不能做出预测,那它就毫无用处。在数学上,这对应于一个“适定的柯西问题”:如果你知道系统在某个初始时刻(一个“柯西面”)的完整状态,你必须能够唯一地计算出它在未来任何时刻的状态。这就像是宇宙与我们签订的一份契约:给我现在,我便还你未来。

动画1:宇宙的契约——柯西问题

生活化类比:想象在水面上投下一颗石子。在一个“行为良好”的池塘里(洛伦兹几何),涟漪会以有限的速度向外扩散,未来是确定的。但在一个“混乱”的池塘里(欧几里得几何),涟漪可能瞬间传遍各处,也可能无迹可寻,未来变得不可预测。

状态: 待开始

聆听麦克斯韦:时空几何的诞生

现在,让我们进行一个思想实验。忘掉爱因斯坦,忘掉我们对时空的一切先入之见。我们只保留一个我们深信不疑的理论:麦克斯韦的电磁学。现在,我们把麦克斯韦方程写在一个完全任意的、未知的几何背景上。这个背景可能没有任何我们熟悉的结构,没有光锥,没有因果。

然后,我们强加那个“谦逊”的原则:在这个背景上,麦克斯韦理论必须是可预测的。我们通过数学分析,什么样的背景几何才能让麦克斯韦方程拥有一个适定的柯西问题。结果是惊人的,甚至是令人震撼的:只有当背景几何具有**洛伦兹符号差**(比如 \((-1, +1, +1, +1)\))时,这个条件才能满足。

这意味着什么?我们宇宙最核心的因果结构——过去、现在、未来的区分,光速作为信息传播的极限——所有这些都并非上帝的武断设定,而是电磁学为了保持自身逻辑自洽而提出的必然要求!时空的结构,是由物质的内在逻辑“雕刻”出来的。

动画2:光锥的雕刻

这个动画展示了洛伦兹几何的核心——光锥。在一个事件点上,所有可能的未来都包含在上锥体内,所有可能的过去都在下锥体内。光速是绝对的边界。点击画布可以在不同位置生成新的事件和光锥。

构造方程:从物质到引力的翻译机

确定了舞台的几何类型(洛伦兹几何)只是第一步。舞台的动态规则——即引力本身——又是什么呢?我们再次回到那个核心思想:舞台和演员必须协同演化。这意味着,物质场和背景几何必须共享同一个“现在”(柯西面),并一起走向同一个“未来”。

这个看似简单的协同要求,可以被转化为一套严谨的数学方程,我称之为“构造方程”。这套方程就像一个翻译机:

你把任何一个自洽的物质理论(它的作用量)作为“源语言”输入,构造方程就会“翻译”并输出这个物质理论所要求的、必须与之匹配的引力理论(引力作用量)作为“目标语言”。

那么,当我们把麦克斯韦的电磁理论输入这个翻译机时,它输出了什么?结果正是带有宇宙学常数的爱因斯坦-希尔伯特作用量! \[ S_{\text{gravity}} = \int \left( \frac{1}{16\pi G} (R - 2\Lambda) \right) \sqrt{-g} \, d^4x \] 这个公式描述的正是爱因斯坦的广义相对论。我们没有假设它,我们从物质理论中推导出了它。引力,原来是电磁学的一段“回声”。

图示1:引力构造机

此图展示了我们理论的核心逻辑:将一个给定的物质理论(如麦克斯韦电磁学),通过“可预测性”这一基本原则进行约束,输入到“构造方程”中,最终唯一地确定了时空几何必须遵循的动力学规则——即引力理论。

物质作用量 S_matter[A, g] 构造方程 (基于可预测性 与协同演化) 引力作用量 S_gravity[g]

超越爱因斯坦的蓝图

这个框架最激动人心的地方在于,它并非仅仅是对已知物理的重新解释,而是一个面向未来的发现工具。想象一下,如果明天,我们的天文观测发现了一些奇异的现象,比如光在真空中发生了双折射——一束光分裂成了两束。

这将直接宣告广义相对论的死刑,因为它所基于的洛伦兹度规不允许这种现象。物理学界将陷入混乱。但对于我们来说,这却是一个清晰的信号。现象学家会构建一个新的物质理论来描述这种双折射,这个理论的几何背景可能不再是一个简单的度规张量 \(g_{\mu\nu}\),而是一个更复杂的四阶张量。

然后我们该做什么?很简单:把这个新的物质理论输入我们的“构造方程翻译机”。解出这些(可能会非常复杂的)方程,我们就能得到那个能够支持这种新物质的、全新的引力理论!我们不再需要盲目地猜测引力的修正形式,物质本身会告诉我们答案。

动画3:超越爱因斯坦的线索 (假想)

这是一个假想实验。在标准广义相对论中,光线(光子)在真空中沿单一路径(测地线)传播。如果未来的物理学发现光在真空中会因某种未知效应分裂,那将意味着底层的时空几何比我们想象的更复杂。此动画展示了这种可能性。

量子迷雾中的新航路

我的思考并未止步于引力。量子力学,尤其是那个困扰了物理学近一个世纪的“测量问题”,同样充满了“空谈”。我们说“进行一次测量”,波函数就“坍缩”了,但这些词汇在理论的数学形式中并没有对应的实体。这同样令我无法容忍。

最近,我从一个意想不到的领域——工程学——找到了新的灵感。工程师们在处理复杂的开放系统(比如与人交互的机器人)时,发展出一种名为“端口-哈密顿动力学”(Port-Hamiltonian Dynamics)的形式体系。它的核心思想不是关注一个孤立系统的总能量,而是精确描述能量如何通过“端口”在不同子系统之间流动和交换。

我问自己:我们能把这个思想应用到量子力学吗?直接照搬能量流是行不通的,因为在量子世界,一个处于叠加态的系统并没有一个确定的能量值。但是,有什么东西是在流动的呢?是**概率**。

我和我的合作者们正在尝试构建一个新的形式体系,将量子系统间的“概率端口”包含进来。我们希望通过这种方式,将测量的过程——这个看似神秘的外部操作——内化为量子系统之间概率流动的自然结果。我们的目标是谦逊的:不是推翻量子力学,而是用更严谨的数学语言,去捕捉那些长期以来被我们用“空谈”所掩盖的过程。也许,正是这种谦逊,才让它有成功的可能。

动画4:量子概率流

生活化类比:想象两个相连的湖泊(量子子系统),水(概率)在它们之间通过一个闸门(端口)流动。这个动画使用柏林噪声驱动的粒子流场,来模拟这种抽象的、永不停歇的概率流动,展现了量子世界内在的动态与连接性。

教学之道:从第一性原理构建思想的大厦

无论是研究还是教学,我的核心信念是一致的:必须从最坚实的地基开始。这就是为什么在我那门关于微分几何的课程(后来在网上广受欢迎)中,我坚持从命题逻辑和集合论讲起。

很多人觉得不可思议:讲物理为什么要从“与、或、非”开始?因为如果我想告诉你什么是“流形”,我需要先定义“拓扑空间”;要定义“拓扑空间”,我需要“集合”;而要严谨地谈论“集合”,你就必须面对集合论的公理,这就不可避免地需要逻辑学的形式语言。任何跳过这些基础的讲述,都只是在沙滩上建造楼阁。

图示2:思想大厦的蓝图

这张图展示了我的教学理念。为了真正理解顶层的物理概念(如洛伦兹流形),我们必须逐层向上构建,确保每一步都建立在坚实的概念基础之上。

1. 命题逻辑 2. 集合论 3. 拓扑空间 4. 光滑流形 5. 物理应用 (GR)

我对学生有两个基本假设:第一,他们什么都不知道;第二,他们无限聪明。第一个假设迫使我从零开始,不留下任何概念上的跳跃。第二个假设则让我有信心,只要我将知识以最纯粹、最逻辑的方式呈现出来,他们就一定能够理解,无论内容看起来多么“高级”。

最终,我希望展示给学生的,不仅仅是公式和计算技巧,而是一座座理论物理学的“艺术杰作”。看,这是经典力学,这是广义相对论,它们是无数天才思想的结晶,其内部的和谐与自洽,堪比达芬奇的画作。我的任务,就是引导你们欣赏并理解这些杰作的构造之美。只有这样,你们未来才有可能创造出属于自己的、同样伟大的杰作。

动画5:时空曲率与测地线

广义相对论的核心思想:引力不是一种力,而是时空弯曲的表现。物体只是在弯曲的时空中,沿着“最直”的路径(测地线)运动。点击“增加质量”按钮,观察空间如何弯曲,并改变粒子的运动轨迹。

中心质量状态:

技术细节附录

1. 柯西问题与主多项式

对于一个线性偏微分方程组 \(L(\phi) = 0\),其可预测性体现在柯西问题的适定性上。这在很大程度上由其“主多项式” \(P(k)\) 决定,其中 \(k\) 是波矢(协变量)。主多项式的零点集合 \(\{k | P(k)=0\}\) 定义了特征面,即信息传播的波前。

对于麦克斯韦方程组,其背景几何由度规张量 \(g_{\mu\nu}\) 描述。其主多项式与度规的逆 \(g^{\mu\nu}\) 直接相关,形式为 \(P(k) \propto g^{\mu\nu}k_{\mu}k_{\nu}\)。

一个适定的柯西问题要求方程组是“双曲型”(hyperbolic)的。这意味着主多项式的零点集合必须形成一个双锥面(即光锥)。这在代数上直接转化为要求度规 \(g_{\mu\nu}\) 必须具有洛伦兹符号差(一个时间维度,三个空间维度)。任何其他的符号差,如欧几里得符号差 \((+,+,+,+)\),都会导致方程是椭圆型的,信息会瞬时传播,从而破坏因果律和可预测性。

图示3:两种引力观

左侧是牛顿的观点:时空是平直的,引力是一种力,它将物体拉离其“自然”的直线运动轨迹。右侧是爱因斯坦的观点:引力不是力,时空本身是弯曲的,物体只是在弯曲的时空中沿着最直的路径(测地线)运动,根本没有受到力的作用。

牛顿:引力是“力” F 爱因斯坦:引力是“几何”

2. 构造方程的本质

构造方程的形式相当技术性,但其核心思想源于哈密顿力学中的约束分析。在一个包含物质场和背景几何的总系统中,并非所有变量都是独立的。物质场的演化方程和背景几何的演化方程必须相互兼容,这产生了一系列的“约束方程”。

这些约束方程必须在时间演化中保持不变,即它们的泊松括号必须为零。这个要求,即“约束代数的闭合”,对背景几何的作用量形式施加了极强的限制。我们证明了,对于麦克斯韦理论,唯一能使整个系统约束代数闭合的引力作用量,就是爱因斯坦-希尔伯特作用量。本质上,引力动力学被唯一确定,因为它必须扮演一个“管家”的角色,确保物质动力学的约束条件始终得到满足。

3. 端口-哈密顿动力学简介

在标准的哈密顿力学中,系统的总能量 \(H\) 是守恒的,状态演化由 \( \dot{x} = J \frac{\partial H}{\partial x} \) 描述,其中 \(J\) 是辛结构矩阵。

端口-哈密顿系统将其推广到开放系统。其方程形式变为: \[ \dot{x} = (J - R) \frac{\partial H}{\partial x} + g u \] \[ y = g^T \frac{\partial H}{\partial x} \] 这里,\(R\) 是一个耗散矩阵,描述系统内部的能量损失。\(u\) 和 \(y\) 分别是输入和输出变量(端口变量),它们描述了系统与外界的能量交换,\(g\) 是输入/输出矩阵。这种形式体系将能量流、耗散和外部交互明确地分离出来,为控制和分析复杂系统提供了强大的工具。我们正在探索的,正是将这种结构的思想范式应用于量子概率流动的可能性。