熵的深层解读:一场两小时的对话

这是一场长达两小时的关于熵和第二定律的深度探讨。关于这个主题的多数讲座时长仅为10分钟,但今天韦恩·默沃德(Wayne Myrvold)教授将进行一场精彩绝伦的巡回演讲,从多个角度解释熵,消除误解,甚至揭示一个惊人的事实:第二定律可能与你的认知恰恰相反

探讨的问题包括:为什么熵不等同于无序?为什么大众科普甚至本科教材中关于熵和热力学的描述总是有误?宇宙是否受第二定律的约束?你能否打破这些所谓的熵极限?以及为什么量子力学改变了一切?关于熵的困惑和谜题比比皆是。

“你会从完全有能力的物理学家那里得到两种答案,而且每一方的物理学家都会绝对确信那才是正确答案。”

“尽管很多物理学家会说第二定律指的是总熵永不减少,但这实际上不可能是第二定律。这不可能是第二定律的推论。”

一、熵是什么?一个引发争议的问题

今天我想谈谈熵究竟是什么。有一个问题得到的答案是相互矛盾的:想象一下你面前有一个物理系统——我相信这个例子来自雪莱·戈尔茨坦(Shelley Goldstein)。比如说,一杯水,它的物理状态显然你并不完全清楚。但这时,有某个东西出现在你面前。它可以是一个智者、一个天使,或者随便什么。它给了你一个比之前好得多的关于这杯水的近似描述。那么问题是,这个系统,也就是这杯水的熵,减少了吗?

宽泛地说,可以给出两种答案。一种是:“是的,显然如此,因为熵与系统的信息有关。所以如果你获得了信息,熵就改变了。”另一种是:“这太荒谬了。熵是系统客观存在的东西。为什么你对系统信息的了解会改变它的熵呢?”

请讲。

是的。没错,绝对是这样。你会从完全有能力的物理学家那里得到两种答案,而且他们都会绝对确信那就是正确答案。所以,我认为开始思考这个问题的最佳方式是,你提出的问题是“熵是什么?”而我认为这是一个有点误导性的问题,因为“熵”这个词在不同语境下有不同的用法,我们对此已经习以为常。这并不罕见。就像你随便翻开字典的任何一页,随机指向任何一个词,很可能会有两、三个甚至四个不同的定义。

熵:一个多义的科学术语

在科学领域,人们常常会创造一个新的技术术语,因为他们希望某个东西能有一个精确、公认的含义。这实际上就是克劳修斯(Clausius)在1865年所做的事情。他想,好的,这是一个我和其他人在热力学中一直在讨论的重要物理量。它足够重要,需要一个庄重的名字。他的理由是:“看,大家都在学习古典语言,对吧?我们都懂希腊语和拉丁语,所以我们不想要一个来自英语、德语或意大利语的词,因为那样会变成某种民族主义的词汇。所以让我们从一个希腊词汇中创造一个新词吧。”于是他从一个表示“转变”的希腊词汇中创造了“entropy”(熵)这个词,并且他有意让它听起来有点像“energy”(能量),因为它们是密切相关的概念。

如果我能说了算,我们会尊重克劳修斯,并且只在克劳修斯定义的那个意义上使用“熵”这个词,那将是所有人对熵的理解。但历史上,情况并非如此。人们用“熵”来称呼许多不同的物理量,它们都互相关联,并且在某种意义上都与热力学熵有关,但它们就是不同的东西。如果有人问你,“熵减少了吗?”我认为一个实际的问题是,“嗯,是哪一种熵?”

换句话说,应该有熵一、熵二、熵三。当有人说,“那么,这个系统的熵是多少?”你应该回答,“好的,你指的是第二种、第三种,还是第一种?”

是的,正是这样。正是这样。或者,如果我能说了算,人们会为这些不同的东西创造不同的词语。

客观属性还是主观信息?

有些人之所以会说,“熵当然必须是系统的内在属性”,是有原因的,因为这毕竟是物理学。我们不是在做心理学研究。我们不是在研究人们的信息。我们研究的是物理系统的物理属性,无论任何人对它们了解多少或怎么想,它们都拥有这些属性。如果我问,“好的,这个杯子的质量是多少?”说“嗯,你对这个杯子了解多少?”似乎很荒谬。杯子的质量是杯子所拥有的东西。这里说的是静止质量,因为有时人们会谈论相对论质量,并认为它依赖于观察者。但是,好的,这个杯子的静止质量是多少?那么,是的,那是杯子的一个属性,无论任何人怎么想都无关紧要。如果你认为热力学是一门像那样的科学,它只是研究事物的物理属性,那么它的核心概念之一——熵——被定义为相对于信息状态的东西,就显得很荒谬了。

我认为,归根结底,人们之所以倾向于认为不同的熵概念显然是正确的,对这个问题的不同答案显然是正确的答案,其根本原因在于,尽管这一点在教科书传统中被完全模糊化了,但实际上关于热力学这门科学究竟是什么,存在着不同的观念

二、热力学与资源理论

好的,那么,在第二定律中,它陈述了熵不会减少。好的,是的,你的限定条件是封闭系统或孤立系统等等。然后,有一个熵的公式。你是说即使在这里也应该有熵一和熵二之分吗?

实际上,这些不同的熵概念的定义是不同的。实际上,如果你查看不同的教科书,当它们引入熵的概念时,有时会给出非常不同的定义。所以或许我应该谈谈克劳修斯当时在做什么,因为那是现有的定义之一。克劳修斯在1850年代、1860年代工作。那些是我们现在称之为热力学的早期。是开尔文(Kelvin)给这门科学命名的。我认为很多人实际上误解了“thermodynamics”(热力学)这个词的含义。因为如今在物理学中,当你谈论“dynamics”(动力学)时,你通常指的是演化定律,比如支配系统行为的动力学定律。而这实际上不是开尔文决定将这门新兴科学称为热力学时的意思。正如我所说,那是在学校里人人都学希腊语的时代,这个词由两个希腊词构成,分别是表示“热”和“力”的词。热力学的根源在于研究如何从热中获得有用的机械功。它最终源于卡诺(Carnot)对热机效率的研究。

作为资源理论的热力学

如果你认为热力学是关于这个的,那么如今的物理学家对这样的理论有一个专门的词。它是一种资源理论(resource theory)。这源于量子信息理论。事情是这样的,大约几十年前真正兴起的这个量子信息理论领域,包括了量子通信和密码学等内容。他们当时在问这样的问题:如果你有两个代理人,他们拥有某些资源,他们能用这些资源做什么?顺便说一下,这些代理人总是被称为爱丽丝(Alice)和鲍勃(Bob)。例如,如果爱丽丝和鲍勃想要发送一个安全的信号,使得窃听者在物理原理上无法窃听,他们能做到吗?如果他们拥有一定量的共享纠缠,他们能做到吗?

所以这是在利用物理学,意思是量子物理学告诉你物理系统在某些操作下会如何响应等等。但你问的问题其实并不完全属于物理学本身。这些问题是关于拥有特定操控系统手段和特定资源的代理人,为了实现某些目标能做什么。

为什么那不属于物理学本身?

因为当我说物理学本身时,我指的是物理学家通常认为的:物理学是关于物理系统的属性,句号。对吧?如果我在谈论……所以这些代理人的目标不属于物理学范畴;这些是你附加的东西。所以有一个问题是,事物会做什么?所以有一个问题是,在某些情况下事物会做什么? 但如果我给你设定了某些目标,比如……

代理人本身是物理系统的一部分吗?

代理人本身就是物理系统。没错。但物理学研究物理系统的某些方面。比如我是一个物理系统,对吧?你也是一个物理系统。你有思想和信念。

谢谢。这是别人对我说过的最动听的话了。

有些人可能会不同意,说你不仅仅是一个物理系统。你是一个物理系统加上一个非物质心灵的组合。但我实际上认为我们都是物理系统。而且,作为物理系统,我们有思想、欲望、希望和梦想等等。但如果一个科学家在研究我的思想,那个科学家是在做心理学,而不是物理学。好的。是的。所以你只是在研究事物的不同方面。如果我引入像“这是爱丽丝和鲍勃要玩的游戏,这是我们的计分方式”这样的东西,然后你给他们某些资源,物理学告诉你最高可能的分数是多少,但基本上,如果你谈论目标和计分之类的事情,你做的就不是通常在物理教科书里能找到的东西。这就是我的意思。

明白了。是的,很好。我认为这对热力学很重要。所以那些从事量子信息理论的人,他们说,好的,我们正在做的是一种资源理论。然后当人们开始研究量子热力学时,一些同样的方法被应用,很多人开始将其视为一种资源理论。所以如果我给你某些资源,你有一个特定的任务,比如举起一个重物之类的,也许你有一个某种系统和一个特定温度的热浴,你能从中获得多少功?也就是你能把重物举多高?如今很多从事量子热力学的人认为,好的,我们正在做的是一种资源理论,它类似于并在某些方面模仿了量子信息理论。

好的。这基本上也是热力学的创始人们思考热力学的方式,虽然那时不是量子的,但他们基本上就是这样想的。这是对“给定某些物理资源,如热浴等,我如何利用这些资源来做功,比如开动一辆车或举起……”的研究。

让我看看我是否能总结一下。所以,创造了“熵”这个词的克劳修斯,是从资源理论的角度来思考它的。那么,资源理论是,我能用这些资源做什么?在热力学的入门课程中,通常在第一或第二讲就会谈到活塞。所以给定这个系统,我能移动一个活塞吗?所以他们是在进行实践性思考。

从实践到理论:卡诺的研究

是的,在实践考量和理论考量之间有一种有趣的权衡,因为这些问题最初是由实践问题引发的,但它们后来有了自己的生命力。这在卡诺的工作中就已经能看到了。卡诺写了一本名为《关于热的动力的思考》的小册子。他实际上是在回应一些问题,这也是他父亲拉扎尔·卡诺(Lazare Carnot)做过一些研究的领域,当时正在进行的研究是,如果你有一台热机,通常是你在一个腔室里放某种气体,然后加热它,它就会推动一个活塞,对吧?如果你使用一种更易挥发的物质,效率会更高吗?所以,你用的是空气、蒸汽,还是比如说酒精或乙醚,这有关系吗?你能从同样多的热量中获得更多的功吗?

这实际上是一个实践问题,因为有些人当时在想,好的,是的,让我们用酒精或乙醚吧。你可以想象会发生什么,因为这些东西不仅在加热时比空气膨胀得快得多,它们还高度易燃。把这些东西放在火源周围是相当危险的。所以卡诺提出的问题之一是,嗯,工作物质是什么并不重要。活塞里的气体是什么并不重要。他论证说,实际上,最高效率,比如我有两个不同温度的热源,在它们之间运行的发动机的最高效率与你使用的气体物质无关。

所以这源于实践的考量,但卡诺考虑了我们现在所说的热力学可逆过程。热力学可逆过程,它涉及到你只在两个温度相同的东西之间交换热量。所以你实际上做的是非常、非常缓慢地膨胀气体。然后当你排出热量时,你也是非常、非常缓慢地压缩它。当然,实际的发动机离热力学可逆性还差得很远,因为我们实际关心的不仅是效率,还有功率,对吧?我们单位时间内能获得多少功,对吧?

当然。你知道,如果有人想卖给你一辆车,说,“好的,这辆车的燃油效率惊人,但你每小时只能开五公里,”对吧?我们是不会买的,字面意思上的不买,对吧?所以,尽管热力学源于对发动机效率的研究,但很多实际的理论工作,那些你能真正证明东西的事情,都涉及到对热力学可逆过程的考量。而在现实世界中,实际上并不存在热力学可逆过程。我注意到你不久前采访了约翰·诺顿(John Norton)。我相信他强调了这一点。但我们可以近似热力学可逆过程;它们只需要进行得非常、非常缓慢。而实际的机器,我们对那些工作得非常、非常缓慢的东西不感兴趣。所以你可以有一个可能由抽象考量驱动的资源理论,但你实际上可能在考虑一些与现实情况相去甚远的情境。

三、第二定律与熵的定义

谈谈第二定律是如何假定了一个特定的熵的定义的。也许它甚至不应该被称为第二定律。

好的。我很高兴你问我这个问题,因为我认为恰恰相反。当你问人们,“热力学第二定律是什么?”你去街上问人,他们会说,对吧?很多人会说像你刚才说的那样,一个孤立的封闭系统的熵总是增加。

有趣的是,如果你指的是克劳修斯定义的热力学熵,那实际上是不对的,原因很重要。尽管克劳修斯本人在他的一篇论文结尾说,“我们可以将第一和第二定律表述为,”或者他说,“如果我们被允许谈论宇宙的总能量和总熵,我们可以将第一和第二定律表述为:宇宙的总能量是恒定的,宇宙的总熵趋向于一个最大值。”这实际上不是他对第二定律的官方陈述,而且有一个非常好的理由。因为你说热力学第二定律预设了某个熵的概念,而实际上是反过来的。克劳修斯对熵的定义预设了第二定律

好的,怎么说?

定义熵,先有第二定律

好的,表述第二定律的一种方式是,假设我有一个某种系统,最容易想象的是一个带活塞的气体,它进行一个循环,意思是它回到了开始时的同一个热力学状态。人们之所以考虑这些循环,是因为他们在思考热机。热机通常做的是,你有一些工作物质气体,你加热它,它把活塞推出去,然后你要么排出物质,要么冷却它并压缩,把活塞推进去,然后你就可以重新开始了。所以发动机本身是在一个循环中工作的。假设我有一个盒子里的气体,我可以改变它的温度,我可以吸入或排出热量,我可以来回移动活塞,等等。

(广告时间)

等一下。别走开。嘿,我看到你正悄悄溜走。别像经济一样。相反,读一读《经济学人》。我原以为《经济学人》只是CEO们为了跟上世界趋势而读的东西。这没错,但这并非全部。我个人发现更有用的是他们对数学、物理、哲学和人工智能的报道,特别是某个事物在其他国家是如何被看待的,以及它可能如何影响市场。例如,《经济学人》在DeepSeek推出的那一周就采访了其背后的一些人。没有其他人有这个。另一个例子是《经济学人》有一篇关于最近暗能量数据的精彩文章,在我看来甚至超过了《科学美国人》的报道。他们还有一个万物图表。就像是这个频道的图表版本。浏览它并从中学习是一种乐趣。当然,所有这些的链接都会在描述中。

现在,《经济学人》对严谨新闻的承诺意味着你能清晰地了解世界上最重要的发展。我个人对更科学的内容更感兴趣,比如这篇关于通过线粒体移植延长生命的报道,这实际上开创了一个新的医学领域,会让迈克尔·莱文(Michael Levin)感到骄傲。《经济学人》还涵盖文化、金融与经济、商业、国际事务、英国、欧洲、中东、非洲、中国、亚洲、美洲,当然还有美国。无论是科学创新的最新进展,还是全球政治格局的变迁,《经济学人》都提供全面的报道,并且远不止于头条新闻。

看,如果你热衷于扩展你的知识,并对塑造我们世界的力量获得新的、更深的理解,那么我强烈推荐订阅《经济学人》。我订阅了他们,这是对我、对你智力成长的一项投资。你不会后悔的。作为这个播客的听众,你将获得特别的八折优惠。现在你可以用更少的钱享受《经济学人》及其提供的一切。前往他们的网站www.economist.com/TOE开始吧。感谢收听,现在让我们回到对宇宙奥秘的探索中。再次提醒,网址是economist.com/TOE。

等效值与熵的定义

我将用一种稍微不同的方式来说明这一点,因为我将在不使用“熵”这个词的情况下引入熵的概念,看看你是否能注意到它是在哪里出现的。好的。

想象一下,比如说,你有一个容器里的气体,有一个可以移动的活塞,你可以把它放在热源旁边,也许可以膨胀它,用它来移动一个重物。假设我开始时它处于某个温度、压力和体积,活塞在某个位置,我以热力学可逆的方式缓慢地膨胀它,同时我正在举起一个重物,它连接着一个热源,所以热量正在进入它。好的。然后我把它交给你,科特(Curt),说:“我希望你把它恢复到原始状态。”好的。

现在,克劳修斯是这样想的。作为热力学第二定律的一个推论,你可以做到这一点而完全不需要从系统中排出任何热量。对。现在,如果原始过程是热力学可逆的,我能做的一件事就是把那个原始过程反过来做,把气体压缩回原来的体积,将完全相同数量的热量排入我从同一温度的同一热库中获取热量的那个热库。对。如果你只有一个特定温度的热源或热沉,这可能就是你能做的最好的了。但我们真正想做的是,不要把重物降低得像我们举起它时那么多。

于是克劳修斯说,“嘿,看,如果你有另一个温度更低的热浴,你可以做的是在更低的温度下排出一个更少的热量,然后让它回到原始状态。”所以他引入了这个概念——他引入了热的等效值(equivalence value)这个概念。在一个可逆过程中,一个系统和一个热浴之间传递的热量,在某种意义上,如果温度更低,它对于你想做的事情来说就“更值钱”,反之亦然。因为如果我想恢复初始状态,我可以选择在高温下使用大量的热,或者在低温下使用较少的热。好的。这就是他所说的热的等效值。它不仅是热量的函数,还是热量被传递时的温度的函数。

事实上,正如开尔文意识到的,我可以定义一个温标,我们称之为开尔文温标或绝对温标,使得在给定温度下一定量热的等效值与温度成反比。就这样定义温标就行了。

所以第二定律的一个陈述是,如果我让某个东西进行一个循环,期间在不同温度下有热量交换,把所有这些热量的等效值加起来,它不能大于零。它小于或等于零。如果这是一个可逆循环,那么它等于零。所有这些等效值的总和等于零。是的。好的。

好的。现在我可以定义熵了。因为那是它的一个推论。如果我有两个不同的热力学状态,我通过一个可逆过程从一个状态变到另一个状态,这些过程的总等效值将与具体是哪个可逆过程无关。假设有不止一个可逆过程能把我从状态A带到状态B。如果我通过一个可逆过程,把所有热的等效值加起来,它将和另一个过程相同。论证是,如果这些是可逆过程……让我看看。

所以如果我理解正确的话,你需要第二定律来使热力学熵成为一个良定义(well-defined)的量

完全正确,是的。是的,完全正确。所以,热力学熵的定义是,如果我想知道两个状态之间的熵差,那就构建任何一个连接这两个状态的可逆过程,然后把那个过程中传递的热的等效值加起来。无论我使用哪个可逆过程,结果都一样,这是第二定律的一个推论。

所以当有人说,“我打破了第二定律,”这个陈述甚至能成立吗?或者你是说,你必须假设它成立才能定义熵?那么你将如何打破第二定律呢?

是的,所以如果你试图将第二定律表述为总熵,过程,一个孤立系统的熵永不减少。这实际上是不正确的。因为如果你能打破第二定律,那么你就不会有一个良定义的热力学熵

有意思。

这一点我认为很多人都忽略了。这实际上是一个推论。我所说的关于热力学熵的定义并非什么激进的观点。这就像是标准教科书里的内容。教科书里通常的做法是给出一个第二定律的陈述。比如克劳修斯的版本是,不存在这样一个过程,其净效应仅仅是将热量从冷体转移到热体。那是第二定律的一个版本,我在表述时没有提及熵。然后说,给定第二定律,我们可以用标准定义来定义热力学熵,也就是取任何一个可逆过程,连接两个状态,把沿途的热的等效值(即 $dQ/T$)加起来,结果总是一样的。

所以,尽管很多人会说第二定律是一堆孤立系统的总熵永不减少,但如果你指的是热力学熵,那实际上不可能是第二定律。它可以是第二定律的一个推论。但如果你真的打破了第二定律,比如我能有一个过程,其唯一效果就是把热量从冷体转移到热体,那么热力学熵就根本不是良定义的了。

四、历史视角:从流体到分子运动

韦恩,让我问你一件事。你对历史非常了解。所以从历史上看,人们是如何思考熵的?我的意思是,我们可以和热做一个类比。我们现在认为热与分子的运动有关。好的,它是关于分子运动的某种东西。温度也是关于分子运动的某种东西。但在100年前,200年前,它被认为是一种流体。好的,那么人们过去是如何看待熵的?他们把它看作是像温度一样的量吗?它是一种抽象的东西。他们是把它想象成一种流体吗?还是别的什么?他们对熵的心理模型是什么?

这是一个非常好的问题。因为事实上,卡诺写这本书的时候,他认为热是一种叫做“热质”(caloric)的流体,它是守恒的,并且在物体之间流动。甚至开尔文在他写第一批关于我们现在称为开尔文温标的论文时,也是这么想的。

热的本质:从热质说到动能理论

但不久之后发生的事情是,这发生在卡诺的有生之年,焦耳(Joule)做了他关于所谓的“热功当量”的实验。基本思想是,如果我做一定量的功,我能产生一定量的热,你可以用比如英尺-磅来测量功,用量热器来测量热。这能让一个给定的水样变暖多少?焦耳认定存在一个热功当量,即以能量单位(如英尺-磅)测量的功和以卡路里测量的热之间存在等价关系,并且它们可以相互转换。而且,只要你做足够多的功,你能产生的热量是没有上限的。这之前的一个先驱是伦福德伯爵(Count Rumford)用钻炮膛做的实验。就像你在钻……

哦,好的。我不知道那是什么。什么是炮膛?

好的,你怎么造一门大炮?我不知道现在人们怎么造大炮,但当时人们造大炮的方式是,你先做一个铁或钢的圆筒,然后在里面钻孔。所以炮膛就是炮弹经过的路径。不出所料,当你在钻一块金属时,它会变热,对吧?所以这个过程涉及,我想是马匹驱动着钻头。所有东西都变热了,所以你得用水来冷却它。伦福德伯爵做了实验,他确信只要你有足够的马力,你能产生的热量是没有上限的。这与“热质”——热是这种你从物质中挤压出来的流体——的观点不太相符。因为如果任何给定物质中的热量是有限的,你会认为最终你会用完,无法通过摩擦再产生更多的热。

就像你不能无限地出汗一样。

是的,完全正确。你不能无限地出汗。完美。这是一个绝佳的类比。是的。最终你会脱水,对吧?所以,是的。于是,人们,主要由于焦耳关于热功当量的实验,实际上开始相信热是能量的一种形式,类似于物体运动的机械能。这就是后来被称为热的动能理论(kinetic theory of heat)。伴随而来的是这样一幅图景:气体,例如,充满了到处乱撞的分子。当它们更热时,它们运动得更快。

有趣的是,尽管卡诺在开创我们现在称为热力学理论时,以及开尔文在他最早的关于这个主题的论文中,都认为热是这种守恒的流体,但很快,那些从事热力学研究的人就转向了热的动能理论。因此,许多同时在发展我们现在称为热力学和热的动能理论的人是同一批人。或者说,克劳修斯称之为热的机械理论(mechanical theory of heat)。所以克劳修斯认为热与分子的碰撞有关。这就引出了一个问题:熵实际上可能是如何通过分子的运动状态来实现的。克劳修斯对此有一些想法,但大多被遗忘了,因为没有一个是非常令人满意的。

宏观的热力学与微观的统计力学

但有趣的是,我可以独立于分子假说来发展热力学这门科学。比如,我可以谈论在宏观层面上做的功,我可以谈论热量的交换,而无需真正承诺在微观物理层面上发生了什么。所以麦克斯韦(Maxwell),他也是这些人之一,同时参与了我们现在称为热力学和我们现在称为统计力学的发展,当然,如今这两者经常出现在同一本教科书中,麦克斯韦说,“嗯,热力学是对物质的热学和动力学性质的研究,不带任何关于物质分子构成的假说。”所以根据麦克斯韦的说法,只要我是在做热力学,我应该对物质是否由分子构成持中立态度。我可以直接谈论热和功作为不同种类的能量交换,而无需承诺它在微观物理学中是如何实现的。

有些热力学教科书确实是这样做的。比如有些热力学教科书,或者有时候你有一门热力学课程,然后是一门统计力学课程。而热力学课程可以完全独立于关于分子的讨论。但在其他书中,这些书的标题通常是《热物理学》而不是《热力学》,两者是相辅相成的。我实际上认为,那种仍然存在于一些教科书中的老式思维方式有其可取之处,那就是,让我们把热力学看作是一门关于热和能量交换的科学,试着独立于任何关于物质分子结构的特定理论来表达热力学的基本原理。然后你可以说,好的,一旦我们承认物质有分子结构,它必须如何被修正?

嗯,好的。你为什么更喜欢那种方式?

嗯,因为它凸显了两种不同形式的热力学第二定律之间的差异。原因是这样的。热力学第二定律的一个推论是,如果我有一台在两个不同温度的热源之间工作的热机,存在一个最大效率。效率就是,如果我取出一份热量,我能将其转换成多少功?你想要的是尽可能多地获得功,然后尽可能少地将热量排回低温物体中。热力学第二定律的一个推论是,给定任意两个温度,在这些温度的热源和热沉之间工作的热机有一个最大效率。这就是所谓的卡诺效率。卡诺效率界限。好的。

现在,麦克斯韦,我认为,是第一个……所以陈述热力学第二定律的一种方式是,没有热机的效率会超过卡诺界限。好的。好的。正如麦克斯韦第一个清楚阐述的,如果热的分子动能理论是正确的,那实际上不可能是严格正确的。

为什么?

是的,这是个好问题。为什么,对吧?因为如果动能理论是正确的,那么你实际能得到多少功就会有某种不可预测性,因为这些分子或多或少是随机碰撞的,气体对活塞的压力是分子撞击活塞并反弹的结果。在足够精细的尺度上,单位面积的力会波动,因为分子或多或少是随机碰撞的。是的。而且可能会发生这样的情况,你恰好很幸运,在你膨胀活塞的时候,比平常更多的分子,或者平均能量比平常更高的分子,恰好撞击了活塞,于是你得到的功比你预期的要多。

对。如果你对一个物理学家说,“好的,这表明热力学第二定律不可能是严格正确的,”他们会说,“胡说。”因为你不能完全依赖那个,因为也可能发生我得到的功少于卡诺效率的情况。所以如今物理学家接受的是,好的,在足够精细的尺度上,你得到的功会有这些波动,但如果你一次又一次地做,平均来说,你无法可靠地超过卡诺界限。

它是一个统计定律

它是一个统计定律,是的。完美,是的。

这就是为什么我对你喜欢热力学那个观点感到如此困惑,因为我个人不喜欢热力学的观点。我非常喜欢统计物理学,但不喜欢热力学。所以即使是熵作为概率对数的加权和的定义,对我来说也有直观的意义。我可以用它推导出一些东西,我可以理解想象台球到处碰撞的画面。但是这个 $dQ/T$ 和卡诺引擎,也许是因为我不用手造东西,我想。也许这就是区别所在。但你也是一个思想家,所以我不知道。

我不用手造东西。我可能会超过卡诺效率。我可能会不小心做出危险的事情。是的,我不用手造东西,但我书架上确实有别人造的热机。

五、熵的不同面貌:热力学、统计、信息

这就是为什么我认为区分很重要。所以有克劳修斯定义的热力学熵。它完全独立于任何关于分子结构的假说,而且它的定义要求,预设了热力学第二定律的某种表述形式。所以如果热力学第二定律不正确,那么熵,就没有克劳修斯定义的熵这个量了,因为“无论你选择哪个可逆过程从A到B来定义熵,结果都一样”这个说法就不再成立了。

好的,这就是为什么我认为清楚地认识到,好的,那就是克劳修斯定义的热力学熵,是很重要的。因为它帮助我们认识到,当你现在转向统计力学时,最初构想的热力学第二定律实际上并不完全正确。它必须被,如你所说,一个统计定律所取代。如今物理学家接受的是统计版本,而不是热力学第二定律的原始版本。

然后你开始使用像“趋势”这样的词。

是的,没错。麦克斯韦自己也说过,而且我认为他是第一个这样表述的人,热力学第二定律是一个统计规律。这发生在人们……这是在19世纪中叶,或者实际上他是在1878年说的。但这是一个人们对统计规律印象深刻的时代,因为在19世纪初,人们才真正开始收集关于人口的统计数据,并注意到存在这些规律性,比如说,巴黎每年人均谋杀案的数量。这很有趣,因为这些是你可以年复一年依赖的统计规律,它们是大量个体不可预测事件的平均值,对吧?比如,如果人们能准确预测谋杀案发生的时间和地点,那它就不会发生了,对吧?

是的,所以这是麦克斯韦在说第二定律真的只是一个统计规律。它与……它类似于那些统计学家们在外面收集人口数据时所做的统计规律。他实际上曾向英国科学促进会做过一个关于分子的演讲,该协会当时刚刚成立了一个统计学部门,而硬科学家们有点看不起社会科学。他做了这个关于分子的演讲,说:“我们物理学家已经采用了统计学家的方法,因为我们正在对大量事物的数量取平均值。”

有意思。是的。所以,是的,如今大多数人接受的第二定律版本是某种概率性或统计性限定的东西。正如西拉德(Szilard)在1920年代所说,想象一个试图超越卡诺效率界限的人,有点像一个试图在赌场里赢光庄家的赌徒。你可能会有偶尔的输赢,但你不可能可靠地、平均地赢。是的,概率论中有关于不可能做到这一点的定理,因为如果你赢钱的期望值总是负的,如果赌场做得对的话。而大数定律说,你每局的赢钱数将以高概率越来越接近期望值。所以第二定律应该被看作是类似的东西。

熵、信息与可用能量

这实际上引出了与信息的联系,如果你仍然认为热力学是某种资源理论的话。因为如果你有……让我回到一个……我的意思是,假设你的活塞上有一个波动的压力。如果你知道那些波动何时会发生,比如你能可靠地说,“我只在压力暂时高于平均水平时才拉出活塞,”那么你甚至可以违反第二定律的统计版本。

可以这样想,与其用一个活塞,不如想象你有一个装有气体的盒子,中间有一个隔板,中间有一个小孔,所以气体可以穿过,对吧?好的,所以当分子来回穿梭时,两边的分子数量会持续有微小的波动,压力也会有持续的微小波动。假设它已经这样持续了一段时间,然后我们堵上那个孔,你相当确定一边的压力比另一边大,对吧?嗯,如果你知道哪边的压力更大,你就可以利用这一点来稍微推动活塞,如果你能可靠地知道,如果你能一次又一次地这样做,并可靠地知道哪边的压力更大,你甚至可以违反第二定律的统计版本。

好的,让我们回到那个古老的问题。假设你面前有一个气体盒子,它开始时两边的压力相同,然后它波动了一下,一边的压力比另一边高,然后你堵上了那个孔。所以它就卡在那个状态了。熵减少了吗?嗯,如果你想,好的,你做标准的熵计算,你得到,压力在哪边更高并不重要,因为你可以直接做标准计算,如果你有一个盒子,这边的压力比那边的压力高,它的熵比两边压力相同的气体要低。所以如果你认为熵只是气体本身的一个属性,那么是的,熵更低了,它减少了,对吧?

你甚至会在……对不起,你的意思是物理系统的属性,而不是气体,比如不是气体中的单个分子,而是整个物理系统。

物理系统是整个气体,整个东西,是的。好的,所以物理系统是盒子里的气体。明白了。标准的计算,如果我告诉你,这是一个有两个腔室的盒子,这边有这么多气体,压力这么大,假设两边温度相同,那边有这么多气体,压力那么大,那么熵的最小值是当两个压力相同时。对吧?是的,你在入门热力学课程中学到的标准计算。

好的,所以当发生自发波动时,你可以说的一件事是,“嗯,看,发生的是熵实际上在某个平均值附近自发波动。”所以实际上存在熵的自发减少。然而,这里有另一种提出问题的方式。我将不用熵来表述它,而是用开尔文和麦克斯韦所说的“可用能量”(available energy)

所以这是一个关于可用能量的问题。可用能量是,想象一下你面前有一个物理系统,你有一个固定温度的热浴,我给你一个任务,让你把它从它现在的状态中尽可能多地提取功,但我会指定你最后必须把系统留在什么状态。好的。可用能量是你能量获得多少功的度量。对。它等价于我们现在所说的亥姆霍兹自由能(Helmholtz free energy)。对,好的。也就是总内能减去温度乘以熵,即 $A = U - TS$。

如果一个气体自发波动到一个一边压力比另一边大的情况,我们堵上那个孔,可用能量增加了吗?

我会说,是的。

你会说,是的。因为你现在可以用它来做些什么。

好的,那你打算怎么用它来做些什么?

如果所有的分子现在都在一边……

或者只是大部分,是的。

好的,大部分。那么你可以在这里放点东西,它就会自发地开始把这个东西向左推。

你要把它放在哪一边才能那样做?

什么意思?如果所有的分子都在一边,那你只要在那边放一个活塞就行了。

是的,是的。所以我们有气体,你知道,就假设所有的分子都在一边,好吗?所以它们要么全在左边,要么全在右边。是的。好的。

所以你做什么来从中获得功?

你把活塞放在划分它的中点,然后你看着活塞移动。

对。所以假设你想举起一个……如果我只是让活塞自己动,那我就没有得到任何有用的功。假设我想举起一个重物。嗯哼。我该怎么做?

我不知道。

嗯,是这样的。如果我把东西连接起来,如果我把一个重物连到一个活塞上,我想举起这个重物,比如说我有一个活塞,一根绳子绕过一个滑轮,你有一个可以上下移动的重物。那根绳子和滑轮可以在活塞的左边或右边。如果我不知道气体在盒子的哪一边……

哦,对不起,我没意识到你不知道在哪一边。

是的,我只说了它要么在左边,要么在右边。

对,我明白了。好的,好的。所以,对,如果你不知道,那么你知道,如果你猜对了,你可能会说,“好的,我猜对了,我要把活塞,我要把重物放在活塞的这一边,”你最终可能会把它举起来,对吧?但如果你猜错了,你最终可能会把重物放下来。

是的,是的。所以这就是为什么根据一些人的说法,让熵不仅是系统物理状态的函数,也是某人对其了解程度的函数,是有道理的。因为如果熵应该与我刚才说的可用能量有那种联系,即它是一个度量,如果可用能量与你能从一个系统中获得多少功有关,那么这不仅取决于系统的物理状态,还取决于你可用的操纵系统的手段以及你对它的了解。

玻尔兹曼熵与吉布斯熵

对。我刚才说的是没有争议的。如果问题是,我能从一个系统中获得多少功?那取决于我操纵系统的手段和我对系统的了解。这是没有争议的事情。如果你想要一个熵的概念与可用能量有这种联系,那么有一个相对于可用操纵手段和关于系统信息状态的熵概念是有道理的。

根据我的经验,我可以对那些最初对天使问题回答“哦,当然不是。熵显然只是物理系统本身的属性。它与你可能知道的任何事情都无关”的人说,如果我说,“哦,嗯,如果我把热力学看作是一种资源理论,一种关于拥有特定目标和特定操纵手段的代理人能用系统做什么的理论,而且我希望这个可用能量的概念能衡量你能从一个系统中获得多少功,那么显然,可用能量可以相对于操纵手段和系统知识。”比如,你是否知道很重要,因为如果你为了从中获得功而必须对系统做不同的事情,这取决于分子在盒子的哪一边,那么信息就是一种资源,对吧?

所以存在一个完全可以接受的这种概念,你叫它熵与否都无所谓,但存在这个与可用能量有联系的概念。我们要叫它什么呢?嗯,如果你不喜欢叫它熵,那就给它起个新名字。但它实际上与克劳修斯创造“熵”这个词时所指的概念非常接近。

这个概念和克劳修斯的熵概念之间的区别在于,在传统热力学,也就是热力学1.0,19世纪人们所做的,他们总是假设即使物质是由许多分子组成的,并且在分子水平上存在这些波动,我们也是在整体上处理它们,任何波动都是可以忽略不计的。事情可以看作是可预测的。所以我们可以假设我们知道我们的操作会带来什么结果。

当你开始深入到分子层面,这就是那些从事量子热力学的人正在做的事情,他们在说,好的,是的,我们工作的层面,这些分子波动是不可忽略的。如果你真正想要的熵概念是相对于某些物理特性,但它也可能处于这个状态,我能用它做什么,它将如何响应我的操纵,可以取决于它处于什么状态,所以它实际上可以相对于某个,比如说,可能状态的概率分布。然后你得到的是一种量子的,你得到的是一种作为统计平均值的热力学第二定律。

现在,如今的教科书里发生的情况是,基本上,即使是统计力学教科书,也有教科书基本上采取那种方法。无论你是否注意到,熵实际上是根据一个可以代表关于系统信息状态的概率分布来定义的。另一种做法,这也是你刚才暗指的,是你说,“嗯,看,给定系统的任何约束,会有一组可用的状态,并且会有一个特定的,比如说,可用状态的数量,然后熵就正比于可能状态数量的对数,”对吧?即 $S = k \log W$。

所以这通常被称为玻尔兹曼熵(Boltzmann entropy)。而另一个熵根据概率分布定义的,通常被称为吉布斯熵(Gibbs entropy)。它们都是完全好的概念。

但是?

但它们有不同的用途。它们是不同的。它们是不同的东西,有不同的用途。所以如果我给你一个盒子,说有二分之一的概率所有分子都在这一边,有二分之一的概率在另一边,那会有一个相关的吉布斯熵,它会与你能用它做什么,你能从中获得多少功有关。然后你说,那会随着那些概率的变化而变化。比如,如果你有很高的概率它们在左边,那作为获取功的资源对你来说比50-50的概率更有价值,对吧?是的。对。所以如果我试图有一个熵的概念,它能指示这个东西作为功资源有多大价值,那么让它相对于某个,比如说,概率分布,是完全有道理的。

然而,人们也会说,如果它要么在这一边,全在这一边,要么在那一边,你计算玻尔兹曼熵。如果它在这一边,你计算玻尔兹曼熵。如果它在另一边,结果是一样的。我明白了。

那也是对的,对吧?所以玻尔兹曼熵不依赖于你对系统的了解。吉布斯熵则依赖。它们服务于不同的目的。它们只是不同的概念。当人们争论熵相对于信息状态是否有意义时,他们心里想的是为不同目的而存在的、定义完美的、不同的熵概念。

(广告时间)

你知道什么比刮干净胡子更好吗?一个干净的云存储,它不会因为你忘了存在的文件而每个月掏空你的钱包。物理学原理是这样的。你的云存储遵循熵增原理,这意味着它会随着时间的推移而增加。随机的截图、重复的PDF、那个2019年的4GB视频。CleanMyMac的新云清理功能直接解决了这个问题。它在你的Mac上本地扫描iCloud、OneDrive和Google Drive。你的数据永远不会离开你的设备。这能识别出那些占用你存储预算的空间浪费者。把它想象成你数字生活的降维处理。你可以从云端驱逐文件,同时保留本地副本。你也可以完全删除它们。这个功能可以映射你的存储拓扑,精确显示那些千兆字节藏在哪里。对于一个不断处理研究论文、播客录音和参考资料的人来说,云存储膨胀很快就会变得昂贵。这个工具让你重新获得控制权,而无需手动整理成千上万个文件。今天就变得整洁吧。七天免费试用。使用我的代码THEORIES享受八折优惠。CleanMyMac。优惠码是THEORIES,享受八折优惠。

六、微观态、宏观态与麦克斯韦妖

好的,当我在这里说概率时,听者可能会想,什么的概率?然后我们没怎么说,也许你提到了一两次,但不多,就是微观态(microstate)宏观态(macrostate)。所以它是某个宏观态的概率。什么是宏观态?它被看作是微观态的计数。什么是微观态?嗯,当人们说,“物理系统是什么?”在这个频道上,当我们谈论所谓的“基础物理学”时,我们想到的大多是微观态。那么宏观态是什么?比如,到底是什么定义了宏观态?仅仅是我们作为人,说,“这个我们更关心,所以我们叫它宏观态”吗?

是的,这是个好问题。事实上,你会在不同的教科书中找到不同的答案,因为那些希望熵,统计力学熵,成为系统本身属性的人,他们通常指的是玻尔兹曼熵,对吧?但玻尔兹曼熵,你的第一步是把所有可能的微观态划分成宏观态,然后你说无论它处于哪个微观态,它都会属于某个宏观态,有些宏观态对应的可能微观态范围比其他的要大,而对应更大微观态范围的宏观态比对应更窄微观态范围的有更高的熵。

所以熵确实会随着微观态而改变,因为如果微观态在同一个宏观态内改变,熵不变,但如果它从一个宏观态跨越到另一个,那么玻尔兹曼熵就改变了。但熵不仅仅是微观态的属性,因为它需要这种在基础物理学中不存在的对宏观态的划分。

是的,所以严格来说,任何给定的微观态的熵都是零。

嗯,如果你说的是玻尔兹曼熵,对吧,那么为了定义玻尔兹曼熵,我首先必须把可能的状态划分成宏观态,对吧?好的。然而,如果我告诉你,如果我要做一个非常、非常精细的划分,对吧,你说我的划分是,我要告诉你,每个微观态都属于划分中的一个不同元素,我要精确地告诉你微观态是什么,对吧?那么,是的,那么所有这些微观态的熵都会是零,对吧?是的。但那将是完全无用的,对吧?

所以我认为,即使是那些说“不,熵不能依赖于我们,它不能依赖于我们对它的了解,它不能依赖于我们如何操纵它”的人,如果他们使用的熵概念是玻尔兹曼熵,它也是从一个划分,一个将可能状态集合划分成宏观态开始的。你问了这个问题,“嗯,什么是宏观态?”好的。

现在,人们常说的一件事是,“嗯,看,有些变量是我们要测量的,宏观变量。我们的测量仪器会有一定的精度等级,一个宏观态就是根据我们将要做的测量无法区分的一组微观态。”那么它就不存在于基础物理学中,因为它相对于某套测量、某套仪器、某套测量位置。我认为这完全没问题。然后说,“好的,嗯,当我们谈论熵的时候,我们不是在做基础物理学。”我认为这完全没问题。但这困扰着人们,因为熵增被认为是宇宙的基本定律之一,它不应该依赖于那些在基础物理学中不存在的东西。但是,你知道,那可能就是正确的答案。因为热力学不是一个基础理论。

麦克斯韦妖的启示

另一件你可以说的事是,“嗯,真正重要的是,如果我把这看作是一个资源理论,宏观态之间的区别,嗯,我会关注那些对我能用它们做什么有影响的区别,而忽略没有影响的。”所以如果所有的分子都在一边,所以如果我猜,如果我告诉你盒子的这一边有多少分子,另一边有多少分子,好的,这真的很有用,因为我可以用它来膨胀一边或另一边。这很好。如果我只有一个可以整体膨胀东西的活塞,而我没有在微观层面操纵东西的手段,你告诉我任何超出这个范围的信息,你告诉我确切的微观态,它并不影响我能用它做什么,对吧?它不影响我能从中得到什么。

这是很多人对麦克斯韦妖(Maxwell's demon)例子误解的地方。那个妖精的例子是为了说明热力学概念,比如熵,对可用操纵手段的依赖性。比如,我们现在称之为麦克斯韦妖的首次出现,是在麦克斯韦写给他朋友彼得·格思里·泰特(Peter Guthrie Tait)的一封信中,泰特当时正在写一本热力学概论。麦克斯韦说,“你可能想在第二定律上找个漏洞,”因为他说,如果气体的动能理论是正确的,第二定律需要被修正。

想象某个小生物能单独操纵分子,或者想象它在隔间之间有一个小小的活板门……

我会在屏幕上放一个关于这个的视频。

是的。是的,想象一下你有一个装有气体的盒子,被分成两个隔间,中间有一个小活板门,妖精可以操纵这个门,让速度快的分子往一个方向走,速度慢的分子往另一个方向走。嗯,那个妖精可以在不耗费功,或者耗费极少功的情况下,制造出巨大的压力-温度差,而我们作为宏观生物现在可以利用这个差值。根据麦克斯韦的说法,这个故事的寓意是,热力学第二定律是一个统计上的概括,它只适用于你处理大量分子整体行为的情况。当他说统计概括时,他期望他的读者熟悉社会科学正在提出的那些统计概括,对吧?比如每年人均谋杀案数量之类的。

如果你想一想,这确实有一个很好的类比。如果你保持宏观条件不变,大的社会经济条件不变,那么很可能,如果你处于一个给定的情境中,你每年的人均谋杀案数量会相当稳定。但如果你能,想象一个心理学家团队进去和人们交谈,如果他们有能力识别出有谋杀风险的人,诸如此类,和他们交谈并处理他们,如果他们能在个体尺度上处理这些人,那么你也许就能改变那个人均谋杀率,对吧?不是人均谋杀率,对吧?所以,麦克斯韦说的是,这个妖精能够做到我们目前无法做到的事情。因为我们没有在分子层面操纵事物的能力。

他当时并不认为,他表达的方式清楚地表明,他并不认为有任何基础物理定律会阻止未来的技术发展达到我们能做到这一点的程度。是的。对。现在,事实上,他没有真正看到这一点,但如果你现在把妖精在一个循环中操作也考虑进去,比如,妖精无论做什么,在每次迭代结束时都必须重置自己,那么这实际上是物理定律的一个推论,无论是经典物理还是量子物理,平均来说,妖精无法打破热力学第二定律。

因为经典的情况是,如果你把妖精加上整个系统作为一个孤立系统来操作。是的,是的。如果妖精能在一个循环中操作,同时可靠地把所有分子都放到盒子的左边,那与哈密顿演化(Hamiltonian evolution)是不相容的,因为哈密顿演化保守相空间体积。你实际上就能够减小系统占据的相空间体积。量子力学中也有类似的情况,如果你让整个系统进行孤立演化,那么你不能把一个最初分布在希尔伯特空间一个大子空间里的东西,放到一个小得多的子空间里。所以实际上,麦克斯韦没有意识到,如果你要求妖精在一个循环中行动,但有定理表明,在经典力学和量子力学中,妖精都不能可靠地、持续地做到这一点。

循环、信息与资源

确切地说,当你说妖精在一个循环中行动时,你是什么意思?

妖精必须最终回到它开始时的那个物理状态。

好的,为什么你必须这样做?我想象,看,如果妖精有大脑,它在开关这个门,那么大脑会改变。

是的。是的,对。所以人们是这样想的。而且,你知道,你谈到大脑是对的。人们已经给出了这个的简单模型,比如,不是一个有大脑的生物,而可能是一个带有记忆设备之类的小装置。是的。所以想法是,如果妖精有某种记忆存储,那么如果它从不擦除,并且总是记得它在之前迭代中所做的事情,从不擦除任何东西,最终它的内存就会用完。所以它不能永远、永远、永远地这样做下去。如果它必须在一个循环中行动,如果它最终必须擦除记忆,那么擦除记忆实际上会有一个熵成本。这有时被称为朗道尔原理(Landauer's principle)。是的,它基本上只是我刚才所说的一个推论,即如果你要求妖精在一个循环中行动,那么它不能持续或可靠地违反第二定律。

所以如果我不要求妖精在一个循环中行动,那么是的,它能做的是,好的,把那个空白记忆看作是一种资源。它这样做,最终用掉了那个资源,然后递给你这个一边压力比另一边高的盒子,说,“好的,很好,现在你可以用它来举起一个活塞之类的东西了。”好的,你所做的只是把一种资源转换成了另一种资源。你实际上没有违反第二定律。

是的,是的,我明白了。好的。所以你实际上必须把那个记忆储备,那个空白的记忆储备,看作是它自身有熵的。所以一个只是空白的,或者可能全是零的记忆,在这种观点下,比一个随机填充了1和0的记忆有更低的熵。

好的,让我看看我是否明白了。有两种情况:要么它在一个循环中操作,要么不。如果不,它将消耗一种资源,这种情况下你仍然有一个资源理论。如果它在一个循环中操作,那么从根本上说,你将压缩相空间。现在,我知道大多数物理系统会压缩相空间,因为有摩擦之类的,但在根本层面上,你不会压缩相空间。对不起,你不会压缩你最初在相空间中开始的体积。

绝对是,是的。所以当你有像带摩擦的东西这样的耗散系统时,对吧,你写下运动方程,它会从,你知道,这个原始版本的相空间中的所有东西都将变成那个,对吧?但那是因为我们实际上并没有把那个系统看作是一个孤立系统。比如它与某个作为摩擦源的东西接触,对吧?如果你把所有东西都包括进去,比如来回摆动的钟摆和作为摩擦源的任何介质,并且你认为所有这些都在进行孤立演化,并且你认为,好的,普通的哈密顿动力学将适用,那么那个系统作为一个整体是不会压缩相空间的。发生的是,当钟摆被阻尼,它进入并占据一个越来越小的相空间区域时,它正在加热环境,使环境变暖,基本上它是在向环境传递能量,增加其熵。

七、物理学的深层追问

我有一些有趣的问题要问你。

好的。好的,很好。我不能保证答案会很有趣。

好的,嗯,你是量子力学和量子场论的专家,下次我想和你当面谈谈这个,因为你住得其实很近,所以希望我们能很快见面。对于我在欧洲的同事来说,安大略省的伦敦和安大略省的多伦多算是近的。我在荷兰的同事们总觉得我说这样的话很有趣。

宏观态划分与海森堡切割

有一个经常在谈到测量问题时被引用的海森堡切割(Heisenberg cut),对吧?那么,宏观态的划分,我们所认为的宏观态与微观态,和测量问题的海森堡切割之间有类比吗?或者这是两个独立的问题?

这是个好问题。我真的得好好想想。我大概明白你的意思,表面上看可能存在联系。但我看不出确切的联系可能是什么。而且它并非显而易见的错误。所以我得思考一下。实际上可能存在。是的。

宇宙是孤立系统吗?

我的第二个有趣的问题是,宇宙是一个孤立系统吗?

宇宙是一个孤立系统吗?我们甚至能谈论整个宇宙吗?大概可以,是的。如果你真的意思是,是的,宇宙中的一切都是,如果你字面上的意思是宇宙就是存在的一切,那么这似乎是同义反复的。对。然而,另一个问题是,整个宇宙是否遵守我们通常认为适用于孤立系统的那些定律

这是一个真正的问题,原因如下。可能的情况是,好的,对于我们能真正隔离的相对较小的系统,我们应用于孤立系统的物理学是适用的,但当事物足够大时,那实际上就不适用了。我的意思是,在量子力学中,当你问宇宙是否是一个孤立系统时,你通常的意思是它根据薛定谔方程的适当类似物演化,这可以由一个幺正算符族来表示,它保守希尔伯特空间范数,所以它不能从希尔伯特空间的一个小子空间开始,进入一个更大的空间,对吧?

但那些认真对待动力学坍缩理论的人认为,我们应用于实验室中我们隔离的系统的那种孤立薛定谔演化,实际上是一种理想化,并不完全正确。如果你有满足某些标准的系统,要么它们有足够多的粒子,要么它们涉及大质量的位移,那么实际上物理定律是不同的。它不是我们通常认为的孤立定律,而且实际上在数学上模仿了我们用于非孤立系统的定律。

如你所知,因为我知道你和人们谈论过这个,有动力学坍缩理论修改了通常的薛定谔方程。基本上其起源是,人们在研究非孤立系统的演化,然后说,好的,如果系统与热浴接触之类的,这就是系统状态会发生什么。然后说,“嗯,让我们就想象这种形式或类似形式的东西实际上就是基本定律。”在这种情况下,如果那是对的,它仍然是同义反复的……它仍然是同义反复的……同义反复……随便了。好的。如果是这样,宇宙是孤立的仍然是一个同义反复。但可能的情况是,整个宇宙的演化方式就好像它被某个外部测量者持续监控着。

宇宙的热寂与人类的未来

是的。好的。我的另一个有趣的问题是,人们常说在某个时刻我们会达到宇宙的热寂(heat death),那时我们将无法做任何事情,即使我们假设我们或我们的后代还在。是的。现在,你想象那是真的吗?因为如果我们从资源理论的角度思考,我可以想象会有某些对我们来说更重要的问题,这些问题对我们和对我们的后代来说会是不同的。也许他们能够更精确地利用一个系统。

是的,绝对是。我们实际计算熵的方式是,这是教科书中不常强调的一点,是相对于我们认为我们感兴趣或将要操纵的一组特定参数。例如,如果我想计算某个标准体积气体的熵,问题是,我是否要区分不同同位素比例的气体样本?只要我只处理化学问题,我的氧气中有多少是一种同位素,有多少是另一种,都无所谓。如果我处理的是核反应,或者如果我有某种方法可以根据质量分离物质,那么这实际上可能就很重要了。所以我可能想在熵的计算中包含这一点。

从某种意义上说,熵是相对于你要操纵的东西而言的。然而,当人们谈论热寂时,无论你想做什么,事物的自然趋势,如果任其发展,是趋向于做那件事的能力减弱,对吧?所以最终,人们在19世纪开始谈论宇宙的热寂。开尔文自己写了一篇文章,叫做《论能量耗散的普遍趋势》。

所以如果事情就这样继续下去,太阳将会燃尽,好的,我们想在地球上做的几乎任何事情,无论你的目标是什么,你的操纵手段是什么,都涉及到某种熵差,这最终源于这样一个事实:在我们的一边,我们有这个高温的低熵能量源,而在另一边,我们有这个低温的空旷空间,我们可以把东西辐射回去。好的,最终那会用完。即使你有更精妙的操纵事物的方法,最终一切都会衰变成黑洞。无论你的目标是什么,无论你有什么操纵手段,最终事物都会耗尽,并永远保持那样,除非罗杰·彭罗斯(Roger Penrose)关于他的共形循环宇宙学是正确的。在那之后,事情会重新开始。

但是,比如,那是真的。但老实说,我们谈论的是荒谬地长的时间尺度。比如,数十亿又数十亿年。所以,我认为我们应该更担心人类会……未来几个世纪地球上的人们会是什么样子。那是我们可以做点什么的事情。对。而在数百万年和数十亿年的时间尺度上会发生什么,我们实际上很难想象。

所以比如,有些人觉得宇宙的这种热寂有点令人沮丧,有时甚至有人会说,“好的,这让一切都变得毫无意义。”嗯,你一生中大部分时间都知道你最终会死,对吧?你有一定有限的时间来做事情,对吧?在你拥有它的时候,尽你所能地利用它。充分利用你拥有的时间。这适用于人类的时间尺度,我想我们也可以这样说,假设人类这个物种只会再存在一百万年。嗯,我会对那个物种说,在你拥有的时间里,尽你所能地做到最好。

所以实际上,我并不觉得沮丧。我的意思是,我偶尔会,比如,每个人都必须面对这样一个事实:你和你认识的每一个人都是凡人,你的寿命是有限的。我确实,很难对那没有感觉。我发现很难对十亿年后会发生什么真正有任何情绪或感觉。

熵与无序

是的。无序(disorder)。无序。熵。是的。无序是我们没说过的词。很多大众媒体在谈论熵的时候,会把熵和无序等同起来。这有什么问题?

你必须小心你所说的有序和无序是什么意思。在某种真实意义上,如果我有一个气体盒子,有一个隔板,所有的气体都在一边,另一边没有,那是一个比隔板拿掉后气体到处都是更有序的状态。有一种想法是,如果气体确实被允许自由漫游,它可能会自发地最终聚集在盒子的一边,但这对应于其相空间中一个非常、非常小的区域。

所以想法是,有某些我们认为是“有序”的状态,而这些状态只占所有可能状态的很小一部分。在某种意义上,熵是无序的一种度量。所以你做的,比如,当我通过摩擦产生热量,就像,我在磨这个炮膛,对吧?你知道,在某种意义上,我有一些规则的、有序的运动。我有这个东西像那样转来转去。我正在从那种有序的运动中获取能量,并将其转移到大炮的铁中,这表现为分子的那种杂乱无章的运动。

我认为不对的地方在于,并非所有我们直观上认为的有序和无序的区别,都实际对应于熵上的区别

是的,如果……我想到的最简单的方式是一个咖啡杯,开始时是黑咖啡,然后你倒一些牛奶,然后有很多湍流,你会说,“哦,那极其无序,”然后你搅拌它,然后你会说,“哦,哇,现在它极其有序了。”但它实际上有最高的熵。

是的,对,是的。所以,我的意思是,那是个很好的例子,因为有些东西在我们看来更无序,但实际上熵更低。那是个很好的例子。在你加牛奶之前,实际上用奶油更好,因为奶油需要一些时间来扩散,对吧?是的,如果我拿一些浓奶油放进咖啡杯里,我可能会看到里面有奶油的漩涡,对吧?那看起来,可能会非常湍流和无序。然后它会稳定下来,变成奶油均匀分布的状态。那是一个比中间状态熵更高的状态。但它可能,在我们看来像一个更简单的状态,更……所以这就是为什么在分子层面上思考有序和无序很重要。

而且并非所有我们认为或多或少有序的东西都真的对应于熵的差异。当引力发挥作用时,如果我有一团散布在星际空间的气体,它的自然趋势是引力作用下聚集在一起。所以团块状的……是的。所以一团均匀散布的气体聚集在一起形成一颗恒星,这实际上是一个熵增加的过程,即使你直观上可能认为最终状态比初始状态更有序。所以如果你只是粗略地想,在某种意义上,分子无序和熵是相关的。但它不是一个可靠的指南。

我认为有时人们所说的有序和无序,实际上有点不同,是人们有时所说的“复杂性”(complexity)。肖恩·卡罗尔(Sean Carroll)去年某个时候来过这里,他谈到了复杂性的起源。研究复杂性的人,那又是另一个非常精确的区别,他们倾向于说,既不是熵最小也不是熵最大的状态是最复杂的。在某种意义上是这样。对,好的。对。

遍历性假说

是的。我们没谈到的一个想起来的概念是遍历性(ergodicity)

遍历性,是的。那么物理定律是遍历的吗?这是一个良定义的陈述吗?另外,也请定义一下什么是遍历性。

是的,所以经典地,遍历性指的是一个被限制在其状态空间一个有限区域内并进行孤立演化的系统。遍历性意味着,取几乎任何你想要的初始条件,并取任何有限的相空间区域,最终那个初始条件会进入那个相空间区域。对于实际的物理系统,要判断它是否是遍历的非常困难。比如,如果我给你一个动力学定律,然后说,“这是遍历的吗?”这实际上是一个非常难的数学问题,对吧?

当然,那是一个经典的定义。我们知道物理定律深层次上不是经典的。在量子力学中,基本上那个遍历性的定义,比如一个状态,并不真正适用。有一些被称为量子遍历性定理的东西,其效果基本上是任何状态都可以被尽可能地接近。

实际的物理定律……比如,如果我真的拿一个气体盒子,以某种方式隔离它,让它根据普通的量子演化进行,在某种意义上,类似遍历性的东西是适用的,即如果你看足够长的时间平均,那么它在给定子空间中花费的时间,对于几乎所有的初始状态,都将与那个子空间的维度成正比。

我不确定……某种那种味道的东西经常在人们试图证明平衡化结果时出现。我们没谈到的是一个过程,就是你把一个东西放着不管,它从一个远离平衡的状态开始,然后进入一个平衡状态。这有时被称为热力学第负一定律。对,对,是的,我们没谈到那个。我们没谈到的原因之一是,很难对此说出任何真正精确的东西,因为有各种各样的结果,而且并不总是很清楚。你会得到一些漂亮的、清晰的数学结果,但它们对实际系统的物理意义有点模糊。然后你会得到一些关于实际物理系统的貌似合理的论证。

我实际上认为,任何意义上的遍历性,它真正与无限长期平均行为有关,真的不是正确的问题。因为我想知道的是,如果我把牛奶倒进咖啡杯里,对吧?不是如果你把它隔离起来,让它永远存在,平均下来会发生什么,而是它在接下来的几分钟内会发生什么。你实际上想知道在有限时间尺度上会发生什么。

所以统计力学教科书在遍历性是否对统计力学重要这个问题上存在分歧。有些会说,“好的,这个遍历性假说是统计力学的根基。”这个假说就是实际系统是遍历的。然后其他的会说,“哦,有很多关于遍历性的非常好的数学工作,但它与统计力学完全无关。”

好的,对于奶油和咖啡杯,我们只需要等几分钟。所以它不是无限的,不是T趋于无穷大。然而,尼马·阿尔卡尼-哈米德(Nima Arkani-Hamed)也谈到,在粒子物理学中,粒子物理学发生在边界上。为什么?因为在数学中,我们是从负无穷散射到正无穷。是的,它只发生在几毫秒或几秒钟内,或者随便多久。但为了计算,我们只使用无穷大。现在,他似乎在用和你刚才相反的论点。那么你能说服他吗?“不,不,不,尼马。它实际上不是发生在无穷远处。它不是在边界上。”

嗯,是的。当他说发生在无穷远时,我认为你必须意识到,当物理学家说无穷大时,他们通常的意思不是字面上的无穷大,而是大到它有多大已经不重要了。有一本好书叫做《理解无限》,作者是一位名叫肖恩·拉文(Shaughan Lavine)的哲学家。他引入了他所谓的“兆亿理论”(theory of zillions)。而“兆亿”(zillion)是一个技术术语。

我明白了。一个“兆亿”是一个如此之大以至于它到底有多大已经不重要的数字。好的。所以它是上下文相关的,对吧?如果你想想,我们就是这么用这个词的。比如有人说,“韦恩,你老是去开会,为什么不买一架里尔喷气机呢?”我会说,“嗯,那要花兆亿美金,”对吧?我根本不知道一架里尔喷气机多少钱,对吧?但我知道,无论那个价格是多少,都远远超出了我的财力范围,它到底有多大已经不重要了,对吧?我的一个同事说,“我们必须意识到,在量子场论中,渐近无穷远就像是五米。”

因为你在做这些散射实验时,你做的是,有一个相对较小的散射区域,离那个散射区域足够远的地方,场实际上是自由的。所以你基本上把输入和输出状态当作自由场来处理。你做你的计算,你计算散射截面等,都是针对实际上是自由场的。实际上你会说在无穷远处,数学上你可能会取极限,让事物趋于无穷大,因为那是一个漂亮的、清晰的物理结果。但你真正的意思是,这在离散射区域足够远的地方是一个好的近似,以至于相互作用可以被忽略。我想这就是他说的“有趣的事情发生在无穷远处”的意思。

所以对于那样的事情,如果我有一个相互作用,而且我知道相互作用随距离衰减得多快,我就能感觉到我需要离散射区域多远才能说,好的,这些实际上是自由场了,对吧?我们想从平衡化结果中得到的是关于,好的,我需要等多久才能说,好的,是的,我们实际上已经到了无穷远了,因为东西已经平衡了。这就是你试图从平衡化结果中得到的。这并不像量子情况那么简单,因为在量子情况中,你有这些距离力,你知道它们衰减得多快。而你在平衡化情况中试图找出的是,嗯,一个东西平衡得多快?它需要多久才能达到我可以基本上忽略它开始时处于非平衡状态这个事实的程度?

八、物理学领域的反思与建议

是的。好的,我还有一个有趣的问题。

是的,好的。

纳蒂·塞伯格(Nati Seiberg)说过,我们能判断量子场论基础不牢固的一个指标是,我们教量子场论的方式不同。几乎没有哪本量子场论的教科书是一样的,也几乎没有哪门课程是一样的。有人可能会说,“让我们从标量场开始,然后加入相互作用。”然后有人可能会说,“嗯,让我们从所有自由场开始,然后加入相互作用。”还有的是泛函问题等等。所以,量子场论不牢固这个说法是没有争议的。

但我好奇的是,你个人,韦恩,是否认为有某个领域或子领域,这个特定的物理学主题,其他人认为,“不,不,这个我们很了解了,”但你认为,“实际上,这里有问题”?

嗯,我认为统计力学就是一个很好的例子,因为人们,教科书的编写给人一种我们什么都懂了,这一切都解决了的印象。如果你真的从一本教科书看到另一本,你会发现非常不同的方法。就像在量子场论中,每个人都知道有不同的方法,但在统计力学中,这被掩盖了。所以这是一个我认为存在关于某些方法的基本原理的真正问题的案例,这些问题被掩盖了。

关于热力学的事情是,热力学有点类似,即使我们不认为它是基础的前沿科学,它的根源在19世纪的物理学,不同的热力学教科书会采取非常不同的方法。我认为其根源在于,关于热力学应该是什么,存在着不同的观念。

一种观念是我所说的资源理论观念,它真的是关于你能用各种东西做什么。但人们通常从热力学教科书中想要的,特别是如果它是为学习化学热力学的人准备的,是你想弄清楚一个系统的平衡态是什么。那些是使熵最大化的状态。一本有这种导向的教科书会倾向于最小化关于操纵、做功等内容的讨论,并把熵当作它仅仅是物质的一种属性,就像质量和其他东西一样。我认为在很多领域,实际上教科书的传统有时会掩盖思考理论的不同方式。

所以问题是,在哪些领域存在一种固定的,每个人都同意如何做的方式?我猜是经典电动力学,现存的每一本教科书都是J.D.杰克逊(J.D. Jackson)书的翻版。是的。我认为是的,这之所以可能,是因为存在一个我们称之为经典电动力学的理论,我们认为它已经被量子电动力学所取代。所以我们都能同意经典电动力学是什么,因为它在某种意义上是一本已经完结的书。

而量子场论是一个持续活跃的研究领域。而且,是的,量子场论方法不同的原因之一是,我们对这个理论的数学把握不如我们对物理学其他领域那么好,对吧?你写下一个拉格朗日量,标准模型的拉格朗日量,这是一个良定义的……你引入一个截断(cutoff),如果你让截断趋于无穷大,你会遇到发散,你有某些技术来处理它。这是否告诉我们,我们写下的理论实际上根本不是良定义的?或者我们引入的这些截断只是为了得到一个良定义理论的推论而使用的计算工具?我认为,据我所知,而且有很多人更了解文献,我实际上认为那或多或少还是一个悬而未决的问题。

我认为标准的观点是,我们写下的理论是否在所有能量下都是良定义的并不重要,因为我们认为它是一个在某些能量下有效的有效场论,我们不知道在那些能量之外发生了什么。

但你不接受那个答案,还是什么?

我认为那是对的。我认为那是对的。所以这就是为什么我们实际上可以不知道我们写下的理论是否在所有能量下都是良定义的答案。如果你持这种态度,那么它是否是良定义的就真的不重要了。

你有什么学得太晚的教训吗?

给研究者的建议

我有什么学得太晚的教训?我想你想知道的是关于物理学和物理哲学的,而不是关于个人生活的。

哦。所以,这个,好的,我一直在说的关于热力学的这个想法,即关于这个理论是什么存在两种不同的观念。我们有一个资源理论的观念,和另一个观念,根据后者,它更像主流物理学。我花了惊人的长时间才在自己脑子里把这个弄清楚。但现在我认为这真的,这应该是任何人在谈论热力学时首先要说的事情之一。如你所知,我做过好几次题为《两种科学的故事,都叫热力学》的演讲。真的,只是在相对近些年,我才觉得,好的,那是我想要思考它的方式。

现在,很多看这个频道的人是数学、物理、计算机科学等相关领域的研究者,还有哲学家,也有普通人看。所以我好奇你有什么建议可以给你自己的研究生,但也许也适用于看这个频道的广泛人群。

好的,我会说,这是我给我的研究生的建议,当他们,这将适用于任何领域的研究者,如果他们刚刚起步之类的话,是当你在选择要做什么的时候,你不应该做的是四处看看,说,“好的,什么是热门话题?什么是流行的东西?”然后跳上当前的潮流。

原因有二。如果你做某件事是因为你认为它很流行,而你对它并不是特别感兴趣,那么,如果你对你的工作不感兴趣,你就不可能让别人对你的工作感兴趣。另外,如果你在追随潮流,然后你申请工作,你提交你写的东西,或者你提交你论文的一部分去发表,我作为编辑的经验是,我做过一个物理哲学期刊的编辑好几年。我作为编辑的经验是,如果你收到,当我们收到一篇论文,它是一个老生常谈的话题的第n个小补充,那么它值得发表的门槛会非常、非常高。因为你不想发表,即使你说的都对,你问的问题之一是,“好的,如果这要占用期刊版面,这是否真的是对现有文献的一个重大推进?”

真的,如果某个东西是热门话题,那么人们很快就会对它感到厌倦。所以做一些你感兴趣的事情,但不要选择一个狭窄到只有三个人会知道你在说什么的东西。所以在选择一个有些人会有一些了解的研究课题,和追随潮流做别人都在做的事情之间,有一个愉快的中间地带。

好的,那么我们想象一下你正在对你的博士和博士后学生讲话,他们想在这个领域找到一份工作。我想在某个时候,他们可能不得不,不是跳上潮流,而是偶尔搭个便车,因为你不是得申请经费吗?你不是得有市场价值吗?那么你如何驾驭这个?

我的老师阿布纳·希莫尼(Abner Shimony),我有幸在波士顿大学读研究生时与他共事。他会说的一件事是,“正如亚里士多德教导我们的,伦理美德是相对立的恶习之间的中庸,智力美德也是相对立的恶习之间的中庸。”我认为当你在选择一个研究领域时,有两种相对立的恶习。一是选择一个如此小众的领域,以至于世界上只有三个人会知道你在说什么。我认为另一个恶习是追随潮流,做别人都在做的事情。

我认为我先提到另一个恶习的原因是,我认为存在一种错误的印象,即那才是你应该做的。那才是你应该做的。我认为那是个错误。这是基于我作为编辑的经验,以及与该领域其他编辑期刊的人交谈,以及我在评审经费等委员会的经验。

当然,如果读的人说,“我不知道这是关于什么的,”那很难推销,对吧?但如果你面前有十几份经费申请,其中十份是同一个主题的微小变体,它们最多能做的就是在一个人人都研究的领域取得微小的进展,而另一份是一个有趣且有前途的研究项目,值得做但相对未被探索,那实际上会更有利于那个值得做且相对未被探索的项目。有一种我认为根本就是错误的观点,即存在一种群体思维,每个人都只想把经费给他们认为别人都在做的事情。我认为那根本就是错的。

就找工作而言,让我告诉你,这是真事。很多很多年前,我们在西安大略大学招聘,我是招聘委员会的成员,我们的招聘广告相当宽泛。当时发生的是,在招聘广告中包含的一个专业领域里,一个大哲学家最近出版了一本引起广泛关注的书。结果是全世界每个人都开了关于这本书的研究生研讨会。我当时坐在那里看这些申请。那是人们还真的寄纸质申请的年代,有一个装满所有申请的文件盒,你下班后把它带回办公室,然后你仔细看,对吧?我正在读一个候选人的写作样本。我读了开头段落,心想,“我不是刚读过这个吗?”我心想,“天哪,我们的一个申请人抄袭了另一个申请人的写作样本。”然后我回去拿了那个另一个文件,它们实际上是不同的。但开头段落几乎一字不差,因为这是当时每个人都在谈论的问题,而且有一个非常标准的引出问题的方式。我明白了。所以如果你想让别人把你的写作样本和别人的搞混,那就去追随潮流吧。

有意思。所以这也适用于电影和一般的商业。你不想处在,据说叫,红海,竞争激烈的水域。你想在蓝海里。

我不熟悉那个术语,但我相信你。是的,对。是的,是的。

人生的教训

你刚才提到,“我可以给你一个个人教训,但我会给你一个适用于哲学家和物理学家的教训。”这让我很好奇。你学得太晚的个人教训会是什么?不是那种琐碎的,比如,“哦,我应该用双层袋子装我的杂货。”

让我想想。我个人生活中一个我认为学得太晚的教训。如果你的生活中有有毒的人,避开他们。是的,是的。和那些你感到舒服、感觉良好的人在一起,尽量减少与有毒的人的接触。

非常感谢你花这么多时间和我在一起。

嗯,谢谢你。我真的很享受这次谈话。已经两个,感觉,已经两个小时了,感觉时间飞逝。

是的,这总是一个很好的迹象。事实上,在《哈利·波特》里,我想有一个时间沙漏,然后哈利问教授,“这是什么?”因为那是一种不同类型的沙子。然后那个人说,“当谈话引人入胜时,它会静止不动。”

嗯,那很好。实际上,我还有另一个人生教训,我很早就听说了,但直到今天我仍然不擅长应用。这件事,是我十几岁时在收音机上听到的一个采访,采访对象是大卫·李·罗斯(David Lee Roth),我十几岁时他很红。他说,“这是我的人生教训:别为小事烦恼,而所有事都是小事。”

有意思。我的意思是,我不认为所有事都是小事是真的,但我认为很多,我认为“别为小事烦恼”是我们很多人难以应用的一点,我们最终会为那些长远来看并不重要的事情过多地烦恼。

教授,谢谢你。

嗯,非常感谢你。非常感谢你。我真的很享受这次谈话,我希望你能从这一团乱麻中,你和你的编辑能整理出一些还算合理的东西。

好的。谢谢你。