在上篇,我们好像终于搞清楚了热的本质、“热量”和“温度”的关系:
热的本质是组成物质的原子分子的微观运动,热运动包含有动能和势能两部分,其宏观体现通常表现在两个方面——“热量”和“温度”。“热量”代表“热”的多少,其本质是微观粒子运动的总能量;“温度”代表“热”的强度,其本质是微观粒子运动的平均动能。
不同物质的密度、原子质量等因素的不同,分子之间相互作用力导致的势能不同,因此同温度同体积下,尽管每个原子的“动能”是相同的,但整块物质所含有的“热量”却不同。
当时的人们也认为整个物理学都已经基本弄清楚了。发明绝对温标的开尔文爵士在1900年回顾物理学所取得的伟大成就时说,物理大厦已经落成,所剩的只是一些修饰工作。
然而,故事并没有结束。时间进入二十世纪,量子力学的风暴席卷世界,人们对热的认识也要再度翻新。
五、光与热——物理学的乌云(1859-1928)
1900年4月27日,是特别的一天。英国伦敦,此时此刻欧洲著名科学家汇聚一堂,这里正举行一场世纪之交的物理学报告会。在雷动的掌声中,白发苍苍、已是76岁高龄的德高望重的开尔文勋爵走上了讲台,发表了开幕祝词——《在热和光动力理论上空的19世纪乌云》的演讲。他回顾物理学所取得的伟大成就时说,物理学的大厦已经建成,剩下的事无非是把科学常数测量地更精确,显微镜看得更清晰等等在大厦上添砖加瓦的事罢了。
开尔文勋爵接下了说了一段著名的话:
“在我眼里,我们已经取得的关于运动和力的理论是无比优美而简洁明晰的,这些理论断言,光和热都不过是运动的某种表现方式(热是分子的运动,光是电磁波的运动)。但是我们却看到,在经典物理学这片蓝天上有两朵小乌云让我们感到有些不安。”
第一朵乌云出现在关于以太的问题上,第二朵乌云出现在黑体辐射实验和理论的不一致。开尔文没有想到的是,正是这两朵小小的乌云(尤其是第二朵),在二十世纪几乎把整个物理学大厦拆倒重建了。
第一朵乌云导致了相对论的建立,第二朵则导致了量子力学的诞生。在本文中我们只关心第二朵,为了理解这朵乌云,我们要从光与热转换的现象说起。
光照在石头上石头会变热,炉火中的铁条会烧通红,燃烧时会放出大量的“热”和“光”,这些现象都说明光与热有着密不可分的联系。如果说一束光照在物体上的话相当于给物体注入能量(大家可以参考另一篇《光的本质是什么》),比如我们用微波炉加热食物(注意,微波也是“光”)、用红外理疗仪烤一烤老腰,通过外加能量使得被照物体的原子振动得更剧烈起来,这还是比较好解释的;可是一个热的物体,它好端端为什么要发光呢?
我们要认识到,烧红的铁块并不只是在温度高了以后才发光,它是无时无刻不在发着光的,当温度很低时,发出的就是红外光,而当温度升高到一定程度,就会发出人眼能感觉到的可见光了,这种完全由温度决定的发光现象,我们叫做“热辐射”,像我们常见的红外测温就是利用热辐射来实现的。
在之前的章节之中我们讲到,“热量”可以由高温物体传递到低温物体,我所举的例子是冷的铁球在热水中原子被迫剧烈地振动起来,这种由原子之间互相碰撞导致的热量传递称为“热传导”。第二种热量传递的方式叫做“热对流”,顾名思义就是像冷空气下沉、热气上浮这样存在着物质交换的传热方式,它和“热传导”其实没有本质区别,都是由于原子的碰撞或位移导致的能量交换,只是热传导一般发生在固体之中,原子们挨个把能量传递下去,所以一般速度较慢;而热对流一般发生在液体和气体之中,主要由携带不同能量的原子通过位移发生物质交换传递能量,因此一般较为剧烈。
热量传递还有第三种更为重要的方式,就是一个物体通过“热辐射”发光,另一个物体通过吸收来传递热量的方式。之所以说它更为重要,是因为我们人类绝大部分能量的来源,都是由于太阳发出的热辐射穿越一亿五千万公里的真空来到地球的。
顺便提一句,凡是物体向外发生光子或其他粒子的行为都可以称为辐射。我们的整个宇宙充满了辐射场,而大多数辐射都是对人体无害的,例如:一般物体所发出的热辐射,手机基站向外辐射的手机信号,宇宙微波背景辐射等等。需要说明的是,微波这个波段的光对人体其实是无害的,但凡事不可过量,如果把你关进微波炉去加热那肯定也是分分钟就熟了,所以我们谈无害都是在接受辐射的量有限的情况下而言的。不过大家平时使用微波炉的时候完全可以放心,泄露出来的那一点点微波根本不足以对人体造成伤害。相比之下,短波光或高频光对人体会造成显著的伤害,例如太阳辐射中的紫外部分,做CT时使用的X射线,都是对人体有害的。另外像放射性物质所发出的辐射对人体的伤害更大,因为它们辐射的不是光子而是质子、电子、中子等实物粒子,一般而言会直接留在人体的身体内……
言归正传,对于热辐射的研究的第一个里程碑是1859年基尔霍夫提出的基尔霍夫定律:
任何物体在同一温度下对某一频率的光的辐射本领和吸收本领之比是一个定值,这个定值只取决于温度与频率。
设想一种物体能够把照射在其上的所有频率的辐射完全吸收,即吸收本领与温度和频率均无关,恒等于1,这样的物体称为绝对黑体。根据基尔霍夫的理论,只需要知道绝对黑体的辐射特性,就可以知道所有物质的辐射特性。因此在接下来的几十年内人们做了大量的实验去测量黑体的辐射光谱,得到的结果如下图所示:
黑体辐射光谱
这张图怎么看?有两条定律比较好地总结了黑体辐射谱的规律。第一条是1879年总结出来的斯特藩-玻尔兹曼定律:
黑体的辐射本领与热力学温度的四次方成正比。
也就是说,黑体的温度越高,辐射的总功率就越大,在图上看,每条曲线代表不同温度下的黑体辐射光谱,而曲线下的面积就代表辐射的总功率,可以看到温度越高,曲线下的面积越大。
1893年维恩位移定律:
曲线的极大值对应的波长与温度成反比。
例如,最高的那条曲线是太阳的辐射光谱(太阳接近一个绝对黑体,其表面温度大约6000K),其辐射的峰值波长大约是480nm,(图上的颜色标记略有偏差。所以人眼能看见的波长范围一般是380nm-780nm,正好是太阳光的主要成分),而随着温度的降低,辐射的峰值波长也逐渐升高了。所以人体温度大约是310K,其辐射的波长就是10um左右,这就是为什么人体会发出红外光,而且与周围冷的物体发出的波长不相同,因此就有了夜视仪。
虽然这两个定律很好地描述了黑体辐射的实验结果,但显然是不完备的,我们想要知道整个黑体辐射光谱的函数形式。但如果不对热辐射的机制做出一些假设,就无法进一步具体化。那么辐射的机制到底是怎样的呢?换句话说,热的物体为什么一定要“发光”呢?这一问题其实是涉及到光的本质,根据经典电动力学的理论,振动的电荷必然会辐射出光子,所以热运动一定会导致辐射。我们已经知道,温度越高的物体运动越剧烈,可想而知,辐射也会更加剧烈,问题在于,温度与物体热运动之间又怎样具体的数学联系呢?因为物质包含了大量的原子,温度越高仅仅意味着统计上原子的平均动能越大,而并不能表示每个原子的动能的大小。(统计物理的部分将会在下一小节介绍)。只有知道了某一温度下一个物体所有原子的运动情况,才能知道辐射的情况。
事实上,这个问题用小学数学已经不能解决了,所以小编会略过有关细节。1896年,维恩从热力学普遍理论出发,将黑体谐振子能量按频率分布类同于麦克斯韦分布,得到了维恩公式,这个公式与黑体光谱的左半边上坡的部分符合得很好,但右半边对不上;1900年,瑞利-金斯利用经典电动力学和统计力学中的能量均分定理,得到了瑞利-金斯公式,这个公式和右半边下坡的部分符合得很好,但左半边对不上。这个公式在理论上找不出错误,但却在短波区与实验明显不符,这就是开头提到的那第二朵小小的乌云。由于短波区对应的是紫外线部分,因此这个问题又称为“灾难”。
同年,1900.10.19德国物理学会会议上,普朗克提出“一个幸运地猜出来的内插公式”,把维恩公式和瑞利-金斯公式拼凑了起来,使得在短波区使用维恩公式,长波区使用瑞利-金斯公式,这就是著名的普朗克公式。但是这个公式此时还没有任何实质的意义,只是一个数学游戏罢了,因为它不具有任何物理的机制。然而,仅仅两个月之后,1900.12.14普朗克发表了他对于自己猜出来的公式的理论解释,即能量量子假说,宣告量子力学的诞生。
那么,我们知道这些对我们理解热的本质有什么用呢?其实黑体辐射及其量子假说是关于统计物理的理论,也就是我们知道温度越高原子的热运动越剧烈,可是具体每个原子是怎样运动的呢,它们有一个随温度变化的分布,这就是用量子统计去描述的。由于这部的理论比较艰深,下面就简单介绍一下基于量子力学的知识如何解释固体的热容问题、绝对零度到底意味着什么等更深层次的有关热的认识。
我们先来回忆一下比热的概念,也就是使得1g物质升高1K所需的热量。但是之前也说明过,由于不同种类物质每个原子的质量不同,因此1g物质所含有的原子数目不同,比热容会有很大的差异。为了更好地体现热的物理本质,物理学上常常会用摩尔热容来描述,也就是1mol原子(即6.02*1023个原子)组成的物体升高1K时所需的热量。使用摩尔热容我们就会看到如下现象:
室温下的固体热容
大家会发现,似乎固体的摩尔热容都差不太多,都在3R左右(R是一个常数),这件事情在经典热力学里是可以得到证明的,它很好地说明了温度和原子运动能级之间的关系。吸热过程的微观实质就是大量原子获得能量,整体向高能分布移动的过程。
然而像金刚石,硼等材料却显著地低于3R,事实上实验发现固体的热容量随温度降低得很快,当温度趋近绝对零度时,热容量也趋于零。这些现象都是经典热力学所不能解释的,按照经典的理论,摩尔热容应该一直是3R才对。
1906年爱因斯坦利用普朗克的量子假说成功地解释了这一问题,即在低温下大量的原子被冻结在基态,这些原子不再能够参与吸热或放热的过程了,因而看起来有一大堆原子,实际上只有少量激发态的原子还能够正常工作。此外金属中存在自由电子,按照经典的理论,电子在金属中类似一种理想气体的存在,也能贡献相同的热容,也就是说金属的热容应该要比其他离子晶体的热容大一倍,但在实验上也没有观测到这一现象。这一问题是1928年由索末菲(这人虽然没得过诺奖,但是教导过最多诺贝尔物理学奖得主的人)利用费米-狄拉克统计(1926年提出)解决的金属中的自由电子气体问题:电子要想吸热变成更高能量的电子,需要极高的温度才行,所以正常情况下电子也是很少参与热容贡献的。
上述这些问题听起来比较艰深,最后我们再来说一下大家关心的绝对零度到底是怎么回事。在上一节我们已经说到,早在量子力学诞生以前人们就知道绝对零度这个界限了,这是从气体实验外推出来的。量子力学告诉我们,在绝对零度时,所有的原子都占据最低的可能的能量,但并不是没有能量,原子仍具有零点能的振动,这是这些能量(在目前已知条件下)不能再释放出来。
这里还有一个有趣的故事,1924年孟加拉青年玻色提出了著名的玻色统计,最初提交英国的杂志发表但被退回,他一气之下直接讲此稿寄给爱因斯坦,爱因斯坦立刻被吸引并亲自把它翻译成德文并帮助发表。此后爱因斯坦于1924-1925接连发表两篇文章预言了玻色-爱因斯坦凝聚,这个说的是对于玻色气体不需要达到绝对零度,只需要温度低到一定程度,所有的粒子就会全部占据能量为0的态,形成一个“凝聚体”。这个预言对于后来发现液氦超流体有着重要的作用,但直到1995年才真正在实验上实现了碱金属蒸汽的玻色凝聚,这些进展开创了多个物理研究的新领域。
六、熵与涨落——统计物理简介(1865-1912)
在上一节我们说明了,处于热运动的物体无时无刻不在发着光,并初步涉及了量子统计的结果,这一节我们就来更具体了解一下什么是统计,熵又是什么,以及跟涨落又有什么关系。
统计在数学中大家从小学就开始学习,是用于描述一个群体中的数字特征,比如平均分、中位数等等。那么在热力学中,统计就是描述一群粒子的能量特征的,说白了就是在某一温度下处在不同能量下的粒子各占多少比例。在经典热力学中认为粒子是服从麦克斯韦-玻尔兹曼分布的,但是在量子力学中认为服从玻色-爱因斯坦分布,而费米子服从费米-狄拉克分布,这两种分布在高温极限情形下都可以过渡到麦克斯韦-玻尔兹曼分布。费米子包括夸克、电子、质子、中子等等,而玻色子包括光子、介子、氘核等等。
玻色子
麦克斯韦-玻尔兹曼分布
这些统计分布规律非常重要,它比我们仅仅去说“原子热运动的平均动能与温度成正比”信息量要大得多,从这些分布我们在上一节也解释了固体热容等等问题。现在我们要隆重介绍一个热力学中的统计量——熵。
1865年,在提出了热力学第一第二定律十五年之后,克劳修斯又引入了熵的概念,克劳修斯创造了一个词“entropy”,含义是“转变能量”,起初这个词只是为了描述吸热放热过程的一个态函数,其定义是元过程吸热量(或放热量)除以此过程的温度T(热力学温标)然后再对过程积分(由于热力学温度T永远是一个正数,所以任何吸热过程都是熵增过程,任何放热过程都是熵减过程)。1923年,普朗克来中国讲学时讲到“entropy”,胡刚复先生将它翻译为“熵”:两数相除谓之“商”,而“entropy”的本义是“热”与“温”相除,可称为“热温商”,加“火”字旁表示热学量。
克劳修斯提出的“熵”的概念又称为“热力学熵”或“宏观熵”,不过对于大多数读者来说,可能更熟悉“熵”的另一种含义,即对于无序度的衡量,又称为“微观熵”。1877年,玻尔兹曼提出了熵的统计物理学解释,用著名的玻尔兹曼公式描述了“微观熵”(S=klnΩ)(S是熵,k是玻尔兹曼常数,Ω是微观状态数),简单说来就是“微观状态数”越多,熵就越大,这两种“熵”的定义是完全等价的。
讲到这里,必须要举出一些简明的例子来说明一下所谓的“微观熵”和“无序度”是怎么回事了。首先说明什么叫“微观状态数”:在量子力学中,微观状态数是微观粒子可能占据的能态的数目,这也是后来玻色-爱因斯坦统计和费米-狄拉克统计的依据;虽然在玻尔兹曼的年代,量子力学还未出世,但他仍然采取微分的方法把连续的能量划分成很多能级。对于一个确定的宏观态,所有可能的微观状态的数目就称为“微观状态数”,我们可以用如下例子来直观地理解:
假如有一个盒子里面放了一个隔板,左边有两个气体分子,右边什么也没有。现在这两个分子就只能处在左半边的盒子里,这种宏观态的微观状态数目就是1。现在我把挡板抽掉,气体“充满”了整个盒子,两个分子有可能出现在盒子的任意位置,于是出现了4种可能的情况,如图所示。这种宏观态的微观状态数目就是4。显然,熵变大了。那么从第一个宏观态到第二个宏观态发生了什么呢?这个过程平时也很常见,就是气体膨胀的过程,例如给气球放气,就是把限制在气球里的分子释放到整个大气中去,相当于这里我们抽掉了挡板。把关在气球里的“失去自由”的气散布到整个大气层去,显然是一种无序度增加的行为。
当然严格来说,这个简明的例子带有一定的误导性,因为微观状态其实是粒子在相空间占据的盒子,而不是我们直观的3维空间占据的盒子,但我们仍然可以用它来理解熵对于无序度的描述:熵低,也就是可能是微观状态数目少,就意味着“整齐”和“集中”(如果问你的房间的一个东西在哪?你很肯定地说在柜子里,那说明你的房间很整齐,状态数目少);熵高,也就是可能的微观状态数目多,就意味着“混乱”和“分散”(你说那个东西可能在柜子,可能在床上,可能在桌上,说明你的房间状态数目很多,很混乱)。例如,固体融化为液体是熵增过程,因为固体的结晶要比液态的整齐有序(从克劳修斯熵我们也已经阐述过,吸热过程一定是熵增的,所以固体融化是熵增过程);又如,把一碗沙子掺到一碗米里去,这和把气球的气放到大气里来是类似的,都是熵增加的过程。
现在我们给出两个判断熵的高低的实用的结论:
一个物理过程如果吸热,其熵必增加,反之亦然。
这一点因为我们已经在前面阐述过,吸热就意味着熵增,放热就意味着熵减,这是从宏观熵的角度理解;另一方面,根据统计物理学,也就是我们前几节花了很大篇幅所讲的温度的本质,如果一个物体吸热导致自己温度升高,不仅意味着微观粒子的动能大,也意味着所有粒子的分布范围更广,能级更多,所以微观状态数目也越多,熵就越大。当温度达到绝对零度时,所有的粒子都被冻结在了自己固定的能态上,此时微观状态数目是1,熵就变成了0(这是1912年能斯特提出的热力学第三定律,也叫“0K不能达到定律”)。
如果一个杯子被打碎了,从微观熵的角度而言,事物变得无序,组成杯子的原子的可能的量子态也变多了,所以是一个熵增过程;从宏观熵来看,杯子不会好端端地碎掉,它一定是被你摔碎的,这就意味着你需要给它一定的速度或者能量,使得杯子的原子之间的化学键断裂,然后彼此分离,就碎掉了,这个过程一定是吸热的。
一个绝热系统的熵永远不会减少。
这就是著名的熵增加原理,也是热力学第二定律的又一种等价表述。这一原理可能是比能量守恒更重要的我们宇宙的运作方式。
一杯热水放着自己变凉,熵不是减少吗?没错,根据我们的第一个结论,热水变凉是放热过程,其熵必然减少,但要注意我们第二个结论的前提是绝热系统,在这个情况里水杯不是绝热系统,而是水杯和周围的空气构成了绝热系统,水的熵减少了,但空气的熵增大了。并且进一步我们还可以证明,空气增加的熵要比水减少的熵更多一些:从克劳修斯熵的定义出发,由于水的温度比空气的温度更高,所以对于任一过程水损失的熵(热温比,放热量比上水的温度)都要比空气获得的熵(相同的吸热量比上空气的温度)更小一些。所以,整个水和空气组成的系统是熵增加的。
于是还有人会问:如果把一个绝热的气缸压缩到很小,按照你之前的例子,这些气体不是变得更加“整齐有序”了吗?这里我们要注意,这就是我之前说到我那个例子带有一定误导性的原因,因为在这里气体被压缩到更小的空间,的确在空间上是更加有序了,但微观状态的“空间”是“相空间”而不仅仅是“三维坐标空间”,相空间是六维的,包括“三维坐标空间”和“三维速度空间”,你对气缸绝热压缩后,气体的温度必然是升高的,这意味着气体分子的能量分布更广,在“三维速度空间”里变得更加无序了,而总体而言这个绝热过程既没有吸热也没有放热,从克劳修斯熵来看熵没有发生变化。
人们公认,热力学第二定律和熵的概念在物理学中是最难得的部分,历史上围绕这它们有关不少疑虑和诘难。现在我们来讲解两个著名的诘难或佯谬,并介绍“涨落”的概念。想要更深刻理解热的本质,“涨落”是绕不开的概念。
什么是涨落呢?英文原意其实就是“波动起伏”的意思,中国的翻译总是似乎含义更加深远一点,苏轼有诗“涨落随高低”。我们常用海平面来衡量一座山的高低(海拔),但海真的是一个平面吗?我们都知道海有涨潮,也有落潮,海水有时候高,有时候低,所以海平面其实是一个平均的概念。这种在平均值附近的波动就称为涨落。
涨落在热力学中有着重要的意义。它的发现源于1876年洛施密特对熵增加原理的诘难:假如有一个容器里装有气体分子,在某一时刻,上帝决定让所有的分子一齐向后转(不相信上帝的同学也可以认为是加上一个反射壁,使所有的分子反弹),即速度反向,按照微观运动的可逆性,每个分子都将回溯原来的轨迹,正像“倒放”一样,那正放是熵增的,反过来可不就熵减了吗?事实上,根据现代计算机的模拟,这种事情的确是会发生的,有时候一个绝热系统的熵的确会减少。因此玻尔兹曼也修正了熵增原理,绝热系统并不一定每时每刻都是熵增的,偶尔也可能熵减,只是对于宏观系统,它增加的概率比它下降的概率大得多,即使达到了热平衡的温度系统,熵也会存在一定的“涨落”。
对于这一现象我们需要认识的内涵就是,热力学、乃至整个宇宙的运作规律,是统计学意义上的,如果考察的样本太小,就存在很大的随机性,例如在一杯冷水里挑出一个分子来,很可能比一杯热水里挑出来的一个分子要运动得剧烈的多。
任何物理量都存在涨落,包括宏观物质的密度、体积、电阻,微观的辐射、运动等等是如此。前面提到的1905年爱因斯坦对布朗运动的解释其实就是对无规则运动的涨落进行的分析。
七、熵与信息——麦克斯韦妖(1871-1982)
第二个著名的佯谬是物理学四大神兽之一的“麦克斯韦妖”,是麦克斯韦在1871年提出的一个思想实验,它比前一个诘难要更早提出,但直到一百多年后才被解决。
麦克斯韦妖说的是这么一种精灵:它能观察到所有分子的轨迹和速度,并且控制一个无摩擦的绝热阀门的开关。现在加入阀门两边一边是温度高的气体,另一边是温度低的气体。由于之前我已经说了,温度低并不代表所有的分子运动都运动得更缓慢一些,其中也有很多速度快的分子,这个小妖做的事情就是,看准时机,在冷的气体这边有高速分子向阀门运动时,就把阀门打开,然后立刻关闭。这样经过一段时间之后,冷气体中的高速分子都到了热气体中,宏观效果就是冷的气体变得更冷,热的气体变得更热了,可以计算整个系统的熵是增加的(计算方法与我之前讲的热水放在空气中变冷这个例子一样)。显然,这个妖的存在使得热力学第二定律受到了破坏。
其实即使你没有学过任何物理学,也一定会觉得这里面有蹊跷,这个妖的存在一定干预了某些物理过程。但是在物理学中,经常会有这样智能的理想生物假设,它表明上的确没有带来任何影响,除了能够观察到微观分子之外,与人的智能并无多大差别,所以要想发现其中的问题,的确不是容易的事情。自麦克斯韦妖被提出以来,各大物理学家也跟大家一样,不相信麦克斯韦妖能够违反热力学第二定律,这里面一定还有没想清楚的地方,但说不上来是哪里不对劲。1912年,波兰物理学家斯莫卢霍夫斯基提出了一种单向阀门模型,即用一个只能向右打开的阀门替代小妖,这个阀门只有在受到高速分子撞击时才会打开,这样也能实现麦克斯韦妖的效果,并且避免了智慧精灵的介入。但是很快斯莫卢霍夫斯基自己就意识到,由于阀门很小,在经历几次撞击之后,它自己的温度就会升高,做起布朗运动,单向阀门就会变成双向阀门,气体分子也能从右边回到左边了。
1929年匈牙利物理学家西拉德提出了一个重要的思想实验,他将事情变得简单:一个盒子里只有一个气体分子,小妖只需要判断气体分子在盒子的左边还是右边,如果在左边就插入中间的挡板,然后在左边加上重物,让分子等温膨胀对外做功,在右边也是类似。这样从单一热源吸热做功而不引起熵增的违法热力学第二定律的。可以证明,上述引擎产生的功最多为kTIn2(ln2是什么大家想想?在玻尔兹曼熵公式里,本例中微观状态数不就是2么?“左边”或“右边”)。熟悉计算机的同学会敏锐地发现,这种判断分子“要么在左边”“要么在右边”的信息,就是二进制的思想。事实上小妖所获得的信息就是“1bit”。换句话说,1bit的信息最多产生的能量,这是人们首次建立信息与能量的关系。西拉德认识到,麦克斯韦妖的介入参与了两个与信息有关的重要过程:测量过程和存储过程。但是到底是哪个过程以怎样的方式产生了熵增,他并没有给出有说服力的解释。
西拉德思想实验
1948年,香农借用热力学熵提出了“信息熵”的概念,提出了“bit”的概念,建立了信息论,开创现代信息科学。“信息熵”与“热力学熵”有着千丝万缕的联系,所谓“信息”,就是表示事件的可能性,非常类似热力学熵里的“微观状态数”。例如,我们说:“他被狗咬了”,或者说“他把狗咬了”,这两句话字数虽然一样多,但是后者是很小概率发生的事件,所以后者的“信息量”更大一些。所以有时候我们在网上看些段子说到:“信息量好大”,这是有着信息论的科学依据的。
1961年,IBM的兰道尔在信息论的基础上提出兰道尔原理,终于从原理上解决了麦克斯韦妖问题。兰道尔指出,擦除1bit信息至少需要消耗kTIn2功并向环境释放相同的热量。事实上,1982年兰道尔在IBM的同事本奈特证明了测量、读写复制等数据操作原则上可以不消耗能量也不导致熵增,唯有擦除信息属于逻辑上不可逆操作,需要能量,自此麦克斯韦妖的底细算是彻底被揭穿了(1951年大名鼎鼎的物理学家莱昂·布里渊,曾因在固体物理学中的研究而提名诺贝尔物理奖,他发表的论文一度使人们相信,麦克斯韦妖对分子信息的测量过程必然会导致能量耗散和熵增,他认为测量分子的信息必须要使用一个微型光源或发射一束电磁波去探测,由此证明了熵增的下限。自此之后人们误认为麦克斯韦妖已经被解决,这一说法在国内的某些权威教科书以及许多科普资料中还作为麦克斯韦妖的最终结论予以保留,但实际上在1982-1987年贝纳特和兰道尔的多篇论文中已经证明了测量过程原则上不需要消耗能量,甚至可以进行无限的计算)。
在西拉德思想实验的模型里,兰道尔原理可以做如此解释:当气体等温膨胀对外做功后,虽然盒子和环境组成的热力学熵好像没有增加,但小妖对于“分子在哪边”这件事的信息丢失了——信息熵增大了,也就是说他原本知道的“左边”或“右边”已经变成无效的信息,需要予以擦除,擦除的过程会消耗等量的功,这样系统又恢复了初态,整个循环的净功为0。当然,如果说不擦除信息,让小妖每一次循环都把信息记录在新的存储单元,也是可以的,这样系统不断对外做功,热力学熵表面上没有增大,但信息熵一直在增大,第二类永动机是不能造出来的——兰道尔原理可以说在一定程度上揭示了热力学熵和信息熵的等价性(事实上,信息熵应该是广义的热力学熵,热力学熵是一种特殊的信息熵)。
从最根本的角度来看,信息是大脑或计算机记忆库的某种有序状态,亦即某种低熵态。当我们获取信息的时候,信息熵减少,并且我们可以利用这种信息去“暂时地违反”热力学第二定律,但我们的信息熵随之增加了,而迟早有一天这些增加的信息熵要演化成为热力学熵(信息擦除的过程),因而热力学第二定律整体来看是没有被违反的——这和“涨落”非常类似,热力学第二定律是宏观的长期的统计效应,它不会在乎一时的得失,允许自己有“短暂地”失效的时候。有关计算与耗能的问题我们会在最后一小节再次讨论。
最后,我们回到麦克斯韦妖的原始模型,即小妖控制阀门的开关。小编依据兰道尔原理对此的解释如下:现在小妖头脑里掌握了大量分子的信息,例如,它知道任意时刻这些分子的位置和速度,并可以推算出它们之后的轨迹。当它允许一个高速分子通过阀门后,它对这个分子掌握的原有信息就失效了,也就是它的信息熵增大了。虽然因为它的智能可以重新测量这个分子在阀门另一侧的信息,但是这个新的信息:要么存在新的存储单元,要么存储在原有的单元。前者意味着,原来的信息熵仍然是增大的,新的测量与原来的信息熵是无关的行为,因而信息熵的增大弥补了系统热力学熵的减少;后者意味着,必须要擦除原有单元的信息,根据兰道尔原理,这会像环境释放热量导致熵增,并且一定不会少于系统在这一过程中的热力学熵的减少。
总而言之,热力学第二定律仍是我们宇宙中颠扑不破的真理,麦克斯韦妖终究逃不出其手心。
八、玄幻之旅——热宇宙模型
在克劳修斯和开尔文提出热力学第二定律,也就是熵增定律后,“热寂说”的思想笼罩了欧洲大地。
我们是不是会发现,我们生活中的所有能量似乎都在像热能转换?我们烧了一壶水,天然气的化学能变成了热;我们玩了一下电脑,所消耗的电能变成了主机的热;我们开了一盏灯,灯辐射的光子不断反射,最终引加热了周围的物质而耗散殆尽;甚至当我们运动了一下,所有消耗的能量最终都变成了热。想到这些,抽了根烟冷静一下,宇宙的热又变多了一些。根据熵增加原理,是不是宇宙最终的命运,就是所有的能量都释放完了,全都变成了热能,整个宇宙变成了一锅均匀的稠密的汤,整个达到了热平衡,宇宙中再也没有任何可以维持运动或是生命的能量存在?这种说法就是“热寂说”。
来源:onely
在这一节,我们把热的认识放到整个宇宙来考虑,探讨一下宇宙的起源和命运。这一节我们刚好可以利用许多前面几节所讲过的知识来解释我们的宇宙。
宇宙在膨胀并且在加速膨胀,今天看来已经是无可争议的事实。然而,根据牛顿的引力定律,所有的星体都相互吸引,那么静态的宇宙很快就会开始收缩。然而,静态宇宙的观念是如此之强,甚至于1915年爱因斯坦在提出伟大的广义相对论时,仍在方程中引入一个所谓的宇宙常数来修正自己的理论,使静态宇宙成为可能。宇宙必须在膨胀——这一早该在300多年前就由牛顿定律预言的事情直到1929年才被哈勃观察到的星系红移现象证实。宇宙在加速膨胀,意味着在很久很久以前(根据宇宙膨胀的速度可以推算出是在一两百亿年前),宇宙可能处在一个高温高密的状态。这就是1946年伽莫夫提出的宇宙大爆炸假说。1964年美国科学家彭齐亚斯和威尔逊偶然中发现了宇宙微波背景辐射,强有力地支持了宇宙大爆炸理论,他们也因此被授予诺贝尔物理学奖(在物理学界,理论的提出者没有获奖,而找到支持理论证据的人获奖是常有的事)。
大爆炸以后早期(大约0.1ms)的宇宙结构比现在简单地多,那时宇宙是由极高温的热辐射组成的“羹汤”,整个宇宙是均匀的,处于热平衡。在此后的时间里,宇宙逐渐膨胀和降温,它的组分逐渐脱离热平衡状态。那么宇宙是否会像“热寂说”说的那样再次回到热平衡态呢?《时间简史》中描述了我们宇宙的两种可能的命运:从大爆炸还是膨胀,到某一临界点后在引力的作用下开始收缩,再次回到宇宙早期的状态(大挤压);或是引力无法抵挡膨胀的速度,宇宙永远地膨胀下去(开放宇宙)。目前所有的证据都指向,我们的宇宙可能会永远地膨胀下去。
多少年来,人们总感到对“热寂说”的批判说服力不强,隔靴搔痒,未中要害。现在我们看到,由于宇宙在膨胀,它的组分会相互脱耦,从热平衡向非平衡态发展,从温度均匀到产生温差。并且由于宇宙很可能永远膨胀下去,这种不断向着不平衡发展的趋势不会停止。这种现象在静态宇宙模型下是不会发生的,膨胀的宇宙以出乎前人意料地方式冰释了“热寂说”的疑团,热力学第二定律也不会因此背上使宇宙走向衰亡的罪名。
此外,根据热宇宙模型,我们的宇宙早已经由辐射统治转变为由物质统治,现在的宇宙里万有引力起主导作用。而引力系统是具有负热容的不稳定系统,这一点也否定了“热寂说”的成立。简单来说,引力系统的特点是不稳定性,比如某处因涨落密度稍有增加,那里就会对周围物质产生较强的吸引力,吸引更多的物质靠拢过来,使局部的密度进一步增大。于是在本来均匀的宇宙中逐渐聚结出一些尺度不同的团块,来形成星系、星系团、超星系团等结构。
那什么是负热容呢?我们说微观粒子的动能越大,宏观上表现为温度越高;但是对于引力系统恰恰相反,得到能量时动能减少(例如人造卫星想要切换到更高的轨道上去,就要获得能量,到了更高的轨道上速度更慢,动能更低,但是势能增加;陨石坠入大气层后,空气阻力的作用不是使其减速,反而是加速,也是同样的道理),因此称为负热容。具有负热容的系统是不稳定的,它没有平衡态:宇宙中的均匀物质凝成团块,从均匀分布到不均匀分布,引力势能转为动能,虽然在三维坐标空间里变得“有序”了,但在三维速度空间里变得“无序”了,总体而言是熵增了,由于不存在平衡态,熵没有极大值,它的增加是没有止境的——也就是说,“热寂说”所描述的那种所有物质达到热平衡的状态不是熵最大、概率最大的状态,熵会永无止境地增长下去,热平衡是不可能实现的。
引力系统的负热容不稳定性还体现在,当有的恒星核燃料耗尽后,它们不但不冷下来,反而在急剧的引力坍缩过程中产生大量的光和热,这就是天文上观测到的超新星爆发。1862的人们发现了“白矮星”,白,是说其温度高;矮,则是体积小,根据引力系统的负热容不稳定性,物质会有向一块集中的趋势,但是正常的恒星不坍缩,是因为其内部的核反应产生的辐射压与引力向抗衡;但当红巨星的能源耗尽后,恒星走向了生命的末端,引力会使星球迅速坍缩。那为什么没有坍缩到更小的球去呢?1928年,一位印度研究生钱德拉塞卡在前往剑桥的船上开始思考这个问题,他意识到电子的简并压力(有一些粒子是有排它性的,这种粒子间的相互排斥力即简并压力)是有极限的,并于1933年提出了钱德拉塞卡极限:形成白矮星的最大恒星质量为1.44个太阳质量。50年后的1983年,瑞典皇家科学院为此授予了他诺贝尔物理学奖。
那么超过钱德拉塞卡极限的恒星会发生什么呢?1932年查德威克发现了中子的存在,同年朗道预言了由中子气体组成致密星的设想。1939年奥本海默计算得到了奥本海默极限,大体在2-3倍太阳质量的恒星会形成中子星。与白矮星的发现过程不同,白矮星发现之后几十年人们才弄清楚是怎么回事,而中子星被预言了三十多年后,人们才意外地发现了脉冲星,并惊喜地确认这就是理论物理学家早已预言的中子星。超过奥本海默极限的恒星,就连中子简并压也无法抵挡,在物理学中再也找不到其他力量能够抵挡恒星继续坍缩,这就形成了“黑洞”。
黑洞的第一张照片,来源nasa
早在1915年爱因斯坦提出广义相对论的次年,史瓦西就通过爱因斯坦的场方程发现了一个真空解,这个解在1969年被美国物理学家惠勒命名为“黑洞”。2019年人类首次拍到了“黑洞”的照片。黑洞是一个奇点,这个点由于引力的作用会把所有视界边界内的物质都吸进来,就连光也无法逃脱。由于这种特性,黑洞的质量似乎只会增大而不会减少,直到最后宇宙变成一个个黑洞、相互合并,最终变成一个奇点?这会是宇宙最终的命运吗?黑洞使宇宙其他地方的质量在减少,并且也使熵减少。
但是由于人们坚定地相信热力学第二定律,霍金等人终于发现黑洞其实也不是那么黑,它也会向外蒸散和辐射,由于不同的机制,但它的辐射刚好和黑体辐射一样。并且黑洞的温度只与质量有关:质量越大,温度越低,黑洞的蒸散和辐射恰好能够维持热力学第二定律不被违反。黑洞的辐射使得引力坍缩不像人们曾经认为的那样是不可逆转的,考虑量子效应后,黑洞似乎最终会蒸发并消失掉。宇宙从非常热的状态下开始随膨胀而冷却,这是我们今天的宇宙图像。宇宙是否有一个开端或终结呢?没有人知道。
九、回到现实
漫长的热力学之旅终于结束,相信大家一定对热的理解丰富了许多,但又有些眼花缭乱,来总结一下:
热的本质是组成物质的原子分子的微观运动,热运动包含有动能和势能两部分,其宏观体现通常表现在两个方面——“热量”和“温度”。“热量”代表“热”的多少,其本质是微观粒子运动的总能量;“温度”代表“热”的强度,其本质是微观粒子运动的平均动能。
不同物质的密度、原子质量等因素的不同,分子之间相互作用力导致的势能不同,因此同温度同体积下,尽管每个原子的“动能”是相同的,但整块物质所含有的“热量”却不同。
现在我们来用以上学到的知识解释一些生活中的热现象,并且我会指出其中的道理主要来自以上的哪一章节,方便大家复习巩固。我们以问答的形式,从简单的问题开始逐渐增加难度:
平时吃食物的“热量”指的是什么?
减肥的朋友一定都会在吃食物之前关注一下“热量”这一参数。食物的“热量”一般指的是单位质量的食物被完全分解或完全吸收后所放出的能量,其单位一般是焦耳或卡路里。1卡路里=4.186焦耳,卡路里是啥呢?就是在大气压下将1g水升温1℃所需的能量。诶?这不就是热功当量嘛(见第三节)!焦耳测得的热功当量是4.154焦耳。为什么差了一点呢?除了实验精度以外,还因为如今的摄氏温标已经根据热力学温标进行修正了(见第二节和第四节),也因为水在不同温度下的比热容也是不一样的,所以常有“4度卡路里”“20度卡路里”等说法,这里1卡路里=4.186焦耳采用的是“15度卡路里”,即水从14.5℃升温到15.5℃时所需的热量。
为什么摸同温的金属感觉比木头更冷?
这是我们在文章开头就提到的问题,一般的解释就是金属的热传导速率更快,所以你手上的热量会更快地流入金属中,因而感觉冷。在我们学了整个热学之后,我们可以进一步指出,金属的导热性高是因为金属中存在自由电子气体(见第五节),而“气体”的导热性当然远远好于固体。在非纯金属或固体合金中,电子会频繁与晶格和杂质发生碰撞,这时热传导的主要贡献来自一种称为“声子”的准粒子。“声子”是描述晶体格波的一种虚拟粒子,大家可以把它理解为通过固体需要通过“声子”来进行热传递(所以这么看,“热质说”并没有完全错吧!)。而在金属中,电子的导热性远远超过“声子”,固体物理学还告诉我们,金属的电导率与电阻率之比与电子温度成正比且只与温度有关(所以电阻率低的金属其电导率也低,大家可以查一查是不是这样,银是常见金属里最低的),这一结论进一步支持了电子气体作为电荷和能量载体的模型。
微波炉为什么不能加热金属?
严格来说,这是一个光学问题。如果大家看古装剧就会发现,古人的镜子多为铜镜,也有金镜、铁镜、银华镜等,玻璃镜要到清代以后才出现。为什么金属多是亮晶晶的呢?这也由于金属中存在自由电子气体,当光(电磁波)照在金属上时,表面的电子气被加热,阻碍光继续向前传播,光就被反射了。被加热的表层的深度就称为“趋肤深度”,光的波长越长(频率越低),趋肤深度越大。简而言之,金属对光的截止频率在紫外波段,也就是说对于可见光、红外光、微波等波段都是会强烈反射的,这也是某些安检的金属探测器的原理。回到问题,如果把金属容器放入微波炉,由于微波无法穿透金属,不仅无法加热容器内的食物,反而会由于金属的反射在炉内形成驻波场,造成着火、爆炸等危险!
补充一点额外的有关微波炉的知识,相信大家都有这样的经验:有时候食物会均匀地被加热、有时候内热外冷、有时候内冷外热,这是怎么回事呢?这是由于微波的穿透能力也是有限的,并且不同物质对微波的吸收能力也不一样。如果食物的表层很干燥,内部含水量很多,就可能导致内部对微波吸收多,出现内热外冷的情况;而如果食物放得太多,微波无法完全穿透,就可能出现内冷外热的情况。
保温瓶为什么要镀银?
保温瓶中的水散热主要有两个途径:热传导和热辐射(见第五节)。影响保温瓶的保温效果的因素主要有两个:一是真空层,一是镀银层。真空层是为了使水处于真空环境中,因而无法通过空气分子的热传导散热。而银对于大部分波长的辐射都是高反射率的(见上一个问题),能够将水发出的热辐射反射回去被水重吸收,提高保温效果。
空调和冰箱的原理是什么?
空调和冰箱这种设备的功能简单来说就是:让冷的更冷,热的更热。这和麦克斯韦妖实现的功能是一样的,不过空调冰箱远远没有那么智能。它们需要一种介质(例如氟氯昂)在两个热源之中循环传递热量,以空调制冷为例:高温高压的气态氟氯昂在户外放热(所以空调热机吹出热风),变成常温高压的液态氟氯昂,然后回到室内机,通过增大体积的方式吸收室内的热量(见第四节的气体定律:先是体积增大导致压力减小,变为气态吸热),变成低温低压的气态氟氯昂,再由压缩机压缩回高温高压的气态氟氯昂,完成循环。
空调的功耗主要在压缩机对氟氯昂的压缩,它使得热量从低温物质流向高温物质的循环得以完成,但代价是需要外界提供能量,正是由于热力学第二定律的存在(见第六节),才使得我们要多花这么电费去开空调。
最后,CPU为什么会发热?
这个问题可能是最贴近各位读者日常生活的问题了,也可能有的人会说:“所有的用电器都在发热嘛,这很正常。”关于这个问题我会从理论和技术两个层面给出解答。
计算机被认为是一种可以消耗能量以进行数学工作的引擎,从一开始人们就想知道这种引擎的效率是否有一个最基本的热力学限制。1949年冯·诺依曼在讲座中认为在温度T下处理每个bit,计算机至少消耗能量kTIn2。50年代布里渊的光子探测思想也印证了这种观点(见第七节)。然而,1982年贝纳特指出,原则上利用的能量可以进行任意大量的计算。但是,他和兰道尔也指出,逻辑不可逆操作(例如擦除数据)每bit必须要消耗kTIn2的能量。
图片来源:f1000
由于我们的CPU不可能无限制地缓存信息,我们在高速计算的时候必然要擦除上一个计算过程中存储单元的信息,因而兰道尔原理给出了我们计算的理论热力学能耗下限。兰道尔原理的直接结果是摩尔定律在理论上的终结(虽然早在理论下限达到之前,摩尔定律早已因各种技术原因趋于终结),因为材料的散热性能是有限的,芯片的集成度不可能无限地提高下去。当然这只是能耗的理论下限,虽然贝纳特指出了几种在零速率下实现解决零耗散的热计算机模型,但实际上现在的微电子元件每bit的能耗都要比kTIn2大一亿倍以上。DNA也是一种信息载体,据估计,DNA中复制每1bit的能耗仅20-100kT,效率比现在的计算机高几百万倍。
下面我们就来解释一下,CPU为什么会比理论效率低了那么多——要知道,白炽灯的发光效率为10%左右,而LED灯的发光效率为90%左右(LED把电能的90%用于发光,10%用于发热,所以你摸LED几乎是冷的),相比之下,CPU的计算效率基本是0(相比于兰道尔擦除下限),这要从CPU的结构说起。
CPU的基本组成单元是逻辑门,而其对应的物理实现的基本单元是晶体管。1947年,美国贝尔实验室的巴丁等人发明了晶体管,并获得1956年的诺贝尔物理学奖,而巴丁是历史上唯一一个两次获得诺贝尔物理学奖的人,他在1972年又因为超导BCS理论被授予了诺奖。以半导体材料制成的晶体管成为今天集成电路的基本元件也是核心元件,也是CPU发热的主要部件,因而我们要看一下晶体管的结构。注意我们平时用到是词汇“二极管”、“三极管”、“CMOS”等等都属于晶体管的范畴,在这里我们简要看一下二极管及其构成的基本逻辑门电路:
二极管的核心构成是PN结,通过两块由不同杂质掺杂的半导体材料密接形成,由于半导体具有一定的金属性质,其中的电子和空穴也会像自由气体一样互相扩散,由此形成电荷势垒,直到内建电池和热压力平衡,这样形成的PN结具有单向导通性质。由两个二极管和一个电阻可以形成这样的“与门”基本电路,电阻上端加电压(+5V),在计算机中代表“1”,当A端和B端都输入“1”时(加5V电压),二极管截止,F端体现为+5V,即“1”,而当A和B只要有一个变为“0”(对应电压为0),二极管就会导通,电流从电阻流经二极管,F端体现为0V,即“0”,这就实现了一个基本的逻辑运算。
而CPU的每一步运算都是由无数的这样的逻辑运算完成的,也就是说,每一bit的数据操作都是由大量电荷的转移来代替的,这种替代显然的非常低效的。我们来做一个简单的计算,假设R是1MΩ,假设CPU的指令周期是0.2ns(对应CPU的主频是5GHz),忽略二极管的电容效应,在这0.2ns内R的发热量大约是5*10-15J,而考虑实际情况和宏观效应后发热量要远远比这多,相比之下,室温下kTIn2大约是3*10-21J,比之小了百万倍。更直白地说,CPU之所以要发热这么多,是因为用于计算的介质太庞大了,假如逻辑门的每次运算只需要1个电子的移动(按照上述估算,0.2ns内转移的电子数目大约有六万多个),那么代价将会小得多。
附:热力学大事年表
1593年:伽利略发明验温器
1662年:玻意耳定律
1714年:华氏温标建立
1732年:布尔哈夫疑难
1742年:摄氏温标建立
1787年:查理定律
1802年:盖吕萨克定律
1827年:布朗运动被发现
1834年:克拉伯龙建立理想气体温标
1848年:开尔文建立热力学温标
1849年:焦耳精确测得热功当量
1850年:克劳修斯提出热力学第一定律和第二定律
1851年:开尔文重述热力学第二定律
1859年:基尔霍夫辐射定律,麦克斯韦分布
1865年:克劳修斯引入熵的概念
1869年:玻尔兹曼推广得到麦克斯韦-玻尔兹曼分布
1871年:麦克斯韦提出麦克斯韦妖
1876年:玻尔兹曼提出“涨落说”
1877年:玻尔兹曼提出玻尔兹曼公式
1879年:斯特藩-玻尔兹曼定律
1893年:维恩位移定律
1896年:维恩公式
1900:瑞利-金斯公式,普朗克公式,普朗克量子假说
1905年:爱因斯坦解释布朗运动
1906年:爱因斯坦用量子假说解释固体热容问题
1912年:能斯特提出热力学第三定律
1915年:爱因斯坦提出广义相对论
1924年:玻色提出玻色-爱因斯坦统计
1925年:爱因斯坦预言玻色-爱因斯坦凝聚
1926年:费米-狄拉克统计,拉夫尔·福勒解释白矮星
1928年:索末菲解决金属中的自由电子气体问题
1929年:西拉德思想实验建立信息和能量之间的关系
1931年:拉夫尔·福勒提出热力学第零定律
1933年:钱德拉塞卡极限(电子气体:白矮星)
1939年:奥本海默极限(中子气体:中子星)
1946年:伽莫夫提出宇宙大爆炸假说
1948年:香农将热力学熵引入到信息熵,创立信息论
1961年:兰道尔提出信息擦除原理
1964年:宇宙微波背景辐射被发现
1969年:惠勒将爱因斯坦场方程的一个真空解命名为黑洞
1974年:霍金提出黑洞蒸发理论
1982年:贝奈特证明测量过程理论上可以不消耗能量
1995年:玻色-爱因斯坦凝聚被证实
2019年:人类拍摄到首张黑洞照片
①凡本网注明"信息来源:热传商务网"的所有文章,版权均属于本网,未经本网授权不得转载、摘编或利用其它方式使用。
②来源第三方的信息,本网发布的目的在于分享交流,不做商业用途,亦不保证或承诺内容真实性等。如有侵权,请及时联系本网删除。联系方式:7391142@qq.com