书城现实数学心
18217400000505

第505章 巨大的惊奇: 反物质

现在是坏的一面。

狄拉克方程由四个分量组成。也就是说,它含有四个分离的波函数以描述电子。正如我们刚才讨论的,两个分量具有诱人和直接的成功解释,它们描写电子自旋的两个可能方向。相比之下,额外的一对分量乍看起来是很有问题的。

事实上,额外的两个方程含有负能的解(对自旋的任意一个方向)。在经典(非量子)物理中,额外解的存在会令人为难,但不一定是灾难性的。因为在经典物理中可以简单地不选用这些解。当然这样做回避了为什么大自然不选用它们的问题,但这是一个逻辑自洽的做法。在量子力学中,这种选择恰好是不能用的。在量子物理学中,一般地讲,“不禁戒的那些都是必须要的”。在手边的这个具体例子中,这一点是非常具体和精确的。在适当的情形下,电子波动方程的所有解都代表着电子的可能行为。在狄拉克方程中,从电子的其中的一个正能解出发,你就可以计算出它放出一个光子并跃迁到其中的一个负能解的速率。总体上,能量必须守恒,但那不成问题——它只不过意味着发射出的这个光子的能量会比放出它的电子的能量还要高!不管怎么说,这个速率快得离谱,比一秒短得多。所以你不能总是忽略负能解。由于从来没有观测到过电子异常地放出比它初始的能量还要多的能量,基于这一事实,狄拉克方程的量子力学存在着一个严重的问题。

狄拉克非常清楚这个问题。在他的原始论文里,他简单地承认道:“对第二组解W(能量)为负值而言。在经典物理中可以通过随意舍弃W为负的那些解来克服这个困难。在量子理论中则不能这么做,因为,一般地说,一个微扰会引起从W为正态到W为负态的跃迁。……所以这样得到的理论仍然只是一种近似,但它似乎在没有随意假设的情况下,已能足够好地解释所有的两重性现象。”然后就把问题放在那里了。这就是前面已经引述过的、激起海森堡向泡利发泄的环境。

在两年后的1929年年底,狄拉克提出一个建议来解决这个问题。这个建议利用了泡利不相容原理,根据这个原理,不会有两个电子满足这个波动方程的同一个解。狄拉克所提议的是一个关于真空的全新概念。他提议我们所认为“空”的空间实际上被负能电子挤得满满的。事实上,按照狄拉克建议,“空”的空间实际上含有满足所有负能解的电子。这个建议最大的优点是解释了引起麻烦的、从正能解到负能解的跃迁。一个正能电子不可能跃迁到一个负能解,因为总是有另外一个电子已经占据在那里,而泡利不相容原理不允许第二个电子加入。

我们认为的真空实际上已经充满了东西的这种说法,乍听起来让人感到不可思议。但仔细想想,有什么不可以的呢?进化把我们塑造成能够感知对我们赖以生存和繁衍的世界上的方方面面。因为那些几乎不会受我们影响的、世界上不变的方面在这里是不起作用的,我们幼稚的感知力觉察不到它们似乎不应该是特别奇怪的。不管怎样,我们没有理由去期盼:有关什么是怪诞的或不大可能发生的幼稚直觉会对构建微观世界基本结构模型提供可靠的指导,因为这些直觉起源于一个完全不同领域的现象。但是我们必须接受它的到来。一个模型的有效性必须根据模型结果的成效和精确度来判断。

所以狄拉克对冒犯一般常识毫不畏惧。他十分恰当地将精力集中于他建议的可观测的结果。

因为我们正在考虑这样的观点:“空”的空间的常规状态远非空虚,那么用一个不同的、比较含糊的字来表示它是有帮助的。物理学家喜欢用的词是“vacuum(真空)”。

在狄拉克的建议中,真空充满了负能电子。这使真空成为一个具有自身动力学特性的介质。例如,光子可以同真空相互作用。可能会发生的一件事是,如果你将光照在真空上,只要光子具有足够的能量,那么一个负能电子就可以吸收其中一个光子,跳到正能解中。这个正能解作为一个常规的电子将被观测到。但在末态的真空中也产生了一个空穴,因为原本被负能电子占据着的解不再被占有了。

空穴的思想,就动力学真空而言,是惊人的创新概念,但并非前所未有。狄拉克利用了与含有很多电子的重原子理论的类比。在这样的原子中,有些电子对应于这样的波动方程的解,在那里,电子被紧紧地束缚在带大量电荷的原子核附近。要把这样的电子打出来需要大量的能量,所以在通常情况下,它们表现为原子不发生变化的一面。但如果其中一个这样的电子吸收了一个高能光子(X射线光子)从原子中被弹射出来,那么原子正常状态的变化就以这个电子的缺失为标志。相对比之下,提供负电荷的电子的缺失就像一个正电荷。这个有效正电荷会沿着失去电子的轨道运动,所以它具有带正电粒子的性质。

基于这个类比和其他一些举手之劳的观点(hand-waving arguments),在这篇几乎没有方程式的短短的论文中,狄拉克提出真空中的空穴是带正电的粒子。那么,一个光子将一个真空中的负能电子激发到正能态的过程就可以被解释为一个光子产生了一个电子和一个带正电的粒子(空穴)。反过来,如果事先存在一个空穴,那么一个正能电子就可以发射出一个光子并占据空的负能态。这被解释为一个电子和一个空穴湮灭为纯能量。这里,我涉及的是一个光子被发射出来,但这只是一种可能性。还有可能发射出多个光子,或其他任意形式的辐射,它们带走了释放出的能量。

狄拉克第一篇空穴理论论文的标题为《电子和质子的理论》。当时质子是唯一知道的带正电的粒子。所以试图把这种假定的空穴认定为质子是很自然的。但不久这种认定引起了十分严重的困难。确切地说,我们刚才讨论的两种过程——电子-质子对的产生和电子-质子对的湮灭——从来没有被观测到过。第二个过程更有问题,因为它预言氢原子会在几微秒时间内自发地自我湮灭——幸亏它们不是这样。

把质子视为空穴的看法还牵涉到一个逻辑上的困难。基于方程的对称性,可以证明空穴必须具有和电子相同的质量。但是,一个质子当然应该具有比电子大得多的质量。

1931年,狄拉克收回早先认为空穴就是质子的观点,接受了他自己的方程的逻辑结果,并提出了一个动力学真空的要求“一个空穴,如果存在的话,会是一种实验上尚未发现的新的基本粒子,它具有与电子相同的质量和相反的电荷。”

1932年8月2日,一位美国实验家卡尔·安德森正在研究宇宙射线在云雾室留下的径迹的照片,他注意到一些径迹,它们如同所预期的电子那样的失去能量,但却被磁场偏转到相反的方向。他把这个现象解释为暗示着一种新粒子的存在,现在称之为反电子或正电子,它具有与电子相同的质量但相反的电荷。具有讽刺意味的是,安德森完全不知道狄拉克的预言。

在距狄拉克的房间几千英里之外的圣约翰,狄拉克的空穴——他的理论设想及其修订版的产物——被发现了,是从帕萨迪娜的天空降下来的。所以从长远的观点看,“坏”消息结果成为“更好”的消息。负能的青蛙成为正电子王子。

如今正电子已不再是令人惊奇的东西,而是一种工具。一个著名的应用是拍摄正在活动的大脑的照片——PET扫描,即正-负电子断层摄影术。正电子是如何进入你头部的呢?它们是通过注射把一些特殊的分子偷偷地送入的,这些分子包含有一些原子,它的放射性核将衰变出产物之一的正电子。这些正电子走不了多远就会与附近的电子发生湮灭,通常会产生两个光子,它们穿过你的颅骨跑出,就可以被探测到。然后你可以重建原始分子的去向,映射出新陈代谢,也可以研究光子在出射过程中的能量损失,得到一个密度分布图,最后得到脑组织的图像。

另一著名的应用是用于基础物理。你可以同时将正电子和电子加速到很高能量,并把两束粒子引到一起。然后正电子和电子会湮灭,产生高度密集形式的“纯能量”。在过去的半个世纪中,基础物理绝大部分进展都是基于世界各地一系列大型加速器上的这类研究,其中最新最大的是位于日内瓦之外CERN(欧洲核子研究中心)的LEP(大型电子-正电子)对撞机。稍后我会讨论这个物理的极具魅力的要点

狄拉克空穴理论的物理思想,如我提到的,具有部分早期重原子研究的根源,也大规模地反馈到固体物理中。在固体中,我们有一个尽可能低的能量的电子的参考组态或基本组态,在那里电子占据了上至一个确定能级的所有可能的状态。这个基本组态类似于空穴理论中的真空。也存在着一些较高能量的组态,在那里一些低能态没被任何电子占据。在这些组态中,有一些通常会被电子占据的空位或“空穴”——这是它们在技术上的称谓。这样的空穴在很多方面的行为都像带正电的粒子。固体二极管和晶体管都是基于对处于不同材料界面处的空穴和电子密度的巧妙控制。也有一种可巧妙地把电子和空穴引导到一个它们可以结合(湮灭)的地方的可能性。这使你可以设计出一个能非常精确控制的光子源,导致了诸如LED(发光二极管)和固体激光这样的现代技术支柱。

在1932年后的若干年中,许多附加的反粒子事例被观测到。事实上,对每一个已经发现的粒子,其相应的反粒子也都被发现了。有反中子、反质子、反m子(m子本身是一个非常类似于电子的粒子,但是更重一些)、各类反夸克、甚至反中微子以及反p介子、反K介子……。其中的很多粒子都不遵从狄拉克方程,有一些粒子甚至不遵从泡利不相容原理。所以反物质存在的物理原因必须是很普遍的——比最早导致狄拉克预言正电子存在的论据要普遍得多。

事实上,存在一个非常普遍的论点:如果你同时运用量子力学和狭义相对论,则每一个粒子必须有一个相应的反粒子。这个论点的严密的表述需要高深的数学背景或者极大的耐心。在这里大概地说明为什么反物质是同时运用相对论和量子力学的合乎情理的结果将会是令人满意的。

考虑一个粒子,让我们给它一个名字(同时强调它可以是任何东西),不妨称之为一个什穆,以非常接近光速的速度向东运动。根据量子力学,它的位置实际上存在一些不确定性。所以你会发现这样的一些几率:如果测量什穆的位置,在初始时刻,它处在期望的平均位置偏西一些的地方,稍后又在期望平均位值偏东一些的地方。这样,在这段间隔内,它走得比你预期的要长一些——这意味着它走得更快。但是因为预计的速度基本上是光速,为容纳这个不确定性需要更快的速度,它预示着将违反狭义相对论,在该理论中粒子的速度不能大于光速。这是一个佯谬。

用反粒子,你可以摆脱这个佯谬。这就需要精心策划,让一些怪诞的想法协调一致,这是人们想出的如何做这件事的唯一方法,它似乎就是大自然的方式。是的,其中心思想是:不确定性确实意味着,你能在狭义相对论告诉你不会出现什穆的地方发现它——但你观测到的那个什穆不一定就和你要找的那个一样!因为也有可能在稍后的时刻会有两个什穆,一个原来的和一个新的。为了使其自洽,还必须存在一个反什穆,用来平衡电荷,抵消可能与额外的什穆相关联的其他守恒量。能量的平衡又怎么样呢——是不是我们取出的能量比投入的更多?这里,常常就像在量子理论中那样,为避免矛盾,在考虑测量某物意味着什么时,你必须是明确的和具体的。测量什穆位置的一种方法是用光照射它。但是要精确测量快速运动的什穆的位置,我们必须使用高能光子,那时也存在这样的可能性,这样的一个光子会产生一个什穆-反什穆对。在那个情形下——封闭的什穆圈——当报告你的位置测量结果时,你可能论及的是别的什穆!(未完待续)