20 世纪,在一个最基本的问题上,物理学家取得了巨大的进展。这个问题就是∶构成宇宙万物的基本元素是什么?在这一过程中,他们不得不对某些数学问题的解做出了许多假设。由于这些假设及其推论都有坚实的实验证据支持,科学家对理论的完全正确性十分自信。然而,物理学的飞速进步面临着一个巨大的挑战∶解决物理学背后的数学。杨-米尔斯规范场存在性和质量间隔假设的解决将成为迎接这个挑战的重要一步,并将增加我们对物质本质的理解。这使得这一问题成了人类为理解宇宙而进行的长期探索中最新一步 —— 而这一探索在过去 2000 年来很大程度上一直依赖数学。
古人相信世界由四种基本元素组成∶土、水、气和火。公元前 350 年左右,古希腊哲学家柏拉图在他的著作《蒂迈欧篇》中从理论上说明这四种元素都是由微小的固体聚集而成。他论述道,作为物质的基本组块,这四种元素必须有完美的几何形状,也就是使希腊数学家深深着迷的 5 种正多面体 ———— 具有完美对称性的正四面体、立方体、正八面体、正十二面体和正二十面体。
柏拉图认为,火是由正四面体组成的、土是由立方体组成的、水是正二十面体、气是正八面体。最后一种正多面体代表了整个宇宙的形状。
对于柏拉图而言,上帝必定是一位几何学家。或伽利略说∶为了理解宇宙,你必须先知道描写它的语言。这语言就是数学。
在开普勒生活的时代,有 6 颗已知的行星∶水星、金星、地球、火星、木星和土星。并且哥白尼已经提出所有这些行星都在以太阳为中心的圆形轨道上运行。开普勒后来证明这些轨道不是圆而是椭圆。开普勒建立了一个理论,用来解释为什么正好有 6 颗行星以及为什么它们位于离太阳为特定距离的轨道上,这是因为每两条相邻的轨道之间一定是适合正好嵌入一个正多面体,而且每种正多面体正巧使用一次。
经过一些实验后,他终于找到了这些嵌套的正多面体和球面的排列∶最外层球面(土星在其上运动)包含了一个内接立方体,在这立方体内是一个木星轨道所在的内切球面,在这球面内接着一个正四面体,火星在其内切球面上运行。火星轨道所在球面内接着一个正十二面体,而地球运行轨道所在的球面与其内切。地球轨道所在球面又内接着一个正二十面体,而金星运行轨道所在的球面与其内切。最后,与金星运行轨道所在球面内接的是一个正八面体,而水星运行轨道所在的球面与其内切。
同柏拉图一样,开普勒也运用了同一基本哲学思想∶宇宙根据数学规律运行。
20 世纪初,原子论成为被广泛接受的物质理论。它认为一切事物都是由原子构成的,原子好比微型的“太阳系”,其中一些电子(“行星”)沿某一轨道绕着中心核(“太阳”)运动。
后来,科学家观察到的各种现象迫使他们放弃原子模型。取而代之的是一种更为复杂的数学理论 ————量子理论。量子理论诞生于 20 世纪 20 年代,它包括着这样的思想∶物质中蕴含着内在的不确定性。
将柏拉图、开普勒、爱因斯坦、量子理论和当今的弦理论家联系在一起的共同信念是对宇宙的基础物质的理解终将由数学得出。数学的研究进展有时超越了物理学。
爱因斯坦发现能运用黎曼几何来解释引力,黎曼几何因此迅速发展并快速地融入主流数学。量子理论本身也需要一些数学新分支的发展,如泛函分析和群论。
杨-米尔斯规范场存在性和质量间隔假设是数学家为回应物理学家的挑战而必须解答的一个具体的难题。这是个实实在在的数学问题。但为了理解它的由来和含义,我们得先从物理说起。
对于描述生活中常见的物理现象,早在 17 世纪牛顿就得到了相当好的结果。牛顿的物理学可以计算一个物体从桌子掉落到地上所需的时间,也可以计算出“阿波罗”号在地月之间往返的时间。
但很快,我们就意识到牛顿物理学在天文尺度上越来越不准确;同样,它也不适用于原子内部的微观世界。
20 世纪早期,物理学家创立了新的理论来解释这两个“极端”世界。爱因斯坦的相对论描述了天文尺度上的宇宙,量子理论则描述了亚原子尺度上的世界。
这两个理论都取得了极大的成功。这两者之中,哪一个更好呢?相对论与量子理论相互矛盾。在某一确定的领域中,一个完全错误,但另一个却十分精确。
在大多数情况下,这两个理论各司其职,互不干扰。广义相对论负责宏观宇宙,量子场论负责微观世界。
但有一个地方会让这两个理论发生冲突 ——黑洞(大质量恒星因巨大的引力而坍缩形成)。目前为止,还没有一个令人满意的理论来描述黑洞中的事件。把相对论与量子理论结合起来得到的方程,其解是无穷大,因此毫无意义。物理学家也无法解释在大爆炸发生的那一刻(所有的宇宙物质都挤在一个极小的区域),究竟发生了什么。
当物理学家在可能的最小尺度下研究物质的性质时,相对论与量子理论的矛盾也是存在的。按照如今的理论,量子理论研究对象的基本粒子(如光子、夸克和玻色子),其实就是“时空中的量子泡沫”。以这种方式研究它们你需要用到爱因斯坦的质能方程,建立质量与能量之间的关系。
很明显,相对论和量子理论的冲突强。有力地证明了两者都不是关于物质的终极理论。那么,如果想真正了解宇宙,就必须找到一个单一的、涵盖一切的超级理论,使相对论和量子理论都是这个理论的近似。但是这样的理论是什么?从爱因斯坦开始,物理学家就一直在寻找,至今没有成功。对物质的大统一理论(简称 GUT)的研究被称为现代物理学的圣杯。
大一统理论归根结底是找到一个框架,用来解释目前认识到的四种基本力∶电磁力、引力、强核力与弱核力。目前,电磁力很容易用牛顿物理学来描述;爱因斯坦的广义相对论解释了引力;量子理论解释了两种核力。大一统理论的目的是用一个理论来准确地描述这四种基本的力。
大概从 1925 年起,大多数寻找大一统理论的努力,都是在拓展量子理论,这一拓展理论为“量子场论 "(QFT),它是基本粒子物理标准模型的理论框架。
量子场论的领军人物是普林斯顿高等研究院的物理学家威腾。威滕将量子场论描述为
使用了 21 世纪数学的 20 世纪科学理论。
威滕对数学进展的缓慢感到难以忍受。牛顿的大量科学成就依赖于微积分方法,他发明微积分就是用于这个目的,但是直到 200 年后微积分才作为一种数学理论被完全建立起来。
早在 20 世纪 50 年代提出的杨-米尔斯理论是向这样一种大统一理论迈出的第一步。而质量缺口假设是杨-米尔斯框架下衍生出的一个特殊的数学问题。
为了解释杨-米尔斯理论及质量缺口假设问题,我们将回到 19 世纪早期,那时科学家正试图理解电现象。
一个试验改变了世界
1820 年的某天,丹麦物理学家奥斯特在实验室工作时发现,当电流通过一根磁针附近的导线时,磁针发生了偏转。奥斯特将他的观察结果作为一项科学发现报告给丹麦皇家科学院。他说在电与磁之间似乎有某种联系。
一年后,法国人安培得到了类似的发现。他注意到,当电流通过两条平行导线时,它们的行为好像磁石。当两条导线通入同方向电流时,它们相互吸引;当通入电流方向相反时,它们互相排斥。1831 年,英国的法拉第和美国的亨利各自独立地发现了对应的效应∶将线圈放入交变磁场中,线圈中会产生电流。
虽然两种情况似乎不相同,但电与磁看来有着紧密联系,并在某种情况下可以相互转换。
听到这些消息,伟大的英国物理学家汤姆生开始思考∶电力与磁力是否是同一潜在现象的不同表现呢?由于不久前建立了关于流体运动的一种数学理论,汤姆生提出可以用一种类似的方式来解释电与磁。在流体中,流体的力是自身的重力。那电与磁的力是什么呢?
以前的一个观点是,空间中弥漫着一种称为 "以太" 的连续物质。以太被假定为是均匀的、静止的,且遍及整个空间。恒星和行星在这个恒定的“以太”中运动,光也在其中流动。汤姆生提出电与磁是以太中某种形式的“力场”产生的。
只要在一个区域内的每一个点上存在一个特定的力,其大小和方向都随位置的变化而变化。在许多力场中,每点上的力还会随时间变化而变化。数学家通过建立每点上的(可能还有在每个时刻的)力的大小与方向的方程来研究力场。以这种方法产生的数学结构被称作向量场。
1850 年前后,苏格兰数学家麦克斯韦决定研究电与磁。15 年后,他有了结果,并把这个统一的力称作“电磁力”。1865 年他在一篇名为“电磁场的动力理论”(A Dynamical Theory of the Electromagnetic Field)的论文中发表了他的研究成果。
麦克斯韦用于描述电磁场的公式现今被称为麦克斯韦方程组,它纳维-斯托克斯方程一样,它们都是偏微分方程。麦克斯韦方程组描述了电场E与磁场B的联系,其中E是向量函数,它给出了场中每一点每一时刻的电流(向量)。B 给出了场中每一点每一时刻的磁力(也是一个向量)。
麦克斯韦方程组把两个不同的力(电和磁)统一在了一个框架中。然后,麦克斯韦就开始寻求把四种自然力统一起来。
麦克斯韦方程组意味着如果电流在导体中来回波动,那么随着电流不断交替变化的电磁场将会挣脱导体,以电磁波的形式流入空间。这种波的频率与产生它的电流的频率相同。(麦克斯韦将电磁场称为波只是由于描述这种流的方程组与描述流体的波方程十分相似。)
不管是不是波,麦克斯韦都能计算出电磁流的速度大约是每秒 300 000 千米,它与光速十分接近。这使得他猜想光就是某一种特定频率的电磁辐射。今天我们知道他是正确的,光的确是电磁辐射的一种形式。
频率是电磁波的重要特征。频率最低的波是无线电波,用于传送无线电信号和电视信号。频率高一点的是微波和红外线,可以传播热。然后是光,是电磁光谱中的可见部分。光谱的最低频率端是红色,最高频率端是紫色,其间的光频率按以下颜色顺序排列∶橙色、黄色、绿色、蓝色和靛蓝色。比紫色频率更高一些的辐射是紫外线,虽然人眼看不到,但能使照相底片感光。过了紫外线区域是看不见的 X 射线,它不仅能使照相底片感光,还可以穿过人体。这两种特性结合起来使得它被广泛应用于医疗。最后,电磁波谱的最上端是 γ 射线,是由放射性物质衰变时放出的。
麦克斯韦方程组没有回答的一个问题是,电磁波传播时通过的介质究竟是什么?许多科学家试图找出这个介质。其中以 1887 年由迈克耳孙和莫雷进行的实验最为著名。但所有的努力皆以失败告终。不过,随着一位在瑞士专利局工作的年轻人登上科学舞台,关注的方向发生了急剧的变化。
1905 年,爱因斯坦创立了著名的狭义相对论。1909 年,他辞去专利局的工作,受聘成为苏黎世大学的物理学教授。10 年后,他的广义相对论被实验证实。
狭义相对论说,物体的运动是相对另一个物体而言的。我们所感受的绝对运动是相对于我们身处其中的参考系的运动。对亚里士多德而言,地球是静止的,因此相对地球的运动是“绝对”运动。牛顿相信有一个固定的“空间”,相对于这个空间,任何物体不是绝对静止的就是绝对运动的。爱因斯坦前进了一步,他否定了亚里士多德和牛顿运动观,宣称所有的运动都是相对的。这就是爱因斯坦的狭义相对性原理。
这一原理推导出了一个令人惊讶的结论,即电磁辐射有一个非常特别的性质∶不管参考系是什么,光速总是相同的。对爱因斯坦来说,唯一绝对的东西不是以太,而是电磁波的速度。
由于在所有参考系中光速都相同,爱因斯坦解决了另一个棘手的问题∶同时性问题。爱因斯坦宣称时间不是绝对的,而是依赖于测量时间的参考系,从而解决了这个同时性问题。很明显,对宇宙的数学分析开始引导科学家进入了一个反直觉领域。
尽管爱因斯坦的狭义相对论威力强大,但它仅适用于有两个或多个以匀速相对运动的参考系的情况。而且,虽然这个理论描述了空间和时间的性质,却没有提及宇宙的其他基本组成∶质量和引力。1915 年,爱因斯坦发现了一种方法,把他的相对论拓展到将后两者也考虑进来,他的新理论称为广义相对论。
这个新理论的基础就是广义相对性原理∶在所有参考系中,无论它是否处于加速运动,一切现象都以相同的方式发生。在广义相对论中,一个受引力影响的自然过程,在没有引力但整个系统在加速运动的情况下也会发生。即引力和加速度是可以相互转换的。
广义相对论让人吃惊的一个结论是光线好像有质量。当光波在一个大质量物体如恒星附近经过时,这物体的引力场将使光线偏转。1919 年,英国天文学家爱丁顿证实了爱因斯坦的广义相对论。
广义相对论不仅精确地预测了天文引力现象,而且对引力的本质作了解释。令人惊讶的是,这是一个几何解释。根据爱因斯坦的理论,任何物体都会使时空弯曲。弯曲的程度(曲率)在物体附近最大,越远越小。这曲率使两个物体相互吸引。换言之,在爱因斯坦的框架中,我们所谓的引力只不过是由于一个物体的存在而产生的时空曲率。物体的体积和质量越大,它周围的时空变形也越大。
遗憾的是,爱因斯坦的相对论并没有为他赢得诺贝尔奖。但他因发现了光电效应而获得了诺贝儿物理学家,而光电效应推动了量子力学的发展。
尽管广义相对论描绘了宇宙的几何结构,阐明了物质是怎样与这个结构相互影响的,但它仍然没有回答这个问题∶物质究竟是什么?为了解答这个问题,物理学家不得不求助于另一个理论∶量子理论。
20 世纪初被人们接受的观点是,物质是由原子构成的。每个原子有一个很重的核,周围的轨道上运动着轻得多的一个或多个电子。原子核本身被认为由两类基本粒子组成∶质子和中子。每个质子带一个单位的正电荷,每个电子带一个单位的负电荷。这些正负电荷之间的电磁吸引力,把电子束缚在绕核轨道上。(化学家现在还依赖这个理论)
但组成原子的基本粒子(质子、中子、电子)究竟是什么?
这是 1920 年前后物理学家玻尔、海森伯和薛定谔所研究的问题。在寻求解答的过程中,他们不得不考虑一些奇怪的实验结果,其中一个是光在某些情况下的行为好似连续的波,而在另一些情况下它的行为却是一股分立粒子流。他们提出的量子理论解决了所有的难题,但也引入了“不确定性”的概念(这与因果律相悖)。
19 世纪末,首先向量子理论迈出的重要一步是试图解决麦克斯韦电磁理论所产生的一个难题。根据这个理论,在一个黑体内所生成的能量应该是无穷大。
1900 年德国物理学家普朗克提出了一种解决这个难题的方法,他假定物质辐射(或吸收)的能量不是连续地、而是一份一份地进行的,只能取某个最小数值的整数倍。这个最小数值就叫能量子。给定电磁波所带有的能量子数与波的频率成比例。频率越高,能量子也越多。这就立即解决了无穷大能量的问题。波的能量和频率之比就是现在所称的普朗克常量。1918 年,普朗克因这项工作而获得诺贝尔物理学奖。但普朗克仍然未能解答这个问题∶为什么能量竟然以“能量子”的形式出现?
1905 年,爱因斯坦给出了答案,这是他解释另一个称为光电效应的奇特物理现象而得到的一个结果。1887 年,德国物理学家赫兹已经注意到当电磁辐射照射到某些金属时,金属会发射出电子。有趣的是,增加光的强度,发射出的电子数也会增加,但电子的能量却不会增大;而增加光的频率,就会使发射出的电子具有更大能量。
为了解释这一现象,爱因斯坦假设光波是由分立的能量包(光子)所组成的,光子的能量与光波的频率成比例(比值就是普朗克常量)。当一个具有足够能量的光子撞击金属时,它能撞出一个电子。被撞出的电子的数目取决于有能量光子的数目,从而取决于光的强度。每个释放出的电子的能量取决于撞击它的光子的能量(从而取决于光的频率)。
爱因斯坦关于光的新理论为普朗克提出的电磁波中的“能量子”提供了一个解释。这些“能量子”就是光子,根据爱因斯坦的观点,它们组成了波。
由粒子组成波的确切含义又是什么呢?这里我们遇到了令人棘手的难题,从来没有人能够完全对付得了。费曼曾说过,
曾有一度说只有 12 个人理解相对论。…… 人们读了爱因斯坦的论文后,不少人以这样或那样的方式理解了相对论,人数当然远远不止 12 个。但我可以有把握地说没有人理解量子力学。
说到量子力学,物理学家不得不放弃他们的直觉而靠数学来告诉他们发生了什么。随着量子理论的到来,数学变成了我们理解世界的唯一方法。
在实验室中研究光时,有时它的行为像波,有时却像粒子。面对这样的行为,科学家要在电磁辐射研究中取得进展,唯一的方法又落到数学身上。于是数学将科学家引入了一个与日常生活经验完全不同的领域。根据数学,物质(包括光子)本身固有的不确定性使光产生了类似波的行为(最新的研究似乎否定了这一说法)。
量子理论告诉我们,必须放弃我们熟悉的粒子形象(粒子有确定的位置和速度)。关于一个特定粒子的位置和速度,能得到的最精确信息是一种概率分布。不确定性是物理现实的一个基本方面。
我们知道是什么使电子保持在绕核的轨道上∶是电磁力导致带相反电荷的粒子相互吸引。那又是什么把核中的质子束缚在一起的呢?毕竟同种电荷相斥。其中一定存在某种力把核子束缚在一起。物理学家称它为强核力,或强相互作用。强相互作用必须足够大,才可以将一个核内的质子束缚在一起。另一方面,强核力只能作用于很短的距离,在核本身尺寸的数量级上,因为它不能使两个不同原子的核内的质子吸引在一起。
人们认为强核力与引力、电磁力一样,是自然界的基本力。正如光子是电磁力的载体一样,强核力的载体是被称为胶子的基本粒子。
物理学家认为存在第四种基本力。为了解释如铀等放射性元素的核衰变,必定要有第二种核力,它能使质子飞走∶这就是弱核力。承载这种力的粒子被称作玻色子。
接下来所需要的,是对场的量子理论解释(量子场论,QFT),其中包括了对自然界这四种基本力场的描述。对量子理论的传统描述,通常局限于 20 世纪 20 年代最初构想的理论。在量子力学中,一个粒子的行为可以用一个已被人们充分理解的方程来描述∶薛定谔方程,
其中 psi 是波函数,H 是哈密顿算符,h 是普朗克常量。需要知道的关键事实是,数学家把握此类方程几乎没有什么困难。量子力学的早期研究产生了人脑无法完全理解的结果,但总体而言,有关的数学是相当简单的。
对比之下,在量子场论中,物质被视为某种场,一种存在于空间每一处的基本的连续介质。经典物理学所谓的“粒子”只不过是量子场中的能量聚集。在量子场论中,数学也变难了。
1973 年,(量子非阿贝尔规范理论中的)所谓“渐进自由”这个性质被发现,这已经使物理学家了解了数学将会得出什么类型的结果(其中就有质量缺口假设)。
请注意麦克斯韦电磁理论是经典(非量子)场论的一个代表,因为它并未将电磁视为粒子流,而是视为场。因此在运用数学描绘场时没有实质性困难。所有的困难在于试图融合量子理论和场论这两种思想。
这种将物质作为时空场中某种性质的观点,导致了一些令人吃惊的结论。一个是关于反物质的预言∶每种粒子都存在相应的反粒子,即有相同质量但有相反电荷的粒子。因为物质与反物质不能正常共存 —— 如果一个粒子遇到它的反粒子,这两个粒子立即相互湮没。1931 年,量子理论的先驱狄拉克就预言存在反物质。不久之后,电子的反粒子(正电子)在宇宙射线中被观察到,这使得狄拉克的结论成为量子场论的第一批成功预言之一。
有趣的是,尽管量子场论似乎违背人们的直觉,但使得物理学家开始迈上通向这个理论的道路,而且他们相信最终引导他们到达所渴望的大一统理论的关键数学思想,就是位于我们美感中心的 ————对称概念。
在日常的语言中,如果一个物体具有某种平衡形式,那么我们就说它是对称的。例如,人脸是对称的,由于其左半边与右半边十分相像;雪花是对称的,因为它的每一部分与其正对面的部分十分相像,
在数学上,如果一个物体经过某种变换之后仍然与原先的形貌一样,那么就说它关于这种变换是对称的。例如,人脸关于左右反转是对称的,雪花关于中心反射是对称的,正方形关于中心 90° 旋转是对称的等等。
19 世纪的数学家发现,物体的全部对称的集合(使得该物体看上去与原先完全相同的所有变换的集合)有一些与该物体无关的有趣的结构特性。特别是它具有一种“算术”—— 可以将一个物体的两个对称“相加”而得到第三种对称,而这个“加法”有着一些我们熟悉的数的普通加法的性质。
数学家称这些新型算术为“群”。经年累月,他们创立了数学的一个重要的新分支 ——群论。现今群论已成为数学专业的一个重要部分。同时我们即将看到,它也是物理中的重要工具。
一个对象的所有对称变换的集合,连同用这种方法把它们结合起来的算术,就是对称群。知道了对称群的算术性质,你将知道关于该物体的许多信息,它的形状和各种其他性质。重要的是,能用上群论的物体不一定是如人脸、雪花这样的物质实体,它们也可以是抽象的数学对象,如方程,或力场。
20 世纪早期,物理学家开始意识到他们的许多守恒律都来自宇宙结构中的对称性。例如,许多物理性质在平移或旋转下保持不变。实验的结果并非取决于实验室的位置或器材的朝向。这些不变量意味着经典物理学中的动量与角动量守恒定律。
德国数学家埃米・诺特证明了这个想法的正确性∶每一条守恒律都可以视作是某种对称的结果。这样,每一条守恒律都有一个相关的群(相应的对称群),它描述了时空中每一点上的相关的对称性。例如,经典的电荷守恒定律就有一个相关的对称群。同样,在量子物理学中,如“奇异性”和“自旋”这类特性的守恒定律也有相关的对称群。
1918 年,数学家外尔(Hermann Weyl)试图对称的 概念将狭义相对论与电磁学统一起来。他的想法是充分利用这样一个事实,即电磁场在每一点上具有某种使方程保持不变的数学对称性。例如,麦克斯韦方程组对于尺度的改变保持不变,这是一个对称形式。为了利用这个事实,外尔将一个电磁场看作沿着一条封闭曲线运动时产生的一个相对论性长度畸变。为了在数学上做到这点,他必须给四维时空中的每一点上指派一个对称群。
外尔的基本想法是好的,但是他的方法没能完全行得通。麦克斯韦方程组中重要的不是尺度而是相。外尔采用了错误的对称,从而采用了错误的对称群。电磁场的关键对称是现在所称的“规范对称”。它表示即使把电磁势乘上某种量子力学相因子或称“规”,场方程的形式也保持不变。
在日常生活中,规是一种测量器具。在按摩浴缸中,你可以通过在水中移动手来得到对力场的一个感觉。同样,在电磁场中,你也可以通过移动某种“测量规”来得到一幅这个电磁场的图景。
这样就诞生了非常重要的新学科“规范理论”,其中指派给时空中每一点的对称群称作规范群。
当外尔将重点放在尺度上时,他研究的对称群是正实数的乘法。当他将注意点从尺度转移到相之后,对麦克斯韦方程组具有重要意义的群成了“一维酉群”U(1)”,它可以认为是平面上旋转运动的集合。
循着外尔的研究,物现学家将麦克斯韦理论修改成一种规范理论。他们将麦克斯韦的理论扩展为包含一个或更多核力(甚至包含引力)的量子场论的策略是,用一种更为复杂的对称群替代规范群U(1),使得这样得出的场论首先可能是量子场,其次可能包含了其本力场。他们通过几个赢得诺贝尔奖的步骤成功地进行了这种扩展(但末包含引力)。
第一步出现在 20 世纪 30 年代,当时狄拉克等人提出了一个极其精确的新理论,称为量子电动力学,简称QED。QED 提供了对电磁现象的一个量子描述,使得它本质上成为麦克斯韦理论的一个电子论版本。
20 世纪 40 年代,费恩曼、施温格、朝永振一郎、戴森等人创建了在这个理论中进行精确计算的极其有效的方法,使得它成为最为精确的科学理论。实验证明,其理论计算结果直到小数点之后 11 位都是正确的。因为这项工作,费恩曼、施温格和朝永振一郎获得了 1965 年诺贝尔奖。
1954 年,物理学家杨振宁与米尔斯在量子理论中建立了与麦克斯韦方程组类似的方程组。这是关键的第二步。杨振宁与米尔斯采取了一个绝妙的策略,用“紧李群”—— 多维复空间中的一个刚体运动集来代替群 U(1)。麦克斯韦方程组是完全经典的,即非量子理论的,而杨-米尔斯方程组却具备了两方面的特性∶经典性与量子理论性。这样,杨一米尔斯理论就可建立一种对物质的量子场处理方法,从而扩展了 QED。
使用杨-米尔斯方程组需要比麦克斯韦理论更复杂高深的数学。尤其是与麦克斯韦方程组相联系的群 U(1)是“阿贝尔群”(即可交换的)。但杨和米尔斯使用的群却不是这样。他们的理论是“非阿贝尔”规范理论。可交换性的缺失使得相应的数学变得更加深奥。
随着杨一米尔斯理论的发展,物理学家开始尝试用非阿贝尔规范理论来寻求他们一直向往的大统一理论。主要的思路是找出正确的规范群,使得他们能够把两种核力以及引力一网打尽。
在运用杨-米尔斯理论的量子版本来统一电磁力和弱力或强力时遇到一个问题,即杨-米尔斯方程组的经典(非量子)版本描述了以光速传播的零质量波。然而,在量子力学中,每个粒子都可以看成是一种特殊类型的波,因此“无质量”这一特性成为主要的症结。研究表明,核力是由非零质量的粒子承载的。
对于弱力,这个困难于 1967 年被格拉肖、Salam 和温伯格所解决。他们使用了一种规范理论,其中对称群的专业名称为 SU(2)×U(1)。他们创立的理论称为电弱理论。通过引入一个额外的力 —— 希格斯场,他们避免了无质量性。有着大量的证明支持电弱理论。许多实验的目标是探测希格斯玻色子,它承载着希格斯场,找到它这个难题就彻底解决了。
2012 年,ATLAS 和 CMS 实验在瑞士日内瓦附近的 CERN 的大型强子对撞机 (LHC) 上进行了 实验,发现了具有预期特性的亚原子粒子。随后证实新粒子与希格斯玻色子的预期特性相匹配。物理学家彼得・希格斯和弗朗索瓦・恩格勒特因其理论预测而获得了 2013 年的诺贝尔物理学奖。
电弱理论不仅涵盖了电磁力和弱核力,它还表明在足够高的能量水平上,如大爆炸之后最初的极短时间内,这两种力合二而一,称之为电弱力。(电弱力得以分为两种看似不相同的力的过程称为对称性破缺)由于这项成就,格拉肖、Salam 和温伯格获得了 1979 年的诺贝尔奖。
接下来的一步是量子杨-米尔斯理论的所谓渐近自由这一重要性质的发现。1973 年,格罗斯和维尔切克发现了这个性质,同时,波利策也独立地发现了这个性质。它大致上说,夸克和胶子之间的相互作用在距离很近时失效,只有当距离较大时,量子效应才会显示出来。渐近自由不仅解释了某些本来很神秘的实验结果,而且导出了一个把强力包含在内的唯一的量子场论,格罗斯和维尔切克称之为量子色动力学,简称QCD。
QCD 是一种建立在另一种对称群 SU(3)上的规范理论。这是所谓八种颜色的胶子与夸克相互作用后对应于和转变为三种“色荷”的理论。夸克是自旋为 1/2 的基本粒子,它们相结合形成质子、中子和其他先前已知的粒子。由 QCD 预言了其存在性和特性的胶子,很快由实验发现,这进一步证实了这个新理论的正确性。
质量缺口假设是在导出量子色动力学的研究中产生的。与量子电动力学相比,量子色动力学的许多预言以科学上空前的精确性获得了实验的证实。因此,物理学家自信他们正沿着正确的道路前进。但是我们对这理论的数学解释远未成型。例如,无人能解出杨-米尔斯方程组,更不用对它们作任何推广了。而物理学家倒在用这些方程建立以一种“近似”的方法计算各种关键数值的规则。
这很不可思议,现今世界上最精确的科学理论是建立在无人能解的方程组之上的。这道关于杨一米尔斯理论的千禧难题对数学界提出了解决这个问题的挑战。首先是求得杨一米尔斯方程组的一个解,其次是确定这个解的一种专门性质,称为质量缺口假设。
维尔切克(渐近自由和 QCD 的发现者之一),对此这样说道∶
我们相信,QCD 的方程全面描述了质子和其他强相互作用粒子的性质,包括它们的质量;现在我们要从数学上证明,这个美丽的数学理论(QCD)确实完成了这个任务。特别是,这个理论必须巧妙地用无质量的砌块产生有质量的粒子。
产生质量的基本机制是爱因斯坦的质能方程。实验、计算机模拟和某些理论计算使物理学家相信,对于真空激发,一定存在一个 "质量缺口",即存在一个非零的最小能级(即不存在无质量的粒子波)。质量缺口这个性质也解释了为什么强力只在如此短的距离内起作用。
至今,无人能够严格证明这个性质。质量缺口假设要求给出一个表述精确的数学版本。特别是,要求证明∶
对任何紧的、单的规范群,四维欧几里得空间中的量子杨-米尔斯方程组有一个质量缺口的解。
这个问题的解决不仅是理论物理的重大突破,也是将量子场论发展成为一种数学(不单单是物理)理论这个更大追求中的重大突破。
尽管起源于物理学,但这个问题本质上是作为数学问题来阐述的。确实,许多物理学家认为这问题的大部分已经解决。
杨-米尔斯理论和质量缺口假设的解决将标志着数学中又一重要新领域的开始,对现今我们关于宇宙的认识将有深刻的关系。
威滕把这道千禧难题看成是对人类的重大挑战,他说,
对自然科学的理解在历史上一直是数学灵感的一个重要来源。因此,在新世纪之初,物理学家用于描述自然定理的主要框架无法用数学处理,这十分令人沮丧。
找到杨-米尔斯方程组的一个通解,本质上意味着人们弄懂了粒子物理学的标准模型。如果这样,它将是数学上的一项重要成就。
本文来自微信公众号:老胡说科学 (ID:LaohuSci),作者:我才是老胡
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。