为什么几何学这么难?如何从群论的角度看几何学?

想要对几何学作一个恰当的讲解是不容易的。因为这个数学分支的基本概念要么太简单,无需解释,例如,没有必要在这里来讲什么是圆,什么是直线,什么是平面等等;要么就比较高深。然而,如果没有见过这些高深的概念,对于现代几何学将一无所知。那么,要是懂得了两个基本概念,收获一定会大得多。这两个概念就是∶几何学与对称性的关系,以及流形的概念。

几何学与对称群

广泛地说,几何学就是数学里使用几何语言的那一部分,诸如“点”,“直线”,“平面”,“空间”,“曲线”,“球”,“立方体”,“距离”,还有“角”,都是几何中基本且关键的概念。但是,还有一个更深刻的观点,就是克莱因所主张的,认为变换才是这门学科的真正核心。所以,除了上面列举的那些词以外,还要加上“反射”、“旋转”、“平移”、“拉伸”、“剪切”和“投影”这些词。还有稍微进阶的概念,例如“保角映射”或者“连续变形”。

变换总是和群在一起,因此几何学与群论就有密切的关系。给定了一个变换群,就有一种相应的几何学。特别是,若一个图形经过此群中的一个变换能够变成另一个图形,就说它们是等价的。不同的群会导出不同的等价概念。下面就要简短地描述一下最重要的几何学以及与之相关的变换群。

欧几里得几何学

欧几里得几何就是绝大多数人所认为的“普通的几何学”。例如,三角形的内角和为 180° 这个定理就属于欧几里得几何学。

要想从变换的角度来看待欧几里得几何,就要先说明是在多少维的空间里进行研究的,当然也必须指定一个变换群。一个典型的变换是刚性变换。可以用两个方法来考虑这种(刚性)变换。其一是,刚性变换就是在平面里、三维空间里,或者更为一般是在 R^n 里的保持距离不变的变换。就是说,给定两个点 x 与 y,若一个变换 T 使得 Tx 和 Ty 的距离等于 x 和 g 的距离,就说 T 是一个刚性变换。

后来发现,每一个这样的变换都可以用旋转、反射和平移的复合来实现。这就给了第二种也是比较具体的思考这个群的方法。换句话说,欧几里得几何研究的就是那些在旋转、反射和平移下不变的概念,这些概念里就包括了点、直线、平面、圆、球、距离、角、长度、面积和体积R^n 中的旋转构成了一个重要的群∶特殊正交群,记作 SO(n)。更大一点的正交群 O(n)还把反射也包括进去了。

仿射几何学

除了旋转和反射以外还有许多别的线性映射。如果把 SO(n)或者 O(n)放大,使之把尽可能多的这些线性变换也包括进来,又会发生什么?要使一个变换成为群的元素,它就必须是可逆的,但并非所有线性变换都是如此,所以一应该考察的群就是由 R^n 的所有可逆的线性变换所成的群 GL_n(R)。所有这些变换都令原点不动。但如果我们愿意,还可以把平移也加进来得到一个更大的群,就是包括所有形如 x → Tx+b 的变换所成的群。这里 b 是一个固定的向量,而 T 是一个可逆的线性变换。这样得到的几何学称为仿射几何学

因为线性映射中还包括了拉伸和剪切,它们既不能保持距离也不能保持角度,所以距离和角度都不是仿射几何学的概念。然而,经过可逆的线性映射和平移以后,点、直线、平面仍然是点、直线、平面,所以这些概念都属于仿射几何学。另一个仿射概念是两条直线的平行(就是说,虽然线性映射一般并不保持角度不变,但是,角度为零却得到了保持)。这意味着虽然在仿射几何学中没有矩形或正方形这样的东西,却可以讨论平行四边形。类似地,虽然不能讨论圆,却可以讨论椭圆,因为线性映射总是把椭圆变为椭圆。

拓扑学

与一个群相联系的几何学“研究的是被此群的所有变换保持的概念”这个思想可以用等价关系搞得更加确切。令 G 是 R^n 中的一个变换群。可以把一个 d 维“图形”看成是 R^n 的一个子集合 S。在研究 G 几何学的时候,并不把 S 和从它经过 G 中的变换得来的集合相区别。所以这时我们说这两个图形是等价的。例如,两个图形在欧几里得几何中为等价,当且仅当它们在通常的意义下是全等的,而在二维仿射几何学里,所有的平行四边形都是等价的,所有的椭圆也都是等价的。总之,我们可以认为 G 几何学的基本对象是图形的等价类,而不是图形本身。

拓扑学可以认为是当应用最宽松的等价概念所得到的几何学,其中我们说两个图形是等价的,或者用数学语言说是同胚的,如果二者的每一个都可以“连续变形”为另一个。例如,球和立方体就是在这个意义下等价的,如下图所示

因为存在很多很多的连续变形,要想说两个图形在这个意义下不等价就很难了。例如,似乎很明显,球面不能连续变形为一个环面,因为它们是本质不同的图形 —— 一个有“洞”,一个没有。然而,把这种直观变成严格的论证并非易事。更详细的涉及不变式、代数拓扑、微分拓扑。我们后面慢慢讨论。

球面几何学

至此,我们一直是在逐步放松对于两个图形为等价的要求,允许越来越多的变换。现在我们要再次收紧,考虑球面几何学。现在的宇宙不再是 R^n 而是 n 维球面 S^n,即半径为 1 的(n+1)维球体的表面,或者用代数方法来表示,即 R^(n+1)中适合方程

的点(x_1,x_2,…,x_n+1)的集合。正如 3 维球体的表面是 2 维的一样,这个集合则是 n 维的。我们将只讨论 n=2 的情况,但是很容易推广到更大的 n。

现在适当的变换群是 SO(3),它是由所有这样的旋转组成,这些旋转的轴是经过原点的直线(也可以允许反射而取 O(3),它们是球面 S^2 的对称;在球面几何学里就这样来看待它们,不把它们看成整个 R^3 中的变换)。

在球面几何学中有意义的概念有直线、距离和角。限制在球体表面上而又谈论直线,这看起来有些奇怪,但是,“球面直线”并不是通常意义下的直线,而是 S^2 用如下方法得出的子集合∶用一个通过原点(球心)的平面与 S^2 相交所成的子集合(叫做大圆),即半径为 1 的圆,就是球面直线

把大圆看成某种直线的重要理由还在于 S^2 上的两点 x,y 之间最短的路径就是大圆,当然,路径要限制位于 S^2 上。

两点 x 和 y 之间的距离定义为连接 x 和 y 而且完全位于 S^2 上的最短路径的长度。至于两条球面直线之间的角又如何定义?球面直线是定义为一个平面与 S^2 的交线,所以两条球面直线的交角可以定义为这两个平面在欧几里得几何学意义下的角。还有一个从审美角度来看的观点,它完全不涉及球面以外的东西。这个看法就是在这两条球面直线的两个交点之处看交点的一个小邻域,这时,球面的这一小部分几乎是平坦的,这两条直线也几乎是直的。所以可以定义这个角就是这个“极限平面”上的“极限直线”的欧式角。

双曲几何学

参照变换的某个集合(即变换群)来看几何学,这一思想只不过是看待这个学科的一个有用的途径。然而,来到双曲几何学时,变换的途径就是不可少的了。

产生双曲几何学的变换群是二维的特殊射影线性群,记作

讲解这个群的方法之一如下∶特殊线性群 SL_2(R)是所有的行列式为 1 的矩阵

的集合,即适合关系式 ad-bc =1 的这种矩阵的集合(它们确实构成一个群,因为如果两个矩阵的行列式均为 1,则它们的乘积也如此)。为了让它成为 "射影的",就令矩阵 A 等价于-A,例如,矩阵

为了从这个群得出一种几何学,首先必须把它解释为某个 2 维点集合的变换群。一旦做到了这一点,就把这个 2 维点集合称为双曲几何学的一个模型。微妙之处就在于双曲几何学没有一个看起来是最为自然的模型,如球面是球面几何学的模型那样。双曲几何学的三个最常用的模型是半平面模型、圆盘模型和双曲面模型。

半平面模型是与群 PSL_2(R)最直接联系的模型,所需要的 2 维平面点集合是复平面 C 的上半平面,即所有复数 z=x+ig,y>0 的集合。给定了矩阵以后,相应于此矩阵的变换就是把点 z 变为(az+b)/(cz+d)。条件 ad-bc=1 是用于证明变换后的点仍然在上半平面上,还用于证明这个变换是可逆的。

这里还没有做的是∶对于距离还什么也没有说。正是在这种几何学里,需要用群来“生成”几何学。如果想要有一个从变换群角度看来是距离概念,那么重要的就是这种变换要保持这个距离不变。就是说,如果 T 是一个这样的变换,而 z 和 w 两点在上半平面里,则 T(z)和 T(w)也在上半平面,而且

可以证明,本质上恰好只有一种定义距离的方法具有这个性质,用变换来 "生成" 的几何学就是这个意思。

这个距离有一些初看起来显得奇怪的性质。例如,一条典型的双曲直线的形状是端点在实轴上的半圆弧。但是,说它是半圆,不过是从 C 上的欧几里得几何学的观点来看是半圆;从双曲几何学的观点来看,欧几里得几何学的直线是“直”的,也同样奇怪。两种距离的真正差别在于,双曲距离和欧几里得距离比较起来,越是接近实轴,前者变得越大。所以要从点 z 走到点 w,“绕道”偏离实轴,路程反而更短,最佳的弯道就是沿着连接点 z 和点 w 而且与实轴成直角的半圆弧。

2 维双曲几何学的最著名的性质之一,就是它是一种使得欧几里得平行线公设不成立的几何学。就是说,可以找到一条双曲直线 L 和其外一点 x,使得过点 x 可以画出两条直线都不与 L 相交。在适当解释后,欧几里得几何学的所有其他公理在双曲几何学中都成立。由此可知,从那些公理是不可能推导出平行公设的。这个发现解决了一个困扰历代数学家两千多年的问题。

另一个性质补全了关于欧几里得三角形和球面三角形的内角和的性质。有一个很自然的双曲面积概念,具有顶角 α,β 和 γ 的双曲三角形的面积是 π-a-β-γ。所以在双曲平面上,a+β+σ 总小于 π,而当三角形非常小的时候,就几乎等于 π。内角和的性质反映了以下的事实∶球面具有正的曲率,欧几里得平面是 " 平坦”的,而双曲平面则有负曲率。这样,双曲三角形、欧几里得三角形和球面三角形的内角和分别小于、等于和大于 π;其差与曲率成正比;而这些空间的曲率也相应地为负、为零和为正。上面说是“补全了”相应性质,就是这个意思

圆盘模型是庞加莱在一个著名的瞬间,在登上一辆公共汽车的时刻想出来的,它的点集合就是 C 平面的开单位圆盘,也就是模小于 1 的复数的集合 D。现在,典型的变换形状如下。取 D 中的一个复数 a 以及实数 θ,这个变换就把 z 点变为点

这些变换成为一个群并不完全是显然的,而这个群同构于 PSL_2(R)就更不显然。然而可以证明,变 z 为-(iz+1)/(z+i)的函数把单位圆盘映为上半平面,反过来也一样。这就证明了这两种几何学是相同的,可以用这个函数把一个几何学的结果变为另一个几何学的结果。

和半平面模型一样,当接近圆盘的边缘时,双曲距离比欧几里得距离越来越大,从双曲几何学的视角看来,圆盘的直径是无穷大,它实际上没有边缘。

双曲圆盘的一个镶嵌铺装

上图表明,可用一些全等图形把圆盘镶嵌铺装(tessellation)起来,说这些图形全等是指其任意一个图形都可以用群中的一个变换变为任意另一个。所以,尽管这些图形看起来不都相同,但是从双曲几何的视角看来,它们却是大小相同形状也一样的。圆盘模型中的直线或者是与单位圆周交成直角的(欧几里得)圆弧,或者是经过圆盘中心的(欧几里得)直线线段。

双曲面模型可以解释这个几何学何以称为双曲几何学。这一次,点集合就是

这是一个单叶旋转双曲面,它是由平面 z=0 上的双曲线 x^2=1+z^2 绕 z 轴旋转生成的。PSL_2(R)里的一般的变换,就是这个单叶旋转双曲面上的某种“旋转”,而可以从真正的绕 z 轴的旋转和 xz 平面上的“双曲旋转”合成,所谓双曲旋转就是矩阵为

的变换。正如普通的旋转保持单位圆周一样,双曲旋转保持双曲线 x^2=1+z^2,而让其内侧的点互相变动。同样,说这种变换会给出和上面同样的群,这并非显然的事,然而事实确实如此,从而双曲模型和上面两个模型是等价的。

洛仑兹几何学

这是一个用于狭义相对论的几何学,以 4 维时空,又称闵可夫斯基空间为模型。它与 4 维的欧几里得几何学的主要区别在于它考虑的不是两点(t,z,g,z)和(t',x',y',z')的通常的距离,而是以下的量

如果不是前面的极为重要的负号,它就是欧几里得距离的平方。这反映了一个事实,即时间和空间是极为不同的(虽然它们交织在一起)。

洛仑兹变换就是一个由 R^4 到 R^4 而且保持上面的 "广义距离" 不变的线性映射。令 g 为(t,x,y,z)到(-t,x,y,z)的线性映射,而 G 为 g 的相应的矩阵(主对角线上的元素为-1,1,1,1,其余元素为 0 的矩阵),我们可以抽象地定义洛仑兹变换为

对于一个点(t,x,y,z),如果

就说这个点是类空的;而若

就说它是类时的;而若

就说它位于光锥上。所有这些都是真正的洛仑兹几何学的概念,因为它们都是被洛仑兹变换所保持的。

洛仑兹几何学对于广义相对论也有基本的重要性,广义相对论可以说就是对洛仑兹流形的研究。这些都与黎曼流形密切相关。

本文来自微信公众号:老胡说科学 (ID:LaohuSci),作者:我才是老胡

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享