数学很难的原因之一是,很多简单的概念被推广到了难以理解的程度

在数学中,当一个重要的数学定义已经提出,一个重要的数学定理已经证明后,事情还远未结束。不论一项数学工作已经如何清晰了,总还有更多的了解它的余地,最常用的方法之一,就是把它陈述为一个更广泛的东西的特例(推广)。有不同种类的推广,这里只讨论其中的几个。

弱化假设和强化结论

印度天才数学家拉马努金发现的数字 1729 很有名,因为它可以用两种不同方式写成两个正整数的完全立方的和,就是

而且 1729 是这类数中最小的一个。让我们试着来检验,是否有一个数可以用四种不同方式写成四个完全立方之和。

初看起来,这个问题似乎是难得令人吃惊,如果真有这样的数,这个数必定是很大很大,如果想一个数接着一个数地去试,又必定是极为冗长乏味。那么,有没有什么聪明的方法呢?

回答是必须把假设弱化。我们想解决的问题属于下面的一般类型。给出一个正整数序列 a_1,a_2,a_3…,而且告诉了我们这个序列具有某个性质。然后要证明,一定存在一个正整数,使得它可以用十种不同的方式写成这个序列中四项之和。这样思考问题可能有一点人为造作的味了,因为假设了这个序列是 "完全立方数的序列",因为这个性质的序列(比起所谓“具有某个性质 " 的序列”) 显得过于特殊,所以比较自然的想法是把这个问题看成是一个特定序列的鉴别问题。然而,这种思考问题的方式鼓励我们考虑有这样的可能性,就是这个结论可能对于广泛得多的序列仍然为真,而结果确实如此。

有 1 000 个完全立方数小于或等于 1 000 000 000。我们将会看到正是这个事实,就足以保证“存在一个整数,而它可以用十种不同方式写成四个完全立方数之和”。具体说来,我们的问题变成证明∶

为了证明这件事,我们先要注意到,从序列中任意取四项的方式有 1000×999×998×997/24 种,这个数小于 400 亿,而这个序列中任意四项之和必不大于 40 亿。所以现在有 400 亿个不大于 40 亿的数,其中必有重复的数,平均说来,取相同值的数应该有十个以上。所以,在 400 亿个数中,至少有一个会取 40 亿个值的某一个十次以上,证毕。

为什么用这种方式把问题推广会有助于问题的解决?人们可能会以为,在证明一个结果时,假设越少,证明就越难。然而时常并不如此。假设越少,在用这个假设来证明时,需要作的选择也越少,这有时会加快对于证明的搜寻。如果没有把这个问题推广如上,就会有过多的选择。例如,可能会试着去解非常困难的含立方项的丢番图方程,而不是像现在这样作简单的计数问题。

我们也可以认为上面的推广就是结论的强化∶原来的问题只是一个关于立方的命题,而我们的证明则多得多。弱化假设与强化结论,并没有清晰的区别,

证明一个更抽象的结果

模算术里有一个著名的结果,称为费马小定理∶如果 p 是一个素数,而正整数 a 不是 p 的倍数,则 a^(p-1)除以 p 时,余数必为 1。就是说 a^(p-1) mod p 必定同余于 1。

这个结果有几种证明,其中之一是寻求推广的好例证。以下就是其论证的概要。

第一步,证明数 1,2,…,p-1 在 mod p 的乘法下构成一个

mod p 的乘法就是说相乘以后要除以 p 并取其余数。举例来说,若取 p=7,则 3 与 6 的积“mod7”是 4,因为 4 是 3×6=18 除以 7 所得的余数。

第二步,注意到,若 1≤a≤p-1,则 a 的幂 mod p 构成此群的子群,而且这个子群的大小是最小的使得 a^m=1,modp 的整数 m,然后应用拉格朗日定理,即群的大小必定可用子群的大小整除。现在群的大小是 p-1,所以 p-1 可用 m 整除,但是 a^m=1,modp,所以 a^(p-1)=1,modp。定理证毕。

这个论证表明,如果恰当地看待,费马小定理只是拉格朗日定理的一个特例(不过,整数 modp 成为一个群并不是完全显然的。这个事实可以用欧几里得算法来证明)。

费马本人不可能这样来看他的定理,因为在他证明这个定理时,群的概念还没有发明。所以,群的抽象概念帮助人们以全新的方式来看待费马小定理∶可以把它看作是一个更一般的结果的特例,但是当新的抽象概念没有发展起来以前,甚至无法陈述这个更一般的结果。

这个抽象化过程有许多好处,最明显的是它给了一个更一般的定理,一个具有许多其他有趣的应用的定理。一旦看到了这一点,就能一下子证明一般的结果,而不必分别证明各个特殊结果。一个与之有联系的好处是,它使我们能够看到,许多原来似乎无关的结果之间是有联系的。而在数学的不同领域间找到联系几乎一定会影响这门学科的显著的进展。

鉴别出特征性质

定义根号 2 的方式和定义虚数 i 的方式成了明显的对照。定义根号 2 的方法是,先证明确有一个正实数存在,而且其平方为 2。然后,定义此数即为根号 2。

对于虚数 i,这种风格的证明是不可能的,因为没有哪个实数平方以后会等于 -1。所以,我们代之以另一个问题∶如果有一个数平方以后会等于-1,那么,关于这个数有哪些性质?这样一个数不可能是实数,但这并未排除一种可能性,就是扩张实数系为一个更大的数系,使之能够包含-1 的一个平方根。

初看起来,似乎我们恰好是知道了关于 i 的一件事,即 i^2=-1。但是如果还假设 i 服从算术的正常的法则,就还可以做更多有趣的计算,例如

这意味着(1+i)/根号 2 是 i 的一个平方根。

从这两个简单的假设(即 i^2=-1 以及 i 服从算术的通常法则)就能发展起整个复数理论而不必为 i 究竟是什么操心。而事实上,思考一下根号 2 的存在性,就会看到,根号 2 的存在性其实并不如它的定义性质那么重要,而这个定义性质与 i 的定义性质是非常相似的,这个定义性质就是平方以后给出 2,以及服从算术的通常法则。

数学中许多重要的推广都是这样行事的。另一个重要的例子是当 x 和 a 均为实数而 x 为正时 x^a 的定义。除非 a 是正整数,x^a 这个表达式很难看出有什么意义,然而,不论 a 取什么值,数学家们拿着这个表达式却好像没事人一样,这是怎么回事呢?答案在于,关于 x^a,真正要紧的不在于它取什么值,而在于把它当作 a 的一个函数时,它的特征性质是什么

所谓特征性质,不仅是说它所具有的性质,而且是只要有了这个性质,那就是它,也就是仅有它才具有的性质

x^a 的最重要的特征性质就是

有了这个性质,再加上另外几个性质,就完全确定了 x^a 这个函数。

抽象化和分类之间有着有趣的关系。“抽象”这个词在数学中时常是指这样一部分数学,在那里更经常使用一个对象的特征性质来进行讨论,而不是直接从对象的定义来做论证抽象的最终目的,是从一组公理,例如群或向量空间的公理,开始来探讨其推论。然而,有时为了对这些代数结构进行推理,对它们进行分类会很有帮助,分类的结果是使它们变得更具体。例如,每一个有限维实向量空间 V 都同构于某个 R^n,而 n 是一个非负整数。把 V 想作一个具体的 R^n,而不是想作一个满足某些公理的代数结构,时常很有帮助。于是,在一定意义下,分类是抽象化的对立面

重新陈述以后再推广

是一个在日常语言中也很熟悉的数学概念,例如,一把椅子的照片就是一个 3 维对象的 2 维表示,因为椅子有高度、宽度和深度,但是它的像只有高度和宽度。粗略地说,一个图形的维就是可以沿着它自由运动而始终停留在此图形内的独立的方向的个数,这个粗略的概念可以在数学上定义精确(利用向量空间的概念)。

如果给了一个图形,则它的按正常理解的维应该是一个非负整数。说我们可以在例如 1.4 个独立的方向上运动是没有意义的,然而,确实有一个分数维的严格的数学理论,在这个理论中,任意给一个非负实数 d,都可以找到一个 d 维的图形。

数学家们是怎样做到这件似乎不可能的事情的呢?答案是把这个概念重新陈述了,只有这样,才能推广它。这句话的意思就是给维以一个具有以下性质的新的定义∶

对于所有的“简单的”图形,维的新定义和老定义一致。例如在新定义下,直线仍是 1 维的,正方形仍是 2 维的,立方体仍是 3 维的。

在新定义下,每个图形的维一定是正整数这一点不再是显然的。

做这件事有好几种方法,但其中的绝大多数都集中在长度、面积和体积这些概念的差别上。注意,一条长度为 2 的直线段,可以分成两个互不重叠的长度为 1 的直线段的并;一个边长为 2 的正方形可以分成四个互不重叠的边长为 1 的正方形的并;而一个边长为 2 的立方体,可以分成八个互不重叠的边长为 1 的正方体之并。因此,若把一个 d 维图形按因子 r 放大,则其 d 维“体积”会被乘上因子 r^d。假设现在想展示一个 1.4 维图形。方法之一是取

然后找一个图形 X,把它按因子 r 放大,而且使得放大的图形可以分成两个互不相交的 X 的复本。X 的两个复本,体积应该是 X 的“体积”的两倍,所以 X 的维数 d 应该满足方程 r^d=2。按照我们对 r 的选择知道,X 的维数为 1.4。

另一个初看起来没意义的概念是不可交换几何学。“交换”这个词本来只用于二元运算,所以属于代数而不属于几何学,那么,不可交换几何学可能有什么意思呢?

但是现在,答案已经不再令人惊奇了∶人们用某个代数结构来重新陈述几何学的一部分,然后再推广这里的代数。这个代数结构涉及到一个可交换的二元运算,所以,允许这个二元运算为不可交换的,就推广了这个代数。

这里讲到的几何学的一部分就是流形的研究。与流形 X 相关的有定义在此流形 X 上的复值连续函数的集合 C(X)。给出了 C(X)中的两个函数 f 和 g 以及两个复数 λ 和 μ,则线性组合 λf+μg 仍是一个复值连续函数,从而仍在 C(X)中,所以 C(X)是一个向量空间。然而,还可以把 f 与 g 相乘。这个乘法有各种自然的性质(例如,对于一切函数 f,g 和 h 有 f(g+h)=fg+fh),这就使得 C(X)成为一个代数,甚至是一个 C*-代数。后来发现,紧流形 X 上的相当大一部分几何学可以纯粹地以 C*-代数 C(X)的语言来重新陈述。这里的“纯粹地”这个词意味着并无必要讲到流形 X,而 C(X)本来是参照着流形 X 来定义的 ,我们需要的仅是 C(X)是一个代数。这就意味着有可能有这样的不是几何地生成的代数,但是对于它们,经过重新陈述的几何概念仍然可用。

代数里有两个二元运算∶向量空间运算和乘法。向量空间运算总是假设为可交换的,但是乘法可不一定∶如果乘法也是可交换的,就说这个代数是可交换代数。因为 fg 和 gf 显然是同一个函数,代数 C(X)就是一个可交换 C*-代数,所以从几何学产生的代数总是可交换代数。然而有许多几何概念在用代数语言重新陈述以后,对于不可交换的 C*-代数仍有意义,"不可交换几何学" 这个词就这样使用起来了。

这样一种重新陈述以后再推广的程序在数学的许多最重要的进展中都有。现在看本文的第三个例子∶算术的基本定理。它是数论的基石之一,它指出∶每一个正整数都可以唯一的方式写成素数之积。然而数论专家总要看扩大的数系,在绝大多数这类数系中,算术的基本定理的明显的类似定理都是不成立的。

然而,有一种自然的方法推广“数”的概念,使之包括理想数,这样,就可以在例如刚才所述的那种环内,证明算术的基本定理的一种版本。首先把问题重新陈述如下∶对每一个数 γ,做所有倍数 δγ 的集合,其中 δ 是环中的元。记此集合为(γ),具有以下的封闭性质∶若 α,β 都属于(γ),而 δ,ε 都是此环中之元,则

一个环的具有以上封闭性质的子集合,就称为一个理想。如果一个理想具有(γ)的形状,γ 是某个数,则此理想称为一个主理想。然而,存在不是主理想的理想,所以,可以把理想的集合看成是推广了原来的环的元素的集合。结果是有自然的加法和乘法的概念可以适用于各个理想。此外,定义一个理想为“素”理想也是有意义的,这里,说理想 I 为素理想,即是指唯一地写 I 为两个理想 J,K 之积的方式是 J,K 中有一个是“单位元”。在这个扩大的集合上因子的唯一分解定理是成立的。这些概念给了一种非常有用的在原来的环中“量度因子分解的唯一性定理失效程度”的标尺。

更高的维数和多个变元

我们已经看到,当不是只考虑单变元的一个方程,而是考虑许多变元的方程组时、多项式方程的研究会变得复杂得多。例如偏微分方程,它们可以看作是涉及多个变量的微分方程,典型地,分析它们会比分析常微分方程困难得多。多变元的多项式方程组以及偏微分方程是一种过程的两个值得注意的例子,这个过程就是从单变元推广到多变元,产生了许多最重要的数学问题和结果,特别是在 20 世纪以来。

设有一个涉及三个实变量 z,y 和 z 的方程。把三元组(z,y,2)看成单独一个对象,而不是三个数的一组,这种想法时常是有用的。此外,这种对象有着自然的解释∶它代表 3 维空间的一点。这个几何解释是重要的,而且在很大程度上有助于说明为什么把许多定义和定理从一个变元推广到多个变元如此有趣。如果把一项代数的工作从单变元推广到多变元,就可以认为,这是从 1 维的背景推广到高维的背景。这个思想引导到代数与几何的许多联系,使得来自一个领域的技巧可以用于其他领域。

本文来自微信公众号:老胡说科学 (ID:LaohuSci),作者:我才是老胡

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

文章价值:
人打分
有价值还可以无价值
置顶评论
    热门评论
      文章发布时间太久,仅显示热门评论
      全部评论
      请登录后查看评论
        取消发送
        软媒旗下人气应用

        如点击保存海报无效,请长按图片进行保存分享