基数
1. 等势
我们在前面的章节中已经探讨了集合的基本运算、关系以及函数。现在,我们要面对一个直觉上简单,但在无限领域却极具挑战性的问题:如何比较两个集合的“大小”?
对于有限集合,比较大小非常直接,我们只需要数出集合中元素的个数,然后对比数字。但是,当集合包含无限多个元素时,这种“数数”的方法就失效了。例如,自然数集 和偶数集 ,哪一个更大?直觉可能告诉我们 包含 ,所以 更大。然而,Georg Cantor 提出了一个划时代的想法:通过建立元素之间的一一对应关系(即双射)来定义集合的“等大”。
1.1 比较“大小”的历史局限
在 Cantor 之前,人类对“无穷”的理解很大程度上停留在潜无穷(Potential Infinity)的层面,即无穷只是一个不断增长的过程,而非一个完成的实体。由于无法“数完”无穷,人们习惯于认为所有无穷都是一样的。Cantor 的革命性在于他引入了实无穷(Actual Infinity),将无穷集合视为一个整体进行研究。
1.2 等势的定义
定义 等势(Equipotent / Equinumerous):设 是两个集合。如果存在一个从 到 的双射 ,则称集合 与 等势,记作 。
这个定义的精髓在于,它不要求我们知道具体的元素数量,只要能证明两个集合的元素可以“一个对一个”地排满,它们就是等大的。这就像是在一个礼堂里,如果你看到每个座位上都坐着一个人,且没有多余的座位也没有站着的人,那么即便你没数过,你也知道座位数和人数是相等的。
@theorem-1 等势是集合类上的等价关系。
证明:
- 自反性:对任意集合 ,恒等映射 是双射,故 。
- 对称性:若 ,则存在双射 。由于 是双射,其逆函数 也是双射,故 。
- 传递性:若 且 ,则存在双射 和 。复合函数 也是双射,故 。
既然等势是一个等价关系,它就将所有的集合划分成了互不相交的等价类。
定义 基数(Cardinal Number):我们将与集合 等势的所有集合组成的等价类对应的“特质”称为 的基数,记作 (或 )。若 ,则说它们的基数相等,即 。
在有限集中,基数就是我们熟悉的元素个数。但在无限集中,基数代表了某种特定的“无穷等级”。基数的引入不仅让我们能够定量地描述无穷,还为我们建立了一套严谨的无穷算术体系。
TIP
我们可以把基数看作是一个“标签”,贴在所有互相同势的集合上。比如,所有的可数无限集都贴着 这个标签。
1.3 基数的序
定义了相等的概念后,我们需要定义基数之间的大小关系。这种序关系的建立,本质上是考察一个集合是否能够单射到另一个集合中。
定义 设 是两个集合。
- 如果存在一个从 到 的单射 ,则称 的基数小于等于 的基数,记作 。
- 如果 且 ,则称 的基数严格小于 的基数,记作 。
这个定义符合我们的直觉:如果 可以完全“塞进” 里面(通过单射),那么 的规模就不应该超过 。
@inference-1 对于任何集合 :
- 。
- 若 且 ,则 。
这说明基数的“小于等于”关系具有自反性和传递性。至于反对称性(即如果 且 ,是否蕴含 ),这正是后面我们要详细讨论的 Cantor-Bernstein-Schröder 定理。
2. 有限集与无限集
在引入基数概念后,我们可以对有限和无限给出严谨的数学定义。
定义 有限集(Finite Set):如果一个集合 与某个自然数 等势(在集合论中,),则称 为有限集。此时记 。空集 与 等势,是有限集。
定义 无限集(Infinite Set):不是有限集的集合称为无限集。
虽然“无限”意味着无法与任何自然数对应,但无限集之间也存在微妙的区别。Richard Dedekind 提供了另一个观察视角。
定义 Dedekind 无限(Dedekind-infinite):如果一个集合 存在一个真子集 使得 ,则称 为 Dedekind 无限。
@theorem-2 一个集合是无限集当且仅当它是 Dedekind 无限的。
这个定理将“集合无法被自然数数完”与“集合能与其真子集一一对应”联系了起来。
2.1 无限集的子集
无限集的一个显著特征是它必然包含一个可数无限子集。
@theorem-2.1 每一个无限集都包含一个可数无限子集。
证明: 设 为无限集。我们可以通过选择过程构造一个序列:
- 从 中取出一个元素 。因为 是无限的, 不为空。
- 从 中取出一个元素 。以此类推。
- 对任何有限步 ,从 中取出一个元素 。 这个过程可以无限持续下去,得到的序列 组成了 的一个可数无限子集。
TIP
这个定理看似显而易见,但实际上隐含了对选择公理(Axiom of Choice)的某种形式的应用。我们需要在每一步“选择”一个元素。在更严格的集合论讨论中,这对应于可数选择公理(Axiom of Countable Choice)。
这说明可数无限势 是所有无限基数中最小的一个。也就是说,没有任何一个无限集合的势比自然数集还要小。换言之, 是无穷世界的第一个门槛。
2.2 希尔伯特旅馆
为了直观地理解无限集的特异性,我们可以回顾一下大数学家大卫·希尔伯特提出的著名思想实验。
希尔伯特旅馆(Hilbert's Hotel)拥有无限个房间,分别编号为 。
- 一个新客人入住:即使旅馆已经客满(即所有房间都有人),我们也只需要让原本在房间 的客人搬到房间 ,就能空出 0 号房间给新客人。这对应于 。
- 无穷多新客人入住:如果来了一辆装载着可数无穷多客人的客车,我们只需要让原本在房间 的客人搬到房间 ,空出的所有单号房间就能安置所有新客人。这对应于 。
- 无穷多辆无穷客车:如果来了可数无穷多辆车,每辆车都有可数无穷多客人。我们可以利用之前提到的 枚举法来安置他们。这对应于 。
希尔伯特旅馆生动地展示了,对于无限集合来说,其真子集可以与其自身具有相同的“承载能力”。
例 2.1:证明自然数集 是无限集。 考虑到函数 ,定义为 。显然 是一个双射,而 是 的真子集。根据定义, 是 Dedekind 无限的,因此是无限集。
这个例子揭示了无限集的一个“反直觉”特性:整体可以与其局部等大。这也是希尔伯特旅馆悖论(Hilbert's Paradox of the Grand Hotel)的核心。
3. 可数集
在所有的无限集中,最简单、最小的一种是与自然数集等势的集合。
3.1 可数集的定义
定义 可数无限集(Countably Infinite Set):与自然数集 等势的集合称为可数无限集。
定义 可数集(Countable Set):如果一个集合是有限集或可数无限集,则称其为可数集。
我们用希伯来字母 (aleph)来标记无限集的基数。自然数集的基数记作 (读作 aleph-null 或 aleph-zero)。
3.2 可数集的例子与性质
可数集的直观含义是:你可以把集合里的元素排成一个序列 ,从而确保每一个元素最终都能被“数”到。
例 3.1:整数集 是可数的。 虽然 在两端都是无限的,但我们可以通过交替排列正负数来构造双射 :
其排列顺序为:。每一个整数都会出现在这个序列的某个有限位置上。
例 3.2:笛卡尔积 是可数的。 这可以通过 Cantor 的对角线枚举法(Cantor Pairing Function)来证明。我们将所有的二元组 列成一个二维矩阵:
枚举的顺序如下:
- 第一条对角线(和为 0):
- 第二条对角线(和为 1):
- 第三条对角线(和为 2): 以此类推。具体的双射公式为 。
@theorem-3 可数集的子集是可数的。
@theorem-4 可数个可数集的并集仍是可数的。
证明: 设 是一族可数集。对每个 ,由于它是可数的,我们可以将其元素列为 。 那么并集 的元素可以由二元组 来标识,其中 是集合的索引, 是元素在集合内的索引。 通过例 3.2 中的枚举方法,我们可以建立从 到 的满射。由于 是可数的,其满射像(即 )必然也是可数的。
例 3.3:有理数集 是可数的。 有理数可以表示为 ,其中 。这实际上建立了从 到 的一个满射。由于 和 都是可数的,它们的积也是可数的,从而 是可数的。
这一结论在当时非常具有震撼力。虽然有理数在数轴上是密集的(任何两个有理数之间都有无限个有理数),但它们的数量却并不比自然数多。这种密集性并没有改变它们的可数本质。
@theorem-4.1 代数数集是可数的。 代数数是某个以整数为系数的多项式的根。由于每个多项式的根是有限的,而多项式的集合是可数的,因此所有代数数的集合也是可数的。
这意味着,绝大多数实数其实都不是代数数。那些不是代数数的实数称为“超越数”(Transcendental Numbers),如 和 。我们可以推断,超越数集不仅存在,而且是不可数的。
4. 不可数集
在 Cantor 之前,数学家普遍认为“无限”只有一种。但 Cantor 证明了,实数集 的无限程度要比自然数集 “更高级”。
4.1 Cantor 对角线论证
这是数学史上最精妙、最重要的证明之一。
@theorem-5 Cantor 对角线定理:实数集 是不可数的。
这一发现彻底打破了“所有无穷都相等”的陈旧观念,它展示了数学结构的惊人深度。为了更直观地理解,我们可以把实数想成在数轴上的每一个点,而自然数则是上面标注的整数。即便我们标记了无限多个整数,它们与实数的密度相比,依然如同漫天星辰中的尘埃。
证明: 我们只需要证明区间 是不可数的。如果 是可数的,那么我们可以将其所有元素列为一个序列 。 每个实数 都可以写成十进制小数的形式(为了唯一性,我们不允许出现以 结尾的循环):
其中 。 现在,我们构造一个新的实数 ,构造规则如下: 对每一位 ,我们令 不同于 。例如:
显然,。但是,对于任何自然数 , 的第 位小数 与 的第 位小数 都不相等,因此 。 这意味着 不在我们的序列中!这与“序列包含 中所有实数”的假设矛盾。 因此, 不可能是可数的。
4.2 对角线论证的核心思想
对角线论证的核心在于“逐位构造”和“不一致性”。我们利用已有的序列,在对角线上进行修改,从而确保构造出的新元素与序列中任何一个元素在至少一个位置上不相等。这种方法在计算机科学(如判定性问题)中也有极广泛的应用。
我们称实数集的基数为连续统的势(Power of the Continuum),记作 。由上述证明可知 。
4.3 更多不可数集的例子
例 4.1:任何非退化区间 都与 等势。 我们可以构造双射 ,例如 。通过线性变换,任何 都能与 等势。
例 4.2: 与 等势。 虽然平面看起来比直线“多”了一个维度,但它们的点是一样多的。证明思路是将 中的点 的十进制表示进行“交错合并”。例如 和 合并为 。
例 4.3:无理数集是不可数的。 如果无理数集是可数的,由于有理数集也是可数的,它们的并集(即 )将是可数的。这与 的不可数性矛盾。
5. Cantor 定理
Cantor 定理告诉我们,无限的阶梯是永无止境的。
@theorem-6 Cantor 定理(Cantor's Theorem):对于任意集合 ,都有 。其中 是 的幂集。
这一结论的深远意义在于,它彻底否定了“最大无穷”的存在。无论多么庞大的集合,其幂集总是以一种更具爆炸性的方式增长,从而形成了一个无穷的阶梯。这也引发了著名的“所有集合之集合”悖论:如果存在一个包含所有集合的集合 ,那么根据 Cantor 定理, 将比 还要大。然而 的元素也是集合,理应包含在 之中,从而导致 的矛盾。这正是 Russell 悖论的一种体现。
证明:
- 首先,显然 ,因为映射 定义为 是一个单射。
- 接下来证明不存在从 到 的满射。 假设存在满射 。考虑集合:
由于 ,所以 。因为 是满射,必然存在某个 使得 。 现在我们询问: 是否属于 ?
- 若 ,根据 的定义,应有 。但 ,所以 ,矛盾。
- 若 ,则 。根据 的定义,应有 ,矛盾。 无论哪种情况都导致矛盾。因此,满射 不存在。
5.1 幂集与特征函数
理解 的一种方法是通过特征函数。对 的任一子集 ,我们可以定义一个函数 :
这在子集 与映射 之间建立了一一对应。因此,。
推论:不存在“最大的基数”。我们可以通过不断取幂集来获得越来越大的无限。
这些基数序列刻画了数学对象复杂性的层次结构。
事实上,。我们可以将 中的每个子集 对应到一个无限二进序列(即特征函数 ),这又可以对应到 上的二进制实数。
6. Cantor-Bernstein-Schröder 定理
在证明两个集合等势时,直接构造双射往往非常困难。CBS 定理为我们提供了一个极大的便利。
@theorem-7 Cantor-Bernstein-Schröder 定理:如果存在单射 和单射 ,则存在双射 ,即 。
这个定理也被称为基数算术的“夹逼定理”。它极大地简化了证明。在 Cantor 时代,这曾经是一个极难证明的问题,直到 1890 年代才由 Bernstein 和 Schröder 独立给出严密的证明。
6.1 定理的证明
证明: 设 和 均为单射。我们定义 的元素序列。对任意 ,它的“祖先”序列为:
由于 是单射,反向映射(在值域内)是唯一的。这个祖先链可能在某个时刻停止(如果某个元素不在 或 的值域内),也可能永远持续下去。 我们将 划分为三类:
- :祖先链最终停在 的某个元素上。这种情况发生当且仅当链的末端元素属于 。
- :祖先链最终停在 的某个元素上。这种情况发生当且仅当链的末端元素属于 。
- :祖先链无限长。
同理,我们也可以对 进行类似的划分 。 容易验证:
- 将 映射到 (实际上是 把 的元素及其后代推向 )。
- 将 映射到 。
- 建立了从 到 的双射( 把 的元素及其后代推向 )。
于是我们可以构造双射 :
该映射 即为所求的双射。每一个 中的元素都有唯一的归位,且 中的每一个元素都被恰好覆盖一次。
6.2 实例应用
例 6.1:证明 。 虽然直觉上 比 多了两个端点,但由于这两个端点可以被无限的内部点所“稀释”,它们的势是相等的。 显然包含映射 是单射,所以 。 另一方面,定义 为 ,这也是一个单射,所以 。 根据 CBS 定理,。
例 6.2:证明平面 与实数轴 等势。 利用 CBS 定理,我们只需要在两者之间各构造一个单射即可。这比直接寻找一个合并坐标的双射要容易得多。
- 单射 :,显然。
- 单射 :通过交织十进制位来构造。例如 。 根据 CBS 定理,。
7. 基数的算术
我们可以像对自然数那样对基数定义加法、乘法和幂运算。
7.1 基数的加法
定义 基数加法:设 是两个基数。取不相交集合 使得 。定义 。
对于无限基数,加法变得非常奇特:
- (对任意有限 )
直观上,如果你往无限大海里倒一桶水,或者再加一个大海,规模依然是一样的。
7.2 基数的乘法
定义 基数乘法:设 是两个基数。定义 。
性质:
- (见对角线枚举法)
- (见平面与直线的等势性)
- 对任意无限基数 ,有 。
这个结论的几何意义非常有意思。一条单位线段上的点集基数是 ,而单位正方形内部的点集基数也是 。Cantor 在 1877 年发现这一结论时曾感慨道:“我看见了,但我不敢相信。”(Je le vois, mais je ne le crois pas!)
基数加法和乘法的一些恒等式:
- (对 )
基数算术的哲学解释: 无限基数的加法和乘法通常由参与运算的最大基数决定。如果 和 至少有一个是无限的,那么 。同样,如果两个都是无限的且至少一个大于 0,那么 。这反映了在无限的世界里,最大规模的那个子系统往往主宰了整个系统的规模,微小的扰动无法改变无限的势。
7.3 基数的幂
定义 基数幂:设 是两个基数。定义 ,其中 表示所有从 到 的函数构成的集合。
这里 代表了从基数为 的集合到基数为 的集合的映射总数。对于幂集,我们有 。
性质:
- 。这正是实数集与自然数幂集等势的体现。
- 。 证明:。由此可见 。
- 。
- 。这是一个比实数集势更大的集合。
基数算术遵循一些类似自然数指数运算的运算法则:
这些法则可以通过构造集合之间的双射来严格证明。例如,第一个法则对应于 (假设 不相交)。
8. 连续统假设
我们已经知道 。那么,在这两者之间,是否还存在其他的基数?如果存在,那么 就不是紧接着 的第一个不可数基数。如果不存在,那么 就是 。
8.1 连续统假设的陈述
定义 连续统假设(Continuum Hypothesis, CH):不存在基数 使得 。按照 序列的定义,这意味着 。
这个假设由 Cantor 提出,它是希尔伯特在 1900 年提出的 23 个著名数学问题(希尔伯特的 23 个问题)中的第一个问题。它涉及了连续统的结构基础,即我们所生活的实数直线上点集的“丰富程度”是否仅次于自然数集。
8.2 独立性的证明
Cantor 终其一生试图证明这一命题,但未能成功。直到 20 世纪,数学家们才揭开了惊人的真相:
- Kurt Gödel(1940):证明了 CH 与 ZFC 公理系统是相容的。这意味着我们不能在 ZFC 中推翻 CH。
- Paul Cohen(1963):发明了“强迫法”(Forcing),证明了 CH 的否定也与 ZFC 相容。
@theorem-8 连续统假设独立于 ZFC。即在现有的标准集合论框架内,我们既不能证明 CH 是正确的,也不能证明它是错误的。
8.3 哲学意义
这一结论在数学哲学上产生了深远影响。它意味着我们对“无限”的直觉在某种程度上是不确定的。集合论的宇宙并不唯一:
- CH 成立的宇宙:实数集紧接着自然数集。
- CH 失败的宇宙:在自然数和实数之间存在层层叠叠的其他无穷阶梯。
对于许多数学家来说,这种不确定性指向了数学真理的深刻本质。也许 ZFC 公理还不够完善,需要补充新的公理来确立唯一的集合论图景。
定义 广义连续统假设(Generalized Continuum Hypothesis, GCH):对任何无限集合 ,都不存在基数 使得 。
9. 总结与回顾
基数理论是集合论中最引人入胜的篇章之一。它通过“等势”这一简单的概念,揭示了无穷世界的丰富层次。我们从可数的自然数出发,跨越了不可数的实数连续统,最终进入了 Cantor 定理所预示的无穷无尽的基数阶梯。
本章的核心要点:
- 等势:通过双射来比较集合的规模,而不依赖于“数数”。
- 可数性: 虽然看起来规模不同,但它们在基数意义上是相等的,都是 。
- 不可数性:通过对角线论证,我们证明了 的规模严格大于 。
- Cantor 定理:揭示了幂集的势永远大于原集合,从而否定了最大无穷的存在。
- CBS 定理:为证明等势提供了极其强大的工具,只需寻找两个方向的单射。
- 连续统假设:关于无穷结构的未解之谜,它在逻辑上的独立性展示了数学基础的某种灵活性。
通过本章的学习,我们应当建立起一种全新的“无限观”:无限不仅仅是一个符号,它是一系列可以比较、可以运算、具有严密逻辑结构的数学对象。在接下来的章节中,我们将探索与基数并列的另一个重要概念——序数,它将带我们进入良序集和超限归纳法的奇妙世界。