Skip to content

公理化集合论

1. 朴素集合论的困境

在集合论的早期发展阶段,数学家们主要依赖直觉来理解集合。这种早期的理论被称为 朴素集合论(Naive Set Theory)。

1.1 什么是朴素集合论

定义 朴素集合论(Naive Set Theory)是由康托尔(Georg Cantor)创立的,它将集合定义为“任何确定的、可以清晰辨别的对象的全体”。

在这个定义下,我们似乎可以根据任何性质 P(x)P(x) 来构造一个集合 A={xP(x)}A = \left\{ x \mid P(x) \right\}。这种不受限制的构造原则被称为 概括原则(Axiom of Comprehension)。虽然这种直观的定义在处理有限集和简单的无限集时非常方便,但它隐藏了一个致命的逻辑缺陷。

1.2 罗素悖论

1901 年,英国哲学家罗素(Bertrand Russell)发现了一个简单的逻辑矛盾,彻底动摇了朴素集合论的基础。这个矛盾被称为 罗素悖论(Russell's Paradox)。

推导过程:

考虑所有不属于自身的集合构成的集合 RR

R={xxx}R = \left\{ x \mid x \notin x \right\}

根据概括原则,既然我们可以定义性质 P(x)xxP(x) \equiv x \notin x,那么 RR 应该是一个合法的集合。现在我们问一个简单的问题:RR 是否属于它自己?

  1. 如果 RRR \in R,根据 RR 的定义,RR 必须满足性质 P(R)P(R),即 RRR \notin R。这产生了矛盾。
  2. 如果 RRR \notin R,那么 RR 满足了定义中要求的性质,因此它应该属于 RR,即 RRR \in R。这同样产生了矛盾。

无论哪种情况,都会推导出其相反的结论。这意味着“所有集合的集合”或者像 RR 这样的对象,不能被简单地视为一个普通的集合。

1.3 其他著名的悖论

除了罗素悖论,数学家们还发现了其他几种类似的矛盾:

  1. 理发师悖论(Barber Paradox):这是罗素悖论的通俗版本。一个小镇的理发师声称:“我只给镇上所有不给自己刮胡子的人刮胡子。”那么,理发师是否应该给自己刮胡子?如果他给自己刮,他就违反了承诺;如果他不给自己刮,根据承诺他必须给自己刮。
  2. 布拉利-福尔蒂悖论(Burali-Forti Paradox):涉及到序数的概念。它指出,如果所有序数的全体构成一个集合,那么这个集合本身也会有一个序数,而这个序数将大于集合中的所有序数,从而产生矛盾。
  3. 康托尔悖论(Cantor's Paradox):涉及到基数的概念。它指出不存在最大的基数,因为任何集合的幂集的基数都大于原集合的基数。如果存在一个“所有集合的集合”,它的幂集将会有更大的基数,但这又是矛盾的。

1.4 悖论的根源分析

这些悖论的根源在于 无限制的概括原则。在朴素集合论中,我们假设任何逻辑性质都可以定义一个集合,这导致了“太大的”对象(如所有集合的全体)被当作集合处理。

为了解决这些问题,数学家们意识到必须建立一套严格的公理系统,对集合的构造规则进行限制。这就是公理化集合论的由来。通过公理化,我们不再从“什么是集合”的哲学定义出发,而是通过一组公理规定“集合可以做什么”以及“如何构造新集合”。

2. ZFC 公理系统

目前最广泛接受的集合论公理系统是 ZFC 公理系统

2.1 ZFC 的命名与背景

ZFC 代表 策梅洛-弗兰克尔集合论(Zermelo-Fraenkel Set Theory),其中末尾的 C 代表 选择公理(Axiom of Choice)。

  • Zermelo(策梅洛)在 1908 年提出了第一套公理系统。
  • Fraenkel(弗兰克尔)和 Skolem 随后对其进行了改进,引入了替换公理。

ZFC 使用一阶逻辑的形式语言。它唯一的原始谓词是二元关系 \in(属于)。所有的数学对象在 ZFC 中都被看作是集合。

2.2 外延公理

定义 外延公理(Axiom of Extensionality)规定,两个集合相等当且仅当它们拥有完全相同的元素。

形式化表述:

AB[x(xAxB)A=B]\forall A \, \forall B \, \left[ \forall x \, (x \in A \Leftrightarrow x \in B) \Rightarrow A = B \right]

直觉解释: 这说明一个集合的本质完全由它的成员决定。元素的排列顺序和重复次数都不影响集合的身份。

例子: 集合 A={1,2}A = \left\{ 1, \, 2 \right\}B={2,1}B = \left\{ 2, \, 1 \right\} 是相等的。集合 C={1,2,2}C = \left\{ 1, \, 2, \, 2 \right\}AA 也是相等的,因为它们包含的元素(即 1 和 2)是一样的。

2.3 空集公理

定义 空集公理(Axiom of Empty Set)保证存在一个不包含任何元素的集合。

形式化表述:

Ax(xA)\exists A \, \forall x \, (x \notin A)

直觉解释: 这个集合被记作 \emptyset。它是所有构造的起点。根据外延公理,空集是唯一的。

例子: “所有会飞的猪”组成的集合(在现实世界中)就是一个空集。

2.4 配对公理

定义 配对公理(Axiom of Pairing)规定,给定任意两个集合 aabb,存在一个集合包含且仅包含这两个元素。

形式化表述:

abCx(xCx=ax=b)\forall a \, \forall b \, \exists C \, \forall x \, (x \in C \Leftrightarrow x = a \lor x = b)

直觉解释: 我们可以把任意两个现有的东西“装进”一个新的集合里。这个新集合记作 {a,b}\left\{ a, \, b \right\}。如果 a=ba = b,则得到单元素集 {a}\left\{ a \right\}

例子: 给定 \emptyset{}\left\{ \emptyset \right\},我们可以构造出 {,{}}\left\{ \emptyset, \, \left\{ \emptyset \right\} \right\}

2.5 并集公理

定义 并集公理(Axiom of Union)规定,对于任意一个集合族 F\mathcal{F},存在一个集合包含所有属于 F\mathcal{F} 中某个成员的元素。

形式化表述:

FAx[xAB(BFxB)]\forall \mathcal{F} \, \exists A \, \forall x \, \left[ x \in A \Leftrightarrow \exists B \, (B \in \mathcal{F} \land x \in B) \right]

直觉解释: 它允许我们将一个“集合的集合”摊平。如果 F={B1,B2,}\mathcal{F} = \left\{ B_1, \, B_2, \, \dots \right\},那么其并集就是 B1B2B_1 \cup B_2 \cup \dots

例子: 如果 F={{a,b},{c,d}}\mathcal{F} = \left\{ \left\{ a, \, b \right\}, \, \left\{ c, \, d \right\} \right\},那么 F={a,b,c,d}\cup \mathcal{F} = \left\{ a, \, b, \, c, \, d \right\}

2.6 幂集公理

定义 幂集公理(Axiom of Power Set)规定,对于任意集合 AA,存在一个集合 PP 包含 AA 的所有子集。

形式化表述:

APB(BPBA)\forall A \, \exists P \, \forall B \, (B \in P \Leftrightarrow B \subseteq A)

直觉解释: 它保证了从给定集合中产生更大集合的能力。PP 记作 P(A)\mathcal{P}(A)

例子: 如果 A={1,2}A = \left\{ 1, \, 2 \right\},则 P(A)={,{1},{2},{1,2}}\mathcal{P}(A) = \left\{ \emptyset, \, \left\{ 1 \right\}, \, \left\{ 2 \right\}, \, \left\{ 1, \, 2 \right\} \right\}

2.7 无穷公理

定义 无穷公理(Axiom of Infinity)保证存在一个无限集合。

形式化表述:

I[Ix(xIx{x}I)]\exists I \, \left[ \emptyset \in I \land \forall x \, (x \in I \Rightarrow x \cup \left\{ x \right\} \in I) \right]

直觉解释: 它描述了一个归纳过程:从空集开始,不断地把当前集合和它的单元素集并起来。这实际上构造了自然数系统:0=,1={},2={,{}}0 = \emptyset, \, 1 = \left\{ \emptyset \right\}, \, 2 = \left\{ \emptyset, \, \left\{ \emptyset \right\} \right\} 等。

例子: 自然数集 N\mathbb{N} 就是这样一个集合。

2.8 分离公理模式

定义 分离公理模式(Axiom Schema of Separation)规定,给定一个集合 AA 和一个逻辑性质 P(x)P(x),存在一个集合包含 AA 中所有满足 PP 的元素。

形式化表述:

ABx(xBxAP(x))\forall A \, \exists B \, \forall x \, (x \in B \Leftrightarrow x \in A \land P(x))

直觉解释: 这是解决罗素悖论的关键。它不允许我们凭空构造集合 {xP(x)}\left\{ x \mid P(x) \right\},而只能从一个 已经存在 的集合 AA 中“过滤”出子集。因为必须先有 AA,我们就无法构造包含所有集合的全体。

例子: 从实数集 R\mathbb{R} 中分离出大于零的数,构成正实数集 R+\mathbb{R}^{+}

2.9 替换公理模式

定义 替换公理模式(Axiom Schema of Replacement)规定,如果一个可定义的映射 ff 的定义域是一个集合,那么它的值域也是一个集合。

形式化表述:

A[xA!yP(x,y)By(yBxAP(x,y))]\forall A \, \left[ \forall x \in A \, \exists ! y \, P(x, \, y) \Rightarrow \exists B \, \forall y \, (y \in B \Leftrightarrow \exists x \in A \, P(x, \, y)) \right]

直觉解释: 只要映射关系是确定的,我们可以用一个集合中的元素去“替换”成另一组对象,结果仍然是一个集合。

例子: 如果 A={1,2,3}A = \left\{ 1, \, 2, \, 3 \right\},映射 f(n)=n2f(n) = n^2,那么 {1,4,9}\left\{ 1, \, 4, \, 9 \right\} 也是一个集合。

2.10 正则公理

定义 正则公理(Axiom of Regularity)也称基础公理。它规定每个非空集合 AA 都包含一个元素 xx,使得 xxAA 不相交。

形式化表述:

A(AxA(xA=))\forall A \, (A \neq \emptyset \Rightarrow \exists x \in A \, (x \cap A = \emptyset))

直觉解释: 它排除了集合论中的某些“怪异”结构,比如集合属于自身(AAA \in A)或者循环属于(ABAA \in B \in A)。它确保了集合是由基础元素(最终到空集)层层构建出来的。

例子: 集合 {A}\left\{ A \right\},其中 A={A}A = \left\{ A \right\} 被这条公理禁止了。

2.11 选择公理

定义 选择公理(Axiom of Choice, AC)规定,对于任意一个由非空集合组成的集族,存在一种方法从每个集合中恰好选出一个元素,构成一个新的集合。

形式化表述:

F[Ff:FF s.t. AF,f(A)A]\forall \mathcal{F} \, \left[ \emptyset \notin \mathcal{F} \Rightarrow \exists f : \mathcal{F} \to \cup \mathcal{F} \, \text{ s.t. } \forall A \in \mathcal{F}, \, f(A) \in A \right]

直觉解释: 想象你有无穷多个盒子,每个盒子里至少有一只鞋子。选择公理告诉我们,你可以同时从每个盒子里拿出一只鞋子。虽然对于有限个盒子这显而易见,但对于无限个盒子,我们需要这条公理来保证这种“选择”行为的可能性。

例子: 从无限个非空开区间的集合中,各选出一个实数。

3. 从公理构建集合

有了这些公理,我们就可以严谨地建立数学大厦的基础。

3.1 从零开始:冯·诺依曼构造

我们从空集 \emptyset 开始,利用配对公理和并集公理构造出自然数的表示:

  1. 0=0 = \emptyset
  2. 1={0}={}1 = \left\{ 0 \right\} = \left\{ \emptyset \right\}
  3. 2={0,1}={,{}}2 = \left\{ 0, \, 1 \right\} = \left\{ \emptyset, \, \left\{ \emptyset \right\} \right\}
  4. 3={0,1,2}={,{},{,{}}}3 = \left\{ 0, \, 1, \, 2 \right\} = \left\{ \emptyset, \, \left\{ \emptyset \right\}, \, \left\{ \emptyset, \, \left\{ \emptyset \right\} \right\} \right\}

以此类推,n+1=n{n}n+1 = n \cup \left\{ n \right\}

3.2 构造有限集

例 2.1 如何证明 {a,b,c}\left\{ a, \, b, \, c \right\} 是一个集合?

  1. 根据配对公理,{a,b}\left\{ a, \, b \right\} 是集合。
  2. 根据配对公理,{c}\left\{ c \right\}(即 {c,c}\left\{ c, \, c \right\})是集合。
  3. 再次使用配对公理,构造集合的集合 F={{a,b},{c}}\mathcal{F} = \left\{ \left\{ a, \, b \right\}, \, \left\{ c \right\} \right\}
  4. 使用并集公理,F={a,b,c}\cup \mathcal{F} = \left\{ a, \, b, \, c \right\} 是集合。

3.3 分离公理的应用

例 2.2 假设我们已经有了自然数集 N\mathbb{N}。我们想构造所有偶数的集合。 定义性质 P(n)kN(n=2k)P(n) \equiv \exists k \in \mathbb{N} \, (n = 2k)。 根据分离公理,集合 E={nNP(n)}E = \left\{ n \in \mathbb{N} \mid P(n) \right\} 是一个合法的集合。

4. 关于选择公理的讨论

选择公理(AC)在 ZFC 中是最特殊的一条,因为它只断言了选择函数的“存在性”,却没有给出具体的构造方法。

4.1 AC 的直觉与反直觉

对于有限集,AC 是多余的,因为我们可以逐个指定元素。但对于无限集,如果没有 AC,很多直觉上成立的结论都无法证明。

然而,AC 也会推导出一些极具冲击力的结果。最著名的是 巴拿赫-塔尔斯基悖论(Banach-Tarski Paradox):它指出一个三维实心球体可以被分割成有限个部分,然后通过平移和旋转,将这些部分重新组合成两个与原球体完全一样的球体。这在物理世界显然是不可能的,但在数学抽象中,由于 AC 允许我们构造出“不可测”的集合,这种分割是理论上存在的。

4.2 独立性

库尔特·哥德尔(Kurt Gödel)在 1938 年证明了,如果 ZF 公理系统是相容的,那么 ZF + AC 也是相容的。这意味着 AC 不会与 ZF 产生冲突。 保罗·科恩(Paul Cohen)在 1963 年证明了,即使假设 AC 不成立,ZF 依然可以是相容的。 因此,AC 是独立于 ZF 的:你既不能证明它,也不能证伪它。在现代数学中,我们通常默认包含 AC。

5. 类与集合

由于概括原则受到了限制,我们必须区分哪些对象可以被称为“集合”,哪些对象“太大”以至于不能被称为集合。

定义 真类(Proper Class)是指那些规模太大、不能作为其他集合元素的数学对象。

在集合论的语境下,我们统称所有的构造为 (Class)。

  • 如果一个类是某个集合的元素,它就是 集合
  • 如果一个类不是任何集合的元素,它就是 真类

TIP

简单来说,集合是类的一种,而真类是那些“坏掉”的类。

例 2.3 所有集合的全体(Universe of all sets)记作 VV。如果 VV 是一个集合,那么根据幂集公理和康托尔定理,它会引发矛盾。因此,VV 是一个真类。

例 2.4 在罗素悖论中提到的 R={xxx}R = \left\{ x \mid x \notin x \right\}。在 ZFC 框架下,由于正则公理禁止了 xxx \in x,实际上所有的集合都满足 xxx \notin x。因此 RR 其实就是所有集合的全体 VV。罗素悖论的本质是告诉我们:RR 不是一个集合,它是一个真类。

参考文献

  1. Russell, B. (1903). The Principles of Mathematics. Cambridge University Press.
  2. Zermelo, E. (1908). Untersuchungen über die Grundlagen der Mengenlehre I. Mathematische Annalen.
  3. Fraenkel, A. (1922). Zu den Grundlagen der Cantor-Zermeloschen Mengenlehre. Mathematische Annalen.
  4. Cohen, P. J. (1963). The Independence of the Continuum Hypothesis. Proceedings of the National Academy of Sciences.