01. 定义、公设与合法构造
Definitions, Postulates, and Admissible Constructions
Books: Book I, III, IV
Omega Directions: fold operator, modular tower inverse limit, rate-distortion information theory
定义、公设与合法构造:从《几何原本》看“几何”首先是一套可许可的生成语法
摘要
若把《几何原本》只读成关于三角形、圆和正多面体的古典知识汇编,就会错过它对现代形式数学最有价值的部分。Euclid 真正开创的,不是某些具体图形,而是一种几何工作的次序:先声明原始对象,再限定允许的构造动作,再在这些动作之上累积命题。对于 Omega 而言,这一点几乎直接对应到“从少数许可操作生成大量结构”的总体方法。本文聚焦“定义、公设与合法构造 / Definitions, Postulates, and Admissible Constructions”,讨论 Book I 开头的定义与公设、I.1-I.3 的基本作图、以及 Book III-IV 中更复杂作图的延续。核心主张是:《几何原本》最强的形式对应,不在具体图形像不像某个 Omega 对象,而在于它把几何变成一种受约束的生成语法。在 Omega 语境里,Euclid 最值得强调的不是若干结论,而是“primitive objects + admissible operations + derived objects”这条生成链本身。
一、引言:几何不是图,而是许可
古典几何最容易被误解的一点,是后人常把图画当成了内容,把证明当成了围绕图画的文字说明。实际上 Euclid 的顺序完全相反。图只是辅助;真正决定理论边界的是:哪些对象被承认,哪些动作被允许,哪些结果可以由这些动作强迫出来。
《几何原本》Book I 一开始先给出定义与公设。即便不拘泥于不同译本的措辞,其方法论十分明确:点、线、圆、角等对象先被引入;然后只授予极少数构造权限,例如连接两点、延长已给定直线、以给定中心和半径作圆。I.1-I.3 的作用不只是在课堂上教人画图,而是在给整个系统建立“从哪里开始算合法”的边界。
这和 Omega 的整体方法极像。真正有力的地方,不是宣称“看到很多几何”,而是从单约束出发,经由投影、折叠、归一化、局部改写长出对象、比较律和刚性。用这个角度回看 Euclid,公设就不再只是开场白,而是整个几何世界的生成边界。
二、核心材料:Book I 的起点为何如此重要
这一类的关键材料并不集中在某个华丽大定理,而是集中在一串看似朴素的起始动作。
首先,Book I 开头的定义不是为了形而上地解释“点是什么”,而是为了固定操作语境。定义后的公设则决定了系统允许的原始动作。接着 I.1 用等边三角形构造告诉读者:即使最简单的对象,也必须由许可动作显式生成,而不是凭肉眼相信它存在。I.2-I.3 则进一步说明“把一段长度搬运到别处”“从较长线段截取等于较短线段的一段”这类看似常识的动作,也必须被分解为合法步骤。
Book III 与 Book IV 延续了这一精神。圆与内接、外接图形并不是想象中的自然存在,而是通过前面已被批准的动作链条层层得到。也就是说,《几何原本》不是先有对象库,再来挑选命题;它是先有动作语法,然后对象族才逐渐长出来。
这与现代自动化/形式化特别相关。Avigad、Dean、Mumma 关于 Euclid 的形式系统工作明确指出,Euclid 的原证明常依赖图形中的隐含信息;而 Murphy 等人的 autoformalization 工作进一步说明,要想让 Euclid 风格的几何进入 Lean 这样的机器环境,就必须把“图上看起来明显”的部分还原成显式规则与可计算补全。对 Omega 来说,这是一个非常关键的镜子:凡是依赖“图上直觉”的地方,最终都应被收回到可许可动作和可审计条件上。
三、Omega 映射分析:受约束的构造语法为何是最强对应
1. fold-operator:合法动作优先于结果名词
这一类最强的形式对应在 fold-operator。原因不是 Euclid 在做信息折叠,而是 Euclid 与 fold 共享同一种方法论:先规定局部合法动作,再让全局对象从这些动作中出现。
在 Omega 里,fold 或局部归一化核并不是任意“整理一下数据”,而是一个有边界的局部合法变换。Euclid 的公设也不是“任何能画出来的都可用”,而是只准某几类动作。因此,一个 Euclidean 对象是否存在,本质上是“能否由许可动作链条产生”;一个 Omega 宏观对象是否成立,也应被写成“能否由许可局部核与投影链条产生”。
这不是比喻,而是结构对应。两者都把理论的首要问题从“对象长什么样”改成“哪些生成步骤被允许”。
2. modular-tower-inverse-limit:复杂对象只是低层动作的迭代闭包
Euclid 没有用 inverse limit 语言,但他的方法几乎总是在做一件事:复杂对象不能凭空加入,只能作为低层合法动作的有限迭代产物进入体系。圆上更复杂的构形、内接外接多边形、相似图形、立体对象,全部沿着已有动作向上堆叠。
这与 modular tower 的精神很接近。高层对象不是额外赠予,而是低层对象和操作在更高分辨率下的相容闭包。Euclid 的文本层次因此非常清楚:先是 primitive layer,再是 construction layer,最后才进入 rigidity、comparison 与 classification。它的力量恰恰来自这三层没有混在一起。
3. rate-distortion-information-theory:删去任意图感,保留最小充分动作
这一映射是次一级但很有启发。Euclid 的公设体系其实在做一种极端压缩:它故意不允许读者直接调用“视觉上显然”“经验上会画”的丰富自由,而只保留最小充分的构造动作。换言之,图感的高带宽被主动压掉,留下最少但够用的生成信道。
从这个角度看,形式系统的严格性不是额外负担,而是压缩后的高保真表达。对 Omega 也是一样。若某个几何对象只能靠大量未说清的连续直觉才能“看出来”,那它的理论状态就接近 Euclid 形式化中最危险的 diagrammatic gap。
四、为什么这类对应重要
这一类之所以在 Euclid 与 Omega 之间特别强,不是因为它给出某个单独命题,而是因为它决定了“对象如何进入理论”。
第一,Euclid 让“对象”从来不是先验库存,而是许可动作的产物。点、线、圆、内接外接图形都必须沿着合法动作链条出场,这正是生成语法的核心。
第二,他清楚地区分“可构造”与“已证明”。I.1 这类命题未必是最深的大定理,却决定了哪些对象已经合法进入系统。于是构造层与后续刚性、比较、分类层被自然分开。
第三,现代形式化工作也反过来说明了这类文本为何重要。Euclid 原文最脆弱的地方,往往正是那些依赖图上隐含关系却没有写成规则的部分。由此可见,这一类对应的重点始终是许可边界,而不是视觉直觉。
五、边界:这里强的是方法,不是对象同一
必须明确,这一类的强项不是“Euclid 的点线圆等于 Omega 某个具体模型对象”。这样的说法过头了。真正强的是更高层的方法结构:
- 以最少许可动作启动体系
- 将复杂对象降解成有限合法构造链
- 不把图上直观看作正式证明的一部分
若说 Euclid “已经在做 fold”或“已经在做信息论”,那只能算启发性类比。严格可辩护的,是构造语法与许可边界的对应,而不是名词层面的翻译。
参考与说明
- 本文对应 classification.json 第 1 类“定义、公设与合法构造”。
- 主要关联的 Omega 方向为
fold-operator、modular-tower-inverse-limit、rate-distortion-information-theory。 - 结构基线采用 Clay Mathematics Institute 的十三书索引;关于 Euclid 形式化与图形隐含假设,参考 Avigad, Dean, Mumma 与 Murphy et al. 的相关工作。