陶哲轩专访:数学证明与人工智能的未来 “理论是对宇宙的一种压缩” |6.5万字全文+视频

发布时间:2025-06-15 20:02:16

本文作者:小古

文:Web3天空之城| 未经许可不得转载

【城主说】陶哲轩被誉为当今世界最天才的数学家,“数学界莫扎特”,。这位菲尔兹奖与数学突破奖得主,其工作的广度与深度常被拿来与百年前的巨人希尔伯特相提并论。然而,在一个人工智能以前所未有的速度渗透进人类智力活动最前沿的时代,即便是陶哲轩这样的大脑,也在重新思考数学的本质、证明的形态以及未来的研究范式。

在这场与莱克斯·弗里德曼的对话中,陶哲轩抛出了一系列极具颠覆性的观点。其中最核心的,或许是他对理论本质的精辟概括:一个好的理论,就是对现实世界的一种极致高效的“压缩”——用最少的参数,解释最多的观测。这个看似简单的比喻,不仅揭示了从纳维-斯托克斯方程到广义相对论等物理难题的核心,也为我们理解人工智能在未来科学发现中的角色,提供了一个全新的视角。当机器开始辅助甚至独立探索时,我们如何判断一个新“理论”的优劣?陶哲轩的答案,可能就藏在这“压缩效率”之中。

视频上集:

视频下集:

从“麦克斯韦妖”到“流体计算机”:伟大难题的内在结构

对于普通人而言,数学难题往往意味着无尽的复杂计算。但在陶哲轩看来,真正困难且有趣的问题,其核心魅力在于其内在的结构性矛盾。他以著名的“百万美元难题”——纳维-斯托克斯方程(Navier-Stokes equations)为例,揭示了这类问题的深层困境。这个支配着流体运动的方程,其难点在于,我们无法从数学上完全排除一种极端情况:能量通过一种诡异的“阴谋”,不断从大尺度集中到越来越小的尺度,最终导致速度变为无限的“爆破”(blow-up)。

这种现象,陶哲轩用了一个绝妙的类比来解释:麦克斯韦妖。这是一个思想实验中的“小恶魔”,它能以一种违背统计学规律的方式操纵粒子,导致系统出现极不可能的有序状态。在流体力学中,这个“恶魔”就是一种潜在的自组织机制,它能抵抗住使流体趋于平静的黏性力,将能量汇聚于一点。

那么,回到纳维-斯托克斯方程,流体具有一定量的能量。而由于流体处于运动状态,能量会随之传输...但潜在地存在某种“恶魔”,不断将流体的能量推向越来越小的尺度。它会移动得越来越快...可能会出现一种所谓的自相似爆发情景,即流体的能量从某个大尺度开始,然后将其全部能量传递到一个更小的流体区域,接着以更快的速度进入一个甚至更小的区域...能量实际上可以在有限时间内会聚到一点。

面对这种看似无法攻破的难题,陶哲轩展现了他作为“狐狸型”数学家的典型策略:与其正面硬攻,不如战略性“作弊”。他通过修改物理定律,关闭了方程中某些使能量分散的“通道”,人为地创造了一个更容易发生“爆破”的简化模型。这个模型虽然不是真实世界,但它的存在本身就构成了一道“障碍”,它告诉所有试图证明“爆破永不发生”的数学家:你们的证明,必须利用到真实方程中那些被我关闭掉的、微妙的特性。

而这个过程,将他的思维引向了一个更为大胆的奇想:构建一台“流体计算机”。他意识到,如果能通过设计特定的流体初始形态,让水流的碰撞模拟出逻辑门(与门、或门),那么原则上,就可以用流体构建一台图灵机。这台“水朋克”式的计算机,可以被编程来执行一个任务:创造一个更小、更快的自身副本,然后将所有能量传递给它并“关闭”自己。这个过程不断迭代,就将构成一个真正的“爆破”解。

所以我意识到,如果你能对实际方程实现同样的事情,也就是说如果水的方程支持计算...你可以将它们串联起来,或许就能创造出一台图灵机。这样你就能拥有完全由水构成的计算机了...所以如果你能建造一台流体机器,它就是一台流体机器人。它的作用...是被编程为会以某种“冷”状态创造出自身的更小版本...这个配置好的水体形态的大机器人会将其所有能量转移给更小的配置体,然后关闭。然后剩下的就是这种最新的状态,它会随后启动并做同样的事情,但更小、更快。

从一个经典的偏微分方程问题,到构造一个“作弊”的玩具模型,再到设想一台能自我复制的“流体计算机”——这个思维路径,完美展现了陶哲轩的解题艺术:不畏惧问题的复杂性,而是通过跨领域的类比(从热力学到计算理论),去寻找和构建理解问题本质的全新框架。

结构与随机:驱动数学世界的二元对立

在陶哲轩的数学观中,存在一个反复出现的核心主题,一个深刻的二元对立:结构(Structure)与随机(Randomness)。他认为,数学中绝大多数对象,比如圆周率的数字,看起来都是随机的,不具备任何明显规律。然而,数学家花费大量精力研究的,往往是那些罕见的、具有优美结构的对象。而数学中最深刻、最困难的问题,恰恰诞生于这两股力量的交汇处。

孪生素数猜想(Twin Prime Conjecture)便是最典型的例子。这个问题之所以困难,是因为它将两个看似无关的世界强行连接在了一起。

自然数附带有两种基本运算:加法和乘法...任何只涉及加法的自然数问题都相对容易解决,任何只涉及乘法的问题也相对容易解决。但令人沮丧的是,当你将两者结合起来时,突然间你就得到了这种极其丰富…的结构。即使是最简单的问题,如果它们将乘性事物(例如质数)与加性事物(例如偏移2)结合起来...将这两者关联起来一直异常困难。

质数由乘法定义,其分布看起来极其随机;而“相差2”则是一个纯粹的加法结构。这个猜想,本质上是在问一个随机性的海洋(质数)中,能否稳定地出现一个特定的结构(孪生对)。陶哲轩指出,这种模式非常“脆弱”,你只需从素数集合中精心地移除极少数成员,就能让孪生素数猜想不成立,同时几乎不改变素数整体的统计性质。这意味着,任何证明都必须依赖于素数某种极其精细、非统计的内在属性。

与此相反,他和本·格林(Ben Green)证明的格林-陶定理,则处理了一种更为“稳健”的结构——等差数列。他们证明,无论你如何随机地从素数中剔除绝大部分成员,剩下的集合里依然会像“蟑螂”一样,顽固地存在任意长度的等差数列。

算术级数之所以坚不可摧,是因为无论你的集合看起来是随机的还是有结构的,比如周期性的,在这两种情况下,算术级数都会出现,但原因不同。这基本上就是这些定理的证明方式,这类算术级数定理有很多证明,它们都是通过某种二分法证明的,其中你的集合要么是有结构的,要么是随机的,在这两种情况下,你都可以得出一些结论...但在孪生素数中,如果质数是随机的,那么你就很高兴,你就赢了。但如果你的质数是有结构的,它们可以以一种特定的方式构造,从而消除孪生素数。而且我们不能排除那种阴谋。

这种“要么有结构,要么是随机”的二分法,是现代数学,尤其是组合数学和数论中的一个强大思想。它允许数学家将一个复杂问题分解为两种情况:如果对象是随机的,就用概率论的工具;如果对象是有结构的,就用代数或傅里叶分析等工具。无论哪种情况,都能取得进展。这正是陶哲轩所说的“逆定理”(Inverse theorems)的威力所在——它们提供了一种方法,去检验一个看似随机的对象背后,是否隐藏着某种深刻的结构。

从“赶猫”到“相变”:人工智能将如何重塑数学

如果说“结构与随机”是数学世界的内在法则,那么人工智能(AI)和形式化证明工具,则是正在重塑其外在形态的革命性力量。陶哲轩坦言,自己正深度参与这场变革,尽管他将目前与AI协作的体验形容为赶猫 herding cats——充满潜力,却也极其耗费心力。

他所使用的核心工具是Lean,一种形式化证明语言。它能将数学证明转化为计算机可以100%验证的代码,但代价是巨大的。陶哲轩估计,将一个人类证明形式化,目前需要花费10倍的时间和精力。这就像在向一个极其吹毛求疵的同事解释你的论证,他会质疑你的每一个微小步骤。

Lean是一种也能做到这一点的语言。它也可以作为一种标准的传统语言运行,但它也可以生成证书...Lean不仅能得出答案,还能提供它是如何得出7这个答案的证明...所以现在我估计,形式化一个证明所需的时间和精力大约是将其写出来所需时间的10倍。是的,所以这是可行的,但你不会……这很烦人。

然而,这种烦人的精确性,却带来了两个意想不到的巨大优势。首先,它让大规模、可信的协作成为可能。在一个涉及50位作者的庞大项目中,陶哲轩和他的合作者们利用Lean,将一个大问题分解为数百万个小问题,并进行众包。由于Lean保证了每一份贡献的绝对正确性,他们可以进行“无信任数学”(trustless math),即接纳任何人的贡献而无需担心其可靠性。

其次,它极大地增强了证明的可维护性。当一个证明中的某个核心参数需要被更新时(例如,将一个常数从12改进为11),在传统的纸笔世界里,这将是一场灾难,需要逐行检查数百页的论证。但在Lean中,编译器会自动标记出所有受影响的代码行,将数周的工作量压缩到一两天。

陶哲轩坚信,我们正处在一个相变 phase transition的前夜。就像当年LaTeX取代所有其他排版工具一样,随着AI助手的不断进化(例如提供更智能的代码补全和引理搜索),将证明形式化的成本与收益之比正在迅速变化。

但总有一天它会降到1以下,那就是相变。因为突然间,写论文时先用Lean写...就变得有意义了...过去发生的一种此类相变是LaTeX的普及...但在某个时间点,LaTeX变得比所有其他竞争对手都更容易使用,人们在几年内就转向了它。那只是一次剧烈的阶段性转变。

他预测,到2026年,我们将看到由AI与人类合作完成的、达到真正研究级别的数学成果。更长远看,AI或许能通过分析海量数据,在两个看似无关的领域之间发现全新的、优美的猜想——这被他认为是AI在短期内最可能实现的、真正震撼人心的突破。

在访谈的最后,当被问及对未来抱有何种希望时,陶哲轩的回答回到了教育和下一代。他认为,科学的进步就在于,“过去非常困难的问题可能会变得微不足道...现在对我们来说似乎不可行的事情,未来可能只是家庭作业练习。”

天空之城全文整理版 初探研究级难题:柿谷猜想

莱克斯: 以下是与陶哲轩的对话,他被广泛认为是历史上最伟大的数学家之一,常被称为数学界的莫扎特。他曾获得菲尔兹奖和数学突破奖,并在数学和物理学的诸多令人惊叹的领域做出了开创性工作。这对我来说是巨大的荣幸,原因有很多,其中包括泰瑞在与我所有的互动中所展现出的谦逊和善意。这意义重大。这里是莱克斯·弗里德曼播客。

莱克斯: 您遇到的第一个真正困难的研究级数学问题是什么?也许是让您有所迟疑的问题?

陶哲轩: 嗯,我的意思是,在您的本科教育中,您会学到那些真正困难、看似不可能解决的问题,比如黎曼猜想、双生质数猜想。你可以把问题任意地复杂化。那算不上是真正的问题。事实上,甚至有一些我们已知是无解的问题。真正有趣的是那些恰好介于我们相对容易解决和毫无希望之间边界上的问题,即现有技术可以完成约90%的工作,而你只需要补足剩下10%的难题。

陶哲轩: 我认为,作为一名博士生,柿谷问题无疑引起了我的注意。事实上,它刚刚被解决了。这是我在早期研究中大量涉猎的一个问题。从历史上看,它源于日本数学家柿谷宗一在大约1918年提出的一个小谜题。

莱克斯: 所以这个谜题是:你有一个在平面上的针。

陶哲轩: 把它想象成在路上开车之类的。并且你想执行一个U型转弯。你想调转指针的方向。但你想在尽可能小的空间内完成它。所以你想利用这块小区域来将其调转。但这个指针是无限灵活可控的。所以你可以想象只是让它旋转起来。它是一根单位针。你可以围绕其中心旋转它。我认为这会给你一个面积为,我想,四分之π的圆盘。或者你可以做一个三点掉头,这就是我们在驾校教人们做的。而那实际上占用了八分之π的面积。所以它比旋转稍微更有效率。因此,有一段时间人们认为那是使物体调转方向最有效的方式。

陶哲轩: 但贝尔萨科维奇(Bersakovich)指出,事实上,你只需使用任意小的面积就能使针调转方向。比如0.001,你可以进行某种非常奇特的多次来回掉头操作,从而使针调转方向。这样做的话,它会经过每一个中间方向。

陶哲轩: 这是在二维平面内吗?是在二维平面内。所以我们对二维空间中的一切都了如指掌。那么下一个问题是三维空间中会发生什么。那么假设哈勃太空望远镜是太空中的一个管状物,而你想要观测宇宙中的每一颗恒星。所以你想要旋转望远镜以覆盖每一个方向。而这就是不切实际的部分。假设空间非常宝贵,而实际上它完全不是。你想要占据尽可能小的体积,以便旋转你的“针”状物,从而看到天空中每一颗恒星。你需要多小的体积才能做到这一点?

陶哲轩: 因此你可以修改贝尔萨科维奇的构造。那么如果你的望远镜是零厚度,那么你可以使用你所需要的尽可能小的体积。那是对二维构造的一个简单修改。但问题是,如果你的望远镜不是零厚度,而只是非常非常薄,具有某个厚度delta,那么要能够看到每一个方向所需的最小体积作为delta的函数是多少?随着德尔塔变小,随着针变细,体积应该下降。但它下降的速度有多快呢?猜想是它下降得非常非常慢,粗略来说,是呈对数关系地下降。经过大量工作后,这一点得到了证明。

陶哲轩: 所以这看起来像一个难题。它为何如此引人关注?结果发现,它与偏微分方程、数论、几何学、组合学中的许多问题都有着惊人的关联。例如,在波传播中,你泼洒一些水,就会产生水波,它们会向各个方向传播。但波既展现粒子行为,也展现波动行为。所以你可以得到所谓的波包,它就像一种高度局域化的波,在空间上局域化,并随时间向某个特定方向移动。因此,如果你在空间和时间上绘制它,它会占据一个看起来像管状的区域。

陶哲-轩: 因此,可能发生的情况是,你可以有一个最初非常分散的波,但在时间稍后,它会全部聚焦于一个单点。你可以想象将一颗石子投入池塘,波纹会扩散开来。但如果你对那个场景进行时间反演,并且波动方程是时间可逆的,你就可以想象波纹汇聚到一个单点,然后发生一次巨大的飞溅,甚至可能是一个奇点。因此,这样做是可能的。从几何学上来说,正在发生的是总是存在某种光线。因此,例如,如果这个波代表光,你可以将这个波想象成以光速传播的光子的叠加。它们都沿着这些光线传播,并且都聚焦于这一个点。

陶哲轩: 因此,你可以使一个非常分散的波在空间和时间上的一个点聚焦成一个高度集中的波,但随后它会再次散焦并分离。但潜在地,如果这个猜想有一个负解,这意味着存在一种非常有效的方式,可以将指向不同方向的管状物打包到一个体积非常非常狭窄的区域中,那么你也能够创造出始于...的波。会有某种波的排列,它们一开始非常非常分散,但它们不会只集中在一个点上,而是在空间和时间上会有大量的集中点。并且你可以创造出所谓的“解的爆破”现象,即这些波的振幅变得如此之大,以至于它们所遵循的物理定律不再是波动方程,而是更复杂和非线性的东西。

陶哲轩: 因此在数理物理中,我们非常关心波动方程中的某些方程是否稳定,以及它们是否能产生这些奇点。有一个著名的未解决问题,叫做纳维-斯托克斯方程正则性问题。纳维-斯托克斯方程是支配流体或像水这样的不可压缩流体的方程。这个问题问道,如果你从一个水的光滑速度场开始,它是否会集中到如此程度,以至于在某个点上速度变为无限大?那被称为一个奇点。我们在现实生活中没有看到过这种情况。如果你在浴缸里泼水,水不会在你身上爆炸,也不会以光速飞溅出去,但潜在地它是可能发生的。事实上,近年来,共识已倾向于认为,对于例如水的某些非常特殊的初始配置,奇点确实可以形成。但人们尚未能真正证实这一点。克莱数学研究所提出了这七个千禧年大奖难题,解决其中一个难题将获得一百万美元的奖金。这是其中一个。在这七个问题中,目前只有庞加莱猜想已被解决。

陶哲轩: 因此,卡凯亚猜想与纳维-斯托克斯问题并非直接相关,但理解它将有助于我们理解诸如波集中等方面的某些现象,这间接地可能会帮助我们更好地理解纳维-斯托克斯问题。

百万美元难题:纳维-斯托克斯方程

莱克斯: 您能谈谈纳维-斯托克斯问题吗?嗯,就是像您所说的,它的存在性与光滑性,一个千禧年大奖难题。是的。您在这个问题上取得了很大进展。2016年,您发表了一篇论文,名为《三维平均纳维-斯托克斯方程的有限时间爆破》。那么,我们正在努力弄清楚这东西通常是否不会爆炸。对。但我们能确定地说它永不爆炸吗?

陶哲轩: 对。嗯。那么,嗯,那确实是百万美元的问题。嗯。那么,这就是数学家与几乎所有其他人不同的地方。比如说,如果某件事百分之99.99的时候都成立,那么对于大多数情况来说,这已经足够了。但数学家是少数真正关心是否所有情况,比如百分之百,真正百分之百的所有情况都被涵盖的人。所以,大多数流体,在大多数时候,水不会爆炸。但是,你是否能设计一个非常特殊的初始状态来导致这种情况发生呢?

莱克斯: 也许我们应该说,这是一组在流体力学领域中起支配作用的方程,旨在理解流体的行为方式。实际上,结果发现它确实非常复杂,你知道,流体,是的,是一种极其复杂难以建模的事物。

陶哲轩: 是的。所以,它具有实际重要性。因此,这个克雷奖问题涉及被称为不可压缩纳维-斯托克斯方程(组)的理论,该理论支配着像水这样的物质的行为。还有一种叫做可压缩纳维-斯托克斯方程(组)的理论,它支配着像空气这样的物质的行为。而这对于天气预报尤为重要。天气预报中包含大量的计算流体力学应用。很多时候,它实际上就是尽其所能地试图求解纳维-斯托克斯方程。还需要收集大量数据,以便他们能够初始化方程。这牵涉到很多方面。所以,这是一个非常重要的实际问题。

莱克斯: 为什么很难证明该方程组的普遍性结论,例如它不会发散?

陶哲轩: 简短的回答是麦克斯韦妖。那么,麦克斯韦妖是热力学中的一个概念。比如,如果你有一个装有两种气体——氧气和氮气的盒子,你可能一开始让所有氧气在一边,氮气在另一边,但它们之间没有屏障,那么它们就会混合。而且它们应该保持混合状态。没有理由说明它们会分离。但是,原则上,由于它们之间所有的碰撞,可能会有一种奇怪的阴谋,也许存在一个被称为麦克斯韦妖的微观妖魔,它会在每次氧原子和氮原子碰撞时,使它们以这样一种方式反弹:氧原子会漂移到一边,而氮原子则去到另一边。这样就可能出现一种我们从未见过的极不可能的配置。从统计学上讲,这是极不可能的。但从数学上讲,这可能发生,我们不能排除这种可能性。

陶哲-轩: 这种情况在数学中经常出现。一个基本例子是圆周率的数字,3.14159 等等。这些数字看起来没有规律,我们也相信它们没有规律。从长远来看,1、2 和 3 的出现次数应该与 4、5 和 6 的出现次数一样多。圆周率的数字不应该有任何偏好,例如偏爱 7 而非 8。但也许圆周率的数字中存在某种妖魔,每当你计算出越来越多的数字时,它就会某种程度上偏向某个数字。而这是一种本不应发生的诡异现象。它没有理由发生,但以我们当前的技术无法证明。

陶哲轩: 好的,那么回到纳维-斯托克斯方程,流体具有一定量的能量。而由于流体处于运动状态,能量会随之传输。水也具有黏性。因此,如果流体分布在许多不同位置,流体的固有黏性就会耗散能量,使其趋于零。这正是我们实际用水进行实验时发生的情况。你泼洒时,会产生一些湍流和波浪等等,但最终它会平静下来。而且振幅越小,速度越小,它就越平静。

陶哲轩: 但潜在地存在某种“恶魔”,不断将流体的能量推向越来越小的尺度。它会移动得越来越快。速度越快,黏度效应相对越小。因此,可能会出现一种所谓的自相似爆发情景,即流体的能量从某个大尺度开始,然后将其全部能量传递到一个更小的流体区域,接着以更快的速度进入一个甚至更小的区域,依此类推。每次发生这种情况,所需时间可能只有上一次的一半。然后,能量实际上可以在有限时间内会聚到一点。这种情景被称为有限时间爆发。

陶哲-轩: 那么在实践中,这种情况不会发生。所以水是所谓的湍流。确实如此,如果你有一个大的水涡流,它会倾向于分解成更小的涡流。但它不会将所有能量从一个大涡流传递到一个小涡流。它可能会转化为三到四个。然后那些又分裂成各自可能的三到四个小涡流。因此能量会分散到粘度能够控制住一切的程度。但是,如果它能以某种方式集中所有能量,将它们全部聚集在一起,并且进行得足够快,使得粘性效应没有足够时间使一切平静下来,那么这种爆裂现象就可能发生。

陶哲轩: 因此,有些论文声称,哦,你只需要考虑能量守恒,并谨慎地利用粘度,就可以控制住一切,不仅是纳维-斯托克斯方程,还包括许多许多这类方程。因此,过去曾有许多尝试来获得纳维-斯托克斯方程的所谓全局正则性,这与有限时间爆裂相反,意味着速度保持光滑。然而,所有这些尝试都失败了。总会出现一些符号错误或微妙的失误,并且无法挽救。

陶哲轩: 所以我感兴趣的是尝试解释为什么我们无法反驳有限时间爆裂现象。我无法对实际的流体方程进行这项工作,因为它们太复杂了。但是,如果我能对纳维-斯托克斯运动方程进行平均化处理,也就是说,如果我能关闭某些类型的水相互作用方式,只保留我想要的。具体来说,如果存在流体,并且它能将能量从一个大涡流传递到这个小涡流或另一个小涡流,我就会关闭会将能量传递给这个涡流的能量通道,只将其导向这个更小的涡流,同时仍保留能量守恒定律。

莱克斯: 所以你正在尝试制造一个爆破解。

陶哲轩: 是的。所以我基本上通过改变物理定律来构造一个爆破解,这是数学家被允许做的一件事。我们可以改变方程。

莱克斯: 这如何帮助你更接近某个证明呢?

陶哲轩: 对。所以它提供了数学中所谓的“障碍”。所以我所做的,基本上是,如果我关闭了方程的某些部分,这通常会在你关闭某些相互作用时,使其非线性程度降低,变得更正则,更不容易爆破。但我发现,通过关闭一组精心设计的相互作用,我能迫使能量在有限时间内爆发。这意味着,如果你想证明纳维-斯托克斯方程(即真实方程)的整体正则性,你必须利用真实方程的某些特性,而我的构造方程并不满足这些特性。因此,这排除了某些方法。

陶哲轩: 数学的一个特点是,它不仅仅是找到或采用一种行之有效并加以应用的技术,而是你需要避免采用那些行不通的技术。对于那些真正困难的问题,你常常会想到几十种可能适用于解决问题的方法。但只有在积累了大量经验之后,你才会意识到这些方法根本行不通。因此,对于邻近问题拥有这些反例,在某种程度上排除了(某些方法)。它为你节省了大量时间,因为你不会再把精力浪费在你现在已知绝不可能奏效的事情上。

莱克斯: 它与流体动力学的那个特定问题有多大关联,还是仅仅是你对数学建立起来的更普遍的直觉?

陶哲轩: 没错,是的。我的技术利用的关键现象是所谓的超临界性。在偏微分方程中,这些方程常常是不同力之间的一场拔河。在纳维-斯托克斯方程中,存在源于粘性的耗散力,它已被充分理解。它是线性的,能使事物平息下来。如果只有粘性存在,那么就永远不会发生任何不好的事情。但也存在输运效应,即空间某一位置的能量会因为流体运动而被输运到其他位置。

莱克斯: 那是一种非线性效应,它导致了所有问题。

陶哲轩: 因此,纳维-斯托克斯方程中有两个相互竞争的项:耗散项和输运项。如果耗散项占主导,如果它很大,那么基本上就会得到正则性。如果输运项占主导,那么我们就不知道会发生什么了。这是一个非常非线性的局面。它是不可预测的。它是湍流的。因此,有时这些力在小尺度上处于平衡,但在大尺度上却不平衡,反之亦然。所以纳维-斯托克斯方程是所谓的超临界方程。因此,在越来越小的尺度上,输运项远强于黏性项。所以黏性项是使事物平静下来的因素。

陶哲轩: 这就是为什么这个问题在二维空间中很难。苏联数学家奥尔加·拉德任斯卡娅在20世纪60年代表明,在二维空间中不存在爆破。而在二维空间中,纳维-斯托克斯方程是所谓的临界方程。输运效应和粘性效应的强度大致相同,即使在非常非常小的尺度上也是如此。我们有很多技术来处理临界和次临界方程,并证明其正则性。但对于超临界方程,情况尚不清楚。

陶哲轩: 我做了大量工作,随后也有许多后续研究表明,对于许多其他类型的超临界方程,你可以创建各种爆裂例子。一旦非线性效应在小尺度上主导了线性效应,就会出现各种糟糕的情况。因此,这是这项研究的主要见解之一,即超临界性与临界性和次临界性之间存在巨大差异。

陶哲轩: 我的意思是,这是一个关键的定性特征,它区分了一些方程,使它们表现得良好且可预测,比如行星运动。我的意思是,有些方程你可以预测数百万年,或者至少数千年。再说,这并非真正的问题。但我们无法预测两周以后天气的原因是,它是一个超临界方程。许多非常奇怪的事情正在极小的尺度上发生。

莱克斯: 因此,无论何时存在巨大的非线性源,都可能为预测将要发生的事情带来巨大的问题。

陶哲-轩: 是的,如果非线性在小尺度上不知何故变得越来越显著和有趣。我的意思是,有许多方程是非线性的,但在许多方程中,你可以通过整体来近似事物。例如,行星运动,如果你想了解月球或火星等的轨道,你并不真正需要了解月球地震学的微观结构或者质量究竟是如何分布的。你可以将这些行星近似为质点。而只有整体行为才重要。但是如果你想模拟流体,比如天气,你不能只说在洛杉矶,温度是多少,风速是多少。对于超临界方程,最精细的确认确实非常重要。

奇思妙想:构建一台“流体计算机”

莱克斯: 如果我们能稍微深入探讨一下纳维-斯托克斯方程。你曾提出,或许你可以描述一下,解决它的方法之一,或者说以负面方式解决它的方法之一,将是构建一个液体,一种液态计算机。然后展示计算理论中的停机问题对流体动力学有影响。所以以此方式展示。你能描述一下这个想法吗?

陶哲轩: 对。嗯。这源于构建这个失控的平均方程的工作。所以作为我必须做这件事的一部分,有一种朴素的方法来做这件事。你只是不断地推动。每当你在一个尺度上获得能量时,你立即尽可能快地将其推向下一个尺度。这是一种强制性地造成发散的朴素方法。结果发现在五维及更高维度中,这确实有效。但在三维空间中,我发现了一种奇特的现象。那就是如果你改变物理定律,你总是试图将能量推向越来越小的尺度。结果是能量开始同时扩散到许多尺度上。所以你在一个尺度上拥有能量,你把它推向下一个尺度,然后一旦它进入那个尺度,你也会把它推向下一个尺度,但前一个尺度上仍然有一些能量残留。你试图同时完成所有事情。而这使得能量扩散得过于分散。结果发现,这使得它更容易受到粘性的影响,进而将一切都阻尼耗散掉。因此,事实证明这种直接方法实际上并不可行。还有一篇由其他作者撰写的论文,实际在三维空间中展示了这一点。

陶哲轩: 所以我需要做的就是编程一个延迟,有点像气闸。所以我需要一个方程,它会从流体在某个尺度上发生作用开始,将这种能量推入下一个尺度,但能量会停留在那里,直到所有来自更大尺度的能量都转移完毕。只有在你将所有能量都推入之后,你才能打开下一个“门”,然后也将它推入。通过这样做,能量逐个尺度地缓慢向前移动,使得它一次只局限在一个尺度上。这样它就能抵抗黏性效应,因为它没有被分散。

莱克斯: 因此,为了实现这一点,我不得不构建一个相当复杂的非线性关系。

陶哲轩: 这基本上就像构建一个电子电路。实际上,我为此感谢了我的妻子,因为她是一名电气工程师。

莱克斯: 她必须设计电路等等。

陶哲轩: 如果你想要一个能做某事的电路,比如让灯光闪烁、亮灭交替,你可以用更原始的元件,比如电容器、电阻器等来构建它。你必须绘制一个图表。通过这些图表,你可以凭肉眼跟踪,然后说,哦,电流会在这里积累,然后停止,再然后它会那样做。所以我知道如何构建基本电子元件的模拟物,比如电阻器和电容器等等。我会将它们堆叠起来,以创造出能打开一个门的装置,然后会有一个计时器。然后一旦计时器达到某个阈值,它就会将其关闭。它有点像鲁布·戈德堡式的机器,但却是用数学方式描述的。结果这最终奏效了。

陶哲轩: 所以我意识到,如果你能对实际方程实现同样的事情,也就是说如果水的方程支持计算,那么你就可以想象一种蒸汽朋克,但它实际上是一种水朋克类型的东西,你知道,现代计算机是电子的,它们由电子通过非常微小的导线并与其他电子相互作用等来供电。但你可以想象这些水脉冲以一定的速度移动,而不是电子。也许存在两种不同的配置,分别对应着一位(比特)的向上或向下状态。如果让两个这样的移动水体相撞,它们可能会产生某种新的配置,类似于一个与门或或门。输出将以一种高度可预测的方式取决于输入。你可以将它们串联起来,或许就能创造出一台图灵机。这样你就能拥有完全由水构成的计算机了。

莱克斯: 如果你拥有计算机,那么也许就能实现机器人技术、液压技术等等。这样你就可以创造出一种机器,它基本上是流体模拟的,也就是所谓的冯·诺依曼机器。

陶哲轩: 冯·诺依曼提出,如果你想殖民火星,仅仅是运送人员和机器到火星的成本,就已高得荒谬。但如果你能将一台机器运送到火星,而这台机器有能力开采行星、制造更多材料、冶炼它们并建造更多相同的机器副本,那么随着时间的推移,你就能殖民整个行星。所以如果你能建造一台流体机器,它就是一台流体机器人。它的作用,它存在的目的,是它被编程为会以某种“冷”状态创造出自身的更小版本。它暂时不会启动。一旦准备就绪,这个配置好的水体形态的大机器人会将其所有能量转移给更小的配置体,然后关闭。然后它会自行清理。然后剩下的就是这种最新的状态,它会随后启动并做同样的事情,但更小、更快。然后这个方程具有某种尺度对称性。一旦你这样做,它就可以不断迭代。

陶哲轩: 所以,原则上,这会为实际的纳维-斯托克斯方程创造一个爆破。而这正是我为这个平均纳维-斯托克斯方程设法完成的。所以它提供了这样一种解决问题的路线图。这现在是痴心妄想,因为要实现这个目标,还有很多东西缺失。所以我无法创建这些基本逻辑门。我没有这些水的特殊配置。我的意思是,有包括涡环在内的候选方案可能有效。但同时,你知道,模拟计算比数字计算要糟糕得多,因为它总是存在误差。你在过程中必须进行大量的纠错。我不知道如何完全关闭这台大机器,使其不干扰小型机器的运行。但原则上,一切皆有可能。这不与任何物理定律相矛盾。所以这可以算作这种事物是可能的一种证据。还有其他一些研究小组正在探寻使纳维-斯托克斯方程爆破的方法,这些方法远没有我刚才描述的这么荒谬地复杂。他们实际上正在追求更接近于直接的自相似模型,该模型目前还不能直接生效,但可能存在比我刚才描述的更简单的方案来使其奏效。

莱克斯: 从纳维-斯托克斯方程到这台图灵机,这其中确实存在着天才般的飞跃。所以,它从你试图获得越来越小的自相似斑点情景,转变为现在拥有一个越来越小的液体图リング机,并设法探究这如何能够用来解释爆破现象。

陶哲轩: 我的意思是,那是一个巨大的飞跃。因此,存在先例。我的意思是,数学的特点在于它非常擅长找出你可能认为完全不同的问题之间的联系。但如果数学形式相同,你就可以建立联系。因此,之前有很多关于所谓细胞自动机的工作,其中最著名的是康威生命游戏。这是一个无限的离散网格,在任何给定时间,网格要么被一个细胞占据,要么是空的。细胞如何演化,遵循着一个非常简单的规则。因此,细胞有时存活,有时死亡。我还是学生时,让这些动画持续运行是一个非常流行的屏幕保护程序。它们看起来非常混沌。事实上,它们有时有点像湍流。

陶哲轩: 但在某个时候,人们在“生命游戏”中发现了越来越多有趣的结构。例如,他们发现了一种叫做“滑翔机”的东西。滑翔机是一种非常微小的、由四五个细胞组成的构型,它会演化并朝某个方向移动。那就是这个涡环。所以这是一个类比。康威生命游戏可以看作是一种离散方程,而流体纳维-斯托克斯方程则是一种连续方程。但从数学角度来看,它们具有一些相似的特性。

陶哲轩: 随着时间的推移,人们在康威生命游戏中发现了越来越多可以构建的有趣事物。康威生命游戏是一个非常简单的系统。它只有三到四个规则,但你可以在其中设计出各种有趣的结构。有一种叫做滑翔机枪的东西,它只会一个接一个地吐出滑翔机。经过大量努力,人们成功地为滑翔机创建了与门和或门。有这样一个庞大而令人难以置信的结构,如果你有一股滑翔机流从这里进入,另一股滑翔机流也从这里进入,那么它就可能会产生一股滑翔机流作为输出。也许只有当两股滑翔机流都包含滑翔机时,才会有输出流。但如果只有其中一股有,那么什么也出不来。所以他们可以建造类似那样的东西。一旦你能够建造这些基础门,那么仅仅从软件工程的角度,你几乎可以建造任何东西。你可以建造一台图灵机。我的意思是,它就像一个巨大的蒸汽朋克式装置。它们看起来很荒谬。

陶哲轩: 但后来人们在生命游戏中也生成了自我复制的物体。一台巨大的机器,一台二项式机器,它在漫长的时间里,内部总有小型的滑翔子枪进行着这些非常蒸汽朋克式的计算,它会创造出自身的另一个版本,这个版本能够自我复制。这真是令人难以置信。实际上,其中很多都是由业余数学家通过社区众包完成的。所以我对那项工作有所了解。因此,这也是我提出对纳维-斯托克斯方程做同样事情的部分灵感来源。模拟远不如数字。你不能直接拿“生命游戏”中的构造并照搬过来。但话又说回来,这只表明它是可能的。

结构与随机:数学的二元对立

莱克斯: 你知道,这些元胞自动机中会发生某种涌现现象。局部规则,也许与流体类似,我不知道,但大规模运行的局部规则可以创造出这些极其复杂的动态结构。你认为其中任何一部分适合进行数学分析吗?我们有工具对此进行深入阐述吗?

陶哲轩: 问题是,你可以获得这种涌现的、非常复杂的结构,但只有在初始条件经过非常精心准备的情况下才行。所以这些滑翔机枪、逻辑门和软件机器,如果你只是随机地在“生命游戏”中放置一些细胞,你将看不到任何这些东西。这就是与纳维-斯托克斯方程再次类比的情况。在典型的初始条件下,你不会遇到任何这种奇怪的计算。但基本上,通过工程设计,以非常特殊的方式专门设计事物,你可以做出巧妙的构造。

莱克斯: 我不知道是否有可能证明其反面,比如,基本上证明只有通过工程设计才能创造出有趣的东西。

陶哲轩: 这是数学中一个反复出现的挑战,我称之为结构与随机性之间的二元对立。即你在数学中生成的大多数对象都是随机的。它们看起来是随机的,比如圆周率的各位数字。嗯,我们认为这是一个很好的例子。但只有极少数事物具有模式。你可以通过构造它来证明某物具有模式。如果某物具有简单的模式,并且你有一个证明表明它会每隔一段时间重复自身,你就可以做到这一点。你可以证明大多数数字序列没有规律。如果你只是随机选取数字,有一个称为大数定律的法则告诉你,从长远来看,你得到的一的数量会和二的数量一样多。

莱克斯: 但我们拥有的工具要少得多。

陶哲轩: 如果我给你一个特定的模式,比如圆周率的数字,我如何才能证明它不包含某种奇怪的模式呢?我投入大量时间从事的另一项工作是证明所谓的结构定理或逆定理,这些定理提供了检验某物何时具有很强结构性的方法。

陶哲轩: 因此,有些函数被称为加性的。比如你有一个将自然数映射到自然数的函数,所以二可能映射到四,三映射到六,依此类推。有些函数被称为加性的,这意味着如果你将两个输入相加,输出也会相应地相加。例如,我正在乘以一个常数。如果你将一个数字乘以10,如果你将a加b的结果乘以10,这等同于将a乘以10,将b乘以10,然后再将它们相加。因此,有些函数是可加的。

陶哲轩: 有些函数是近似可加的,但不是完全可加的。举例来说,如果我取一个数字n,将其乘以2的平方根,然后取其整数部分。所以10乘以2的平方根大约是14点几。因此10变成了14,20变成了28。所以在这种情况下,可加性是成立的。因此10加10是20,而14加14是28。但由于这种取整,有时会出现舍入误差。有时当你将a加b时,这个函数不能完全给出两个单独输出的总和,而是总和加一或减一。所以它几乎是可加的,但并非完全可加。

陶哲轩: 所以在数学中有许多有用的结果,而我也在很大程度上致力于发展这类理论,其大意是,如果一个函数展现出某种结构,那么它基本上……它之所以成立是有原因的。而原因在于,存在某个与之相关的函数是完全有结构的,它解释了你所观察到的这种局部模式。

莱克斯: 因此,如果你拥有这些逆定理,它就会形成一种二分法:你所研究的对象要么完全没有结构,要么以某种方式与有结构的事物相关联。

陶哲轩: 无论哪种情况,你都能取得进展。一个很好的例子是,数学中有一个经典定理,叫做塞迈雷迪定理,它在1970年代被证明。它涉及在一个数集中寻找某种类型的模式。这些模式必须形成等差数列,例如3、5和7,或者10、15和20。塞迈雷迪证明,任何足够大的数集,即所谓具有正密度的数集,都包含你想要的任意长度的等差数列。

陶哲轩: 例如,奇数集合的密度为二分之一,并且它们包含任意长度的等差数列。在那种情况下,这显而易见,因为奇数非常有结构性。我可以只取11、13、15、17。我可以轻易地在该集合中找到等差数列。但塞迈雷迪定理也适用于随机集合。如果我取奇数集合,然后对每个数字抛一次硬币,我只保留那些我抛出正面的数字。好的,我只是抛硬币,我只是随机取出半数数字,我保留一半。所以这是一个根本没有任何模式的集合。但仅仅从随机波动中,你仍然会在那个集合中得到很多等差数列。

莱克斯: 你能证明在一个随机...中存在任意长度的等差数列吗?是的。

陶哲轩: 你听说过无限猴子定理吗?通常,数学家给定理起的名字都很无趣,但偶尔他们也会起一些生动的名字。无限猴子定理的通俗说法是,如果你有无限数量的猴子,每只猴子一台打字机,它们可以随机敲出文本。几乎可以肯定,其中一只猴子将会敲出《哈姆雷特》的全部内容,或任何其他有限的文本串。这只是需要一些时间,实际上是相当长的时间。但如果你有无限的数量,那么它就会发生。所以基本上,该定理指出,如果你取一个无限长的数字串或其他什么,最终你想要的任何有限模式都将出现。这可能需要很长时间,但它最终会发生。尤其地,任何长度的等差数列最终都会出现,但这需要一个极其长的随机序列才能实现。

莱克斯: 我想这很直观。它只是无穷。是啊,无穷大能包容许多弊病。

陶哲轩: 我们人类该如何应对无穷大?嗯,你可以把无穷大看作是一个没有上限的有限数的抽象。

莱克斯: 现实生活中没有什么是真正无限的,但你可以问自己这样的问题:如果我想要多少钱就有多少钱,或者如果我想跑多快就跑多快,那会怎样?

陶哲轩: 数学家将此形式化的方法是:数学找到了一个形式体系,可以理想化地将某个极其大或极其小的量,精确地变为无穷大或零。通常,当你这样做时,数学会变得简洁很多。在物理学中,我们开玩笑说假设球形奶牛。现实世界的问题存在各种实际效应,但你可以将其理想化,将某些量推向无穷大,将另一些量推向零,这样数学处理起来就会简单得多。

莱克斯: 我想知道,使用无穷概念在多大程度上迫使我们偏离现实物理学。

陶哲轩: 是的,所以有很多陷阱。我们在本科数学课上花费大量时间教授分析学,而分析学通常是关于如何取极限的。例如,a加b总是等于b加a。因此,当你拥有有限项时,你可以把它们加起来,也可以交换它们的顺序,没有任何问题。但是,当你拥有无限项时,你就可以玩弄这些花招,一个级数可能收敛于一个值,但你重新排列它,它却突然收敛到另一个值。所以你可能会犯错误。当你允许使用无穷概念时,你必须清楚自己在做什么。你必须引入这些ε和δ,而且有一种特定的推理方式可以帮助你避免错误。

陶哲轩: 近些年,人们开始将那些在无限极限下成立的结果进行所谓的有限化处理。所以你最终会知道某件事是真的,但你不知道是何时。现在给我一个速率。那么,如果我没有无限数量的猴子,而是大量的有限数量的猴子,我需要等多久《哈姆雷特》才能出现?那是一个更具定量性质的问题。而这是你可以纯粹通过有限方法来处理的问题,并且你可以运用你的有限直觉。在这种情况下,结果表明它与你试图生成的文本长度呈指数关系。这就是为什么你从来看不到猴子创作出《哈姆雷特》。你也许能看到它们创造出一个四个字母的单词,但绝没有那么大的作品。所以我个人认为,一旦你将一个无限的陈述有限化,它就会变得更直观,也不再那么奇怪了。

莱克斯: 所以即使你正在处理无限,将其有限化也是好的,这样你就能获得一些直觉。

陶哲轩: 是的。不利之处在于,有限化证明要混乱得多。因此,无限的证明通常会先被发现,通常会早几十年,然后人们再将它们有限化。

数学、物理与现实的压缩

莱克斯: 既然我们提到了很多数学和物理,那么作为学科,作为理解世界、看待世界的方式,数学和物理之间有什么区别呢?也许我们可以把工程学也加进去。你提到你的妻子是一名工程师。这为电路提供了新的视角。那么,鉴于你从事过数理物理学,你看待世界的方式就有所不同。你身兼多职。

陶哲轩: 没错。那么,我认为科学总的来说是三者之间的相互作用。一是真实世界,二是我们对真实世界的观察,即我们的观测结果,然后是我们关于世界如何运作的心理模型。因此,我们无法直接接触现实。我们所拥有的只有那些不完整且存在误差的观测结果。并且在许多许多情况下,我们可能想知道,例如,明天的天气如何?而我们尚未获得我们希望预测的观测结果。然后我们有这些简化模型,有时会做出不切实际的假设,你知道,就像球形奶牛之类的东西。那些就是数学模型。

陶哲轩: 数学关注的是模型。科学收集观测结果,并提出可能解释这些观测结果的模型。数学所做的是,我们停留在模型之内,并询问该模型会产生什么结果?模型会针对未来的观测或过去的观测做出什么样的观测结果,什么样的预测?它符合观测数据吗?所以,这确实是一种共生关系。我想数学在其他学科中是独特的,因为我们从假设开始,比如一个模型的公理,然后询问从该模型中能得出什么结论。在几乎所有其他学科中,你都是从结论开始,比如我想做这个,我想建一座桥,我想赚钱,我想做这个,然后你找到实现目标的路径。很少有人会推测“假设我这样做,会发生什么?”规划与建模。也许,科幻小说是另一个特例。但实际上,也就这些了。我们生活中所做的大多数事情都是结果导向的,包括物理学和科学。我的意思是,他们想知道这颗小行星会去哪里?明天的天气会怎样?但数学也有另一个方向,那就是从公理出发。

莱克斯: 你认为,在物理学中,理论与实验之间存在着这种张力。你认为哪种方式更能有效地发现关于现实的真正新颖的想法?

陶哲轩: 嗯,你需要两者兼备,自上而下和自下而上。这实际上是所有这些事物之间的相互作用。因此,随着时间的推移,观测、理论和建模都应该更接近现实。但最初,情况总是如此,它们一开始总是相距甚远,但你需要其中一个来弄清楚如何推动另一个。如果你的模型预测到实验未能发现的异常,这会指示实验人员去哪里寻找更多数据,以完善模型。这是一个反复往复的过程。

陶哲轩: 在数学本身内部,也存在理论和实验的组成部分。只不过,直到最近,理论才几乎完全占据主导地位。99% 的数学是理论数学,而实验数学的数量非常少。人们确实在做。如果他们想研究质数或类似的东西,他们可以生成大量数据集。所以一旦我们有了计算机,我们就开始做了一点。尽管甚至在高斯之前,例如,他猜想了数论中最基本的定理,称为质数定理,该定理预测了从一百万到一万亿有多少个质数。这不是一个显而易见的问题。基本上,他所做的是,主要靠自己计算,但也雇佣了人工计算员——那些以算术计算为专业工作的人——来计算前100,000个质数或类似数字,并制作了表格,做出了预测。那是实验数学的一个早期例子。

陶哲轩: 但直到最近,理论数学一直要成功得多。当然,直到最近,进行复杂的数学计算一直都不可行。即使在今天,尽管我们拥有强大的计算机,也只有部分数学问题能够通过数值方法进行探索。有一种现象叫做组合爆炸。如果你想研究,例如,泽默尔迪定理,你想要研究1到1,000这些数字的所有可能子集。只有1,000个数字。情况能有多糟呢?结果是,1到1,000的不同子集数量是2的1,000次方,这远远大于任何计算机目前能够列举的数量。事实上,任何一台计算机都能进行枚举。有些数学问题很快就变得无法通过直接暴力计算来攻克。国际象棋是另一个著名的例子。国际象棋的局面数量,我们无法让计算机完全探索。

陶哲轩: 但是现在我们有了人工智能。我们有了探索这个空间的工具,并非有百分之百的成功保证,而是通过实验。现在我们可以通过实证方法攻克国际象棋了。例如,我们有非常、非常优秀的人工智能。它们不会探索博弈树中的每一个局面,但已经找到了非常好的近似解。人们正在使用这些国际象棋引擎进行实验性国际象棋。他们正在重新审视旧的国际象棋理论,比如哪种开局、哪种走法好,哪种不好。他们可以使用这些国际象棋引擎来实际完善,甚至在某些情况下推翻关于国际象棋的传统观念。我确实希望未来数学能有更大的实验成分,也许由人工智能驱动。

莱克斯: 路易斯:嗯,当然,谈谈那个。但就国际象棋而言,数学中也有类似的情况,我不认为它提供了一种对不同局面的形式化解释。它只是说明哪个局面更好或不好,而这作为人类你可以凭直觉感知到。然后,从那(些信息)中,我们人类可以构建出关于此事的理论。你提到了柏拉图的洞穴寓言。所以,以防人们不知道,它指的是人们观察到的是现实的影子,而非现实本身。而且他们相信自己所观察到的就是现实。从某种意义上说,这是否就是数学家乃至所有人类正在做的事情,即审视现实的影子?我们有可能真正触及现实吗?

陶哲轩: 嗯,存在这三种本体论上的事物。有实际现实,有观察结果,还有我们的模型。严格来说,它们是不同的,我认为它们将永远是不同的。但它们会随着时间的推移而日益接近。而这种接近的过程往往意味着你必须摒弃你最初的直觉。天文学提供了很好的例子。对世界的最初模型是它是平的,因为它看起来就是平的。而且它很大。宇宙的其他部分,比如太阳,看起来非常小。因此,你从一个实际上与现实相去甚远、但符合你现有观测的模型开始。但随着时间的推移,当你进行越来越多的观测,使其更接近现实时,模型也随之演进。因此,随着时间的推移,我们不得不认识到地球是圆的,它在自转,它绕着太阳系运行,太阳系绕着银河系运行,等等。宇宙正在膨胀。膨胀是自行发生并加速的。事实上,就在最近,大约在这一年左右,甚至宇宙本身的这种体现都证明了它并非恒定不变。

莱克斯: 而其背后的解释是……它正在追赶。它正在追赶。

陶哲轩: 我的意思是,这仍然是关于暗物质、暗能量这类事情。是的。我们有一个模型,它某种程度上能解释并与数据非常吻合。它只是有几个你必须指定的参数。人们说,哦,那是凑数因子。有了足够的凑数因子,你就能解释任何事情。但这个模型的数学要点是,你的模型中的参数数量应少于你的观测数据集中的数据点数量。因此,如果你有一个包含10个参数的模型,它解释了10个观测值。那是一个完全无用的模型。这就是所谓的过拟合。但是,如果你有一个双参数模型,它能解释一万亿个观测结果,这基本上就是……所以,是的,暗物质模型,我认为它大约有14个参数,并解释了天文学家拥有的数拍字节的数据。

陶哲轩: 你可以将一个理论视为(或者说,一种看待物理数学理论的方式是),它是一种对宇宙的压缩,也是一种数据压缩。因此,你拥有这些数拍字节的观测数据,你希望将其压缩成一个可以用五页纸描述并指定一定数量参数的模型。而且,如果它能以合理的精度拟合你几乎所有的观测数据,我的意思是,你进行的压缩越多,你的理论就越好。

莱克斯: 事实上,我们的宇宙及其万物最令人惊讶的发现之一就是它竟然是可压缩的。这就是数学不可思议的有效性。

陶哲轩: 是的,爱因斯坦曾有类似的引述,宇宙最不可理解之处在于它是可理解的。对。而且不仅仅是可理解的,你可以建立一个方程,实际上对此存在某种数学上的可能解释。因此,在数学中存在一种称为普适性的现象。因此,许多宏观尺度上的复杂系统源于微观尺度上大量的微小相互作用。通常,由于常见的复杂性爆炸形式,您会认为宏观方程必定比微观方程复杂无数倍。如果您想完全精确地求解它们,它们确实如此,就像您想模拟一盒空气中的所有原子一样,阿伏伽德罗常数是庞大无比的。粒子数量庞大。如果您真的要追踪每一个粒子,那将是荒谬的。然而,某些定律在宏观尺度上涌现,它们几乎不依赖于微观尺度上发生的事情,或只依赖于极少数参数。因此,如果您想模拟一个箱子中百京个粒子构成的气体,您只需知道它的温度、压强、体积和少数几个参数,比如五六个。它几乎模拟了您需要知道的关于这些10^23个或其他数量粒子的一切。

陶哲轩: 因此,我们在数学上对普适性的理解还远未达到我们希望的程度,但存在一些简单得多的玩具模型,通过它们我们确实对普适性为何发生有了很好的理解。最基本的一个是中心极限定理,它解释了为什么钟形曲线在自然界中随处可见,为什么如此多的事物都遵循所谓的高斯分布。著名的钟形曲线。甚至没有一个模因是关于这种曲线的。而且这个模因甚至广泛适用。这个模因具有普遍性。是的,如果你愿意,你可以称之为“元”。

陶哲轩: 但有许多许多过程。例如,你可以取许多许多独立的随机变量,并以各种方式将它们平均起来。你可以取一个简单的平均值,或者一个更复杂的平均值,并且我们可以在各种情况下证明这些钟形曲线,这些高斯分布,会涌现出来。而且这是一个令人满意的解释。有时它们不会。因此,如果你有许多不同的输入,并且它们都以某种系统性方式相互关联,那么你就会得到一个与钟形曲线相去甚远的结果。当中心极限定理失效时,这一点同样重要。

陶哲轩: 因此,普适性并非百分之百可靠的依据。全球金融危机就是其中一个著名的例子。人们认为抵押贷款违约具有高斯型行为,即如果你调查10万拥有抵押贷款的美国人,就能知道他们中有多少比例的人拖欠抵押贷款。如果一切都是不相关联的,那么就会呈现钟形曲线,你就可以利用期权和衍生品等工具来管理风险。而且这是一个非常优美的理论。但是,如果经济中存在系统性冲击,导致所有人同时违约,那就是非常典型的非高斯行为了。而这一点在2008年并未得到充分考量。现在我认为人们对这种系统性风险实际上是一个更大的问题有了更多的认识。仅仅因为模型看起来很美观、很理想,它可能并不符合现实。

陶哲轩: 因此,弄清楚模型如何运作的数学原理非常重要。但同样重要的是,验证模型何时符合现实、何时不符合的科学。我的意思是,两者都需要。但数学可以提供帮助,因为它可以通过,例如,这些中心极限定理告诉你,如果你有一些特定的公理,比如不相关性,即如果所有输入之间都不相关,那么你就会表现出高斯行为,所以事情就没问题。它告诉你模型的弱点在哪里。

莱克斯: 因此,如果你对中心极限定理有数学上的理解,并且有人提议使用这些高斯联结函数或其他什么来建模违约风险,如果你受过数学训练,你会说:“好的,但是你所有输入之间的系统性相关性是什么?”那么你就可以问经济学家,那会带来多大风险?

陶哲轩: 然后你就可以去寻找答案。所以科学和数学之间总是存在这种协同作用。

狐狸与刺猬:数学研究的两种风格

莱克斯: 关于普适性的话题。您因涉足令人难以置信的数学广度而闻名并备受推崇,这让人想起百年前的希尔伯特。事实上,伟大的菲尔兹奖得主数学家蒂姆·高尔斯曾说,您是我们所能见到的最接近希尔伯特的人。他是您的同事。不过,您以这种在数学领域兼具深度和广度的能力而闻名。所以您是提问的最佳人选,您认为是否存在连接所有不同数学领域的线索?所有的数学是否都存在一种深层的潜在结构?

陶哲轩: 当然有很多连接的线索。许多数学的进步都可以用两个之前没有关联的数学领域发现连接的故事来体现。一个古老的例子是几何学和数论。在古希腊时代,这些被认为是不同的学科。数学家同时研究两者。欧几里得既研究几何学(最为著名),也研究数。但它们并没有真正被认为是相关的。我的意思是,有一点点。你可以说这段长度是那段长度的五倍,因为你可以取这段长度的五份,依此类推。但直到笛卡尔——他真正发展了我们现在所称的解析几何——才能够用两个实数来参数化平面这个几何对象。因此,几何问题可以转化为关于数的问题。而如今,这几乎显得微不足道。这没有任何实质内容。当然,你知道,平面是x和y,因为这就是我们所教的,而且它已被内化。但这两大领域的统一是一个重要的发展。

陶哲轩: 这种过程在整个数学领域中反复上演。代数和几何曾是分离的,而现在我们有了代数几何,它将它们一次又一次地连接起来。这无疑是我最喜欢的数学类型。所以我想成为“狐狸”有不同的风格。狐狸略知多事,而刺猬则精通一事。而在数学领域,刺猬型和狐狸型的人都确实存在。还有一些人可以兼顾这两种角色。我认为数学家之间理想的合作需要一些多样性。一只狐狸与许多刺猬协作,或反之亦然。所以,是的,但我主要认为自己是一只狐狸,毋庸置疑。我某种程度上喜欢套利,比如学习一个领域如何运作,学习那个领域的诀窍,然后进入另一个人们认为不相关的领域,但我可以运用这些诀窍。从而看到这些领域之间的联系。

陶哲轩: 是的。所以还有其他数学家比我深入得多。他们真的是刺猬。他们了解一个领域的一切,并且在那个领域中快得多,也有效得多,但我可以给他们这些额外的工具。

莱克斯: 我的意思是,你曾说过,根据语境和合作方式的不同,你既可以是刺猬,也可以是狐狸。那么,如果可能的话,你能否谈谈这两种思考问题方式之间的区别?比如说你遇到了一个新问题,你知道,是寻找联系还是非常单一的关注点。

陶哲轩: 我更喜欢“狐狸范式”。是的。所以是的,我喜欢寻找类比、叙事。我花了很多时间,如果有一个结果,我在一个领域看到了它,并且我喜欢这个结果。这是一个很棒的结果,但我不喜欢它的证明。比如它使用了我不太熟悉的数学类型。我经常尝试使用iFavor自己重新证明它。通常我的证明更差,但通过这样的练习,我可以说,哦,现在我能明白其他证明想做什么了。从中我可以对该领域所使用的工具有所了解。所以它极具探索性,在各种古怪的领域中进行各种疯狂的尝试,并且大量地重复造轮子。

陶哲-轩: 而我认为,刺猬型风格则更具学术性。你非常注重知识。你及时了解该领域的所有进展。你了解所有历史。你对每种特定技术的优缺点都有非常透彻的理解。我认为你会更依赖计算,而不是试图寻找叙事。嗯,所以说,我虽然也能做到,但有其他人在那方面极其出色。

证明之美与欧拉恒等式

莱克斯: 让我们退一步,也许来看看一个有点浪漫化的数学版本。所以我想你曾说过,在你年轻的时候,数学在你生命早期更像是一种解谜活动。你是何时第一次遇到一个问题或证明,让你意识到数学可以具有一种优雅和美感?

陶哲轩: 这是一个很好的问题。当我来到普林斯顿读研究生时,约翰·康威当时就在那里。他几年前去世了。但我记得我听的非常早期的研究讲座之一,就是康威关于他所谓的“极端证明”的讲座。所以康威就是有这种惊人的方式,以你通常不会想到的方式去思考各种事物。所以他认为证明本身占据着某种空间。所以如果你想证明某事,比如说存在无限多的素数,你会有所有这些不同的证明,但你可以在不同的轴向上对它们进行排序。比如有些证明是优雅的,有些证明是冗长的,有些证明是初等的,等等。因此,就有了这样一个概念空间。因此,所有证明的空间本身具有某种形状。

陶哲轩: 因此,他对这种形状的极点很感兴趣。比如在所有这些证明中,最短的证明最接近其他所有证明,或者是最初等的,或者诸如此类。因此,他举了一些著名定理的例子,然后给出他认为在这些不同方面上的极致证明。我发现那真是令人大开眼界。这不仅仅是为一个有趣的结果找到一个证明,而是在有了那个证明之后,尝试以各种方式对其进行优化。证明工作本身就蕴含着某种匠心。

陶哲轩: 这对我的写作风格有所启发。就像你作为一名本科生做数学作业、家庭作业等等时,你某种程度上被鼓励只写下任何可行的证明。只要它得到一个勾号,你就继续前进。但如果你想让你的成果真正具有影响力并被人们阅读,它就不能仅仅是正确的。它还应该读起来令人愉悦,具有启发性,并能适应推广到其他事物。

陶哲轩: 这在许多其他学科中也是如此,比如编程。数学和编程之间有很多类比。我喜欢类比,如果你还没注意到的话。你可以编写出意大利面条式的代码,它能完成特定任务,虽然快速而粗糙,但它确实有效。但有许多编写高质量代码的良好原则,这样其他人就可以使用它,在其基础上进行开发等等,并且错误更少,诸如此类。数学也有类似的情况。

莱克斯: 是的,首先,那里有许多美妙之处。卡迈勒是史上最杰出的数学家和计算机科学家之一。仅仅是考虑证明空间,并思考:这个空间是什么样的?它的极端情况又是什么?就像你提到的,编程是一个类比。这很有趣,因为还有一项活动叫做“代码高尔夫”,我也觉得它既精妙又有趣,人们会使用不同的编程语言来尝试编写完成特定任务的最短程序。我相信甚至还有这方面的比赛。这也是一种很好的压力测试方式,不仅能测试程序,或者在本例中是证明,还能测试不同的语言。也许那是一种不同的符号系统,或其他什么,可以用来完成不同的任务。

陶哲轩: 是的,你会学到很多。我的意思是,这可能看起来像一项无关紧要的练习,但它能产生所有这些深刻的见解,如果你没有追逐这个人为设定的目标,你可能就无法发现。

莱克斯: 你认为数学中最美或最优雅的方程是什么?我是说,人们在美中常常寻求的特质之一就是简洁性。所以,如果你看E等于MC平方。所以,当少数几个概念汇聚在一起时,这就是为什么欧拉恒等式常被认为是数学中最美的方程。你觉得欧拉恒等式美吗?

陶哲轩: 是的。嗯,正如我所说,我发现最吸引人的就是不同事物之间的联系。所以,E的πi次方等于负一。是的,人们使用了所有的基本常数。好的,我是说,那很巧妙。但对我来说,欧拉研究指数函数是为了衡量指数增长。所以,我认为复利或衰减,任何持续增长、持续衰减的事物,无论是增长与衰减,还是膨胀与收缩,都可以由指数函数来建模。

陶哲轩: 而圆周率则源于圆和旋转。例如,如果你想将一根针旋转180度,你需要旋转π弧度。而i,即复数,代表了90度旋转时所设想的坐标轴互换。因此,它是方向上的改变。所以,指数函数代表着在你现有方向上的增长和衰减。当你将i(虚数单位)加入指数函数中时,它就不再是与你当前位置相同方向上的运动,而是与你当前位置成直角的运动。即旋转。所以,e的iπ次方等于负1告诉你,如果你旋转π弧度,你最终会指向相反方向。因此,它通过膨胀统一了几何学,并通过这种复数化(即通过i进行旋转)的行为统一了指数增长动力学。

莱克斯: 所以,它将所有这些数学领域——你知道,是的,动力学、几何学和复数——都连接在了一起。

陶哲轩: 因为这个恒等式,它们在数学中几乎都被认为是紧密的近邻。

莱克斯: 你认为你提到的那个有趣之处——这些迥异领域中交汇的记法——仅仅是一个无关紧要的副作用吗?或者你认为当这些记法——我们所有的老朋友们——汇聚并统一起来时,其中存在真正的价值吗?

陶哲轩: 嗯,这证实了你拥有正确的概念。所以,当你初次研究任何事物时,你必须衡量事物并给它们命名。而起初,有时因为你的模型再次偏离现实太远,你会将最好的名称冠予了不正确的事物。而你只有到后来才会发现真正重要的是什么。

统一之路:从哈密顿量到万有理论

陶哲轩: 物理学家有时会这样做。我的意思是,但结果证明,没问题。实际上,在物理学中,E等于mc平方。那么,其中一个重要的发现就是E,对吗?那么,当亚里士多德首次提出他的运动定律,以及后来的伽利略、牛顿等等,他们看到了可以测量的事物。他们可以测量质量、加速度、力等等。因此,在牛顿力学中,例如,我认为MA就是著名的牛顿第二运动定律。那么,这些就是主要对象。于是,他们便将它们视为理论的核心构建。

陶哲轩: 直到后来,在人们开始分析这些方程之后,才发现似乎总存在一些守恒量。具体来说,就是动量和能量。而且能量的变化并非显而易见。它不像质量、速度等等你可以直接测量的东西。但随着时间的推移,人们意识到这实际上是一个非常基本的概念。最终,在19世纪,哈密顿将牛顿的物理定律重新表述为所谓的哈密顿力学,其中能量(现在称为哈密顿量)是主导对象。一旦你知道如何测量任何系统的哈密顿量,你就能完整地描述其动力学,例如所有状态的演变。它确实是一个核心要素,这在最初并不明显。

陶哲轩: 这种视角的转变在量子力学出现时确实很有帮助。

莱克斯: 因为早期研究量子力学的物理学家们在尝试将他们牛顿式的思维(因为一切皆为粒子等等)适应量子力学时遇到了很多困难。

陶哲轩: 我认为那是因为存在一种方法,但它看起来真的非常、非常怪异。例如你会问,F=ma的量子对应是什么?而要给出答案,确实非常、非常困难。然而,事实证明,在经典力学中如此隐秘地居于幕后的哈密顿量,在量子力学中也是关键对象。量子力学中同样有一个被称为哈密顿量的对象。它是一种不同类型的对象。它是一种被称为算符的东西,而不是函数。但同样地,一旦你确定了它,你就确定了全部动力学。有一个被称为薛定谔方程的东西,它精确地告诉你一旦有了哈密顿量,量子系统将如何演化。

陶哲轩: 它们并置时,看起来是完全不同的对象。一个涉及粒子,一个涉及波,等等。但凭借这种核心地位,你可以开始将许多直觉和事实从经典力学实际迁移到量子力学。例如,在经典力学中,有一个叫做诺特定理的东西。物理系统中每存在一种对称性,就对应着一条守恒定律。物理定律具有平移不变性。如果我向左移动10步,我所经历的物理定律与我在这里时是相同的,这对应于动量守恒。如果我旋转某个角度,我所经历的物理定律依然是相同的。这对应于角动量守恒。如果我等待10分钟,物理定律仍然是相同的。所以存在时间平移不变性。这对应于能量守恒定律。因此,对称性和守恒之间存在着这种基本联系。

陶哲轩: 即使方程完全不同,这在量子力学中也同样适用。但因为它们都源自哈密顿量,哈密顿量控制着一切。每当哈密顿量具有对称性时,方程就会拥有一个守恒定律。一旦你有了正确的语言,它实际上会使事情变得清晰得多。

陶哲轩: 其中一个问题是我们为何尚未能统一量子力学和广义相对论。我们还没有弄清楚基本客体是什么。例如,我们必须放弃空间和时间是这些近似欧几里得型空间的观念。我们知道在极小尺度上,会有量子涨落,存在时空泡沫。而尝试使用笛卡尔坐标x、y、z是根本行不通的。但我们不知道用什么来取代它。我们实际上还没有那些能够组织一切的数学概念,即哈密顿量的类比。

莱克斯: 你的直觉是否认为存在一个万有理论,因此有可能将其统一,找到一种能统一广义相对论和量子力学的语言?我相信是这样。我的意思是,物理学的历史一直就是统一的历史,就像多年来的数学一样。

陶哲轩: 电和磁曾是独立的理论,后来麦克斯韦将它们统一了。牛顿统一了天体的运动和地球上物体的运动,等等。所以这应该会发生。只是,再次回到观测和理论的这个模型,我们部分的问题在于物理学是自身成功的受害者。物理学的两大理论——广义相对论和量子力学——现在如此出色,以至于它们加在一起涵盖了我们能够进行的所有观测的99.9%。你必须去研究极其极端的粒子加速现象、早期宇宙,或是那些真正难以测量的事物,才能从这两个理论中的任何一个获得任何偏离,以至于你能够真正弄明白如何将它们结合起来。但我坚信,我们几个世纪以来一直在做这件事。我们以前取得过进展,没有理由停止。

莱克斯: 你认为你会成为一个发展万物理论的数学家吗?

陶哲轩: 经常发生的情况是,当物理学家需要某种数学理论时,通常都会有数学家早些时候研究出的某种前身理论。所以当爱因斯坦开始意识到空间是弯曲的时候,他去找了一位数学家,问他,你知道吗,数学家是否已经提出了一些可能有用的弯曲空间理论?然后他说,哦,是的,我想黎曼提出了一些东西。是的,黎曼确实发展了黎曼几何,这正是关于以各种普遍方式弯曲的空间的理论,结果这几乎与爱因斯坦理论所需的一模一样。这可以追溯到维特根斯坦所说的数学的不可思议的有效性。我认为那些能很好地解释宇宙的理论,往往也涉及到那些能很好地解决数学问题的相同数学对象。归根结底,它们都只是以有用的方式组织数据的方法。

莱克斯: 这感觉就像你可能需要去一个非常难以凭直觉理解的奇特领域。你有比如弦理论。

陶哲轩: 是的,那曾是数十年来的主要候选理论。我认为它正逐渐失宠,因为它与实验不符。

莱克斯: 因此,当然,正如你所言,其中一个重大挑战就是实验难度很大。是的。因为这两种理论都非常有效。但另一方面是,你所谈论的,你不仅是脱离了时空。你正在进入到维度数量多得惊人的领域。你正在做各种怪异的假设,对我们来说,我们已经远远偏离了你提到的我们最初的扁平地球概念。

陶哲轩: 是的,是的,是的。这确实非常令人钦佩,你愿意投身竞争,在某种程度上成为一名初学者,对吗?或者面临初学者会遇到的那种挑战,对吗?新概念,新思维方式。还有,你懂的,不擅长别人...我想在那次谈话中,你可能是一位菲尔兹奖得主数学家,而一个本科生却知道得更好。

莱克斯: 现在,我们很难用我们有限的认知能力来直观地理解那种现实究竟是怎样的。

陶哲轩: 这就是为什么类比如此重要。我的意思是,是的,地球是圆的并不直观,因为我们身处其中。但是,你知道,对于一般的圆形物体,我们有相当好的直觉。我们一直在谈论光的运作机制等等。实际上,这是一个很好的练习,可以弄明白日食、月食以及太阳和月亮的盈亏等现象,如何能通过球形地球模型和球形月球模型轻易地解释。你可以拿一个篮球、一个高尔夫球和一个光源,然后亲自做这些事情。所以直觉是存在的,但你必须将其迁移。

莱克斯: 对我们来说,从平面地球到球形地球在智力上是一个巨大的飞跃,因为,你知道,我们的生活主要是在平面世界中度过的。是的。加载那些信息,而我们都觉得理所当然。我们把很多事情都视为理所当然,因为科学已经为此类事物建立了大量证据。但是,你知道,我们身处一个圆形的星球上。是的。在太空中穿行。是的。那是一个巨大的跨越。而且你必须进行一系列这样的跨越。我们进步得越多。没错。是的。

陶哲轩: 所以现代科学也许,再次地,是其自身成功的某种牺牲品,那就是,为了更准确,它必须越来越远离你的最初直觉。因此对于没有经历过完整科学教育过程的人来说,它也因此显得越来越可疑。所以,你知道,我们需要更多地打下基础。我的意思是,确实有科学家在做非常出色的科普工作,但也有很多科学活动你可以在家里进行。有很多YouTube视频。我最近和格兰特·桑德森一起制作了一个YouTube视频。我们之前谈论过这个,就是古希腊人如何能够测量诸如月球和地球的距离。而且,你知道,他们使用的技术你也可以自己复现。并非所有事情都必须是像高端太空望远镜和非常令人望而生畏的数学那样。

莱克斯: 是的。我强烈推荐。我相信你做了一场讲座,并且还与格兰特合作制作了一个精彩的视频。设想自己身处那个被神秘笼罩的时代的人的思维,这是一种美好的体验。你知道,你就像在这个星球上,你不知道它的形状,也不知道它的大小。你看到一些星星,看到一些事物,然后你试图在这个世界上定位自己,并试图对各地点距离做出一些概括性的判断。

陶哲轩: 视角的转变真的非常重要。你说旅行开阔视野。这是一种思想旅行。你知道,设想自己身处古希腊人或任何其他时代的人的思维,提出假设,球形奶牛,等等,进行推测。实际上,这就是数学家和一些艺术家所做的事情。

莱克斯: 令人难以置信的是,在极端约束下,你仍然可以表达出非常有力的观点。这就是它鼓舞人心的原因。回顾历史,当没有太多可供推断的材料时,能弄明白多少东西。

陶哲轩: 如果你提出公理,那么数学会允许你沿着这些公理推导出结论。而且有时,你可以从最初的假设中推导出很多东西,走得很远。

莱克斯: 如果我们继续探讨奇特的领域,你提到了广义相对论。你为爱因斯坦场方程的数学理解做出了贡献。你能解释一下这项工作吗?从某种数学角度来看,广义相对论的哪些方面吸引你,哪些方面对你而言具有挑战性?

陶哲轩: 我研究过一些方程。有波映射方程,或西格玛场模型,它并非时空引力本身的方程,而是可能存在于时空之上的某些场的方程。因此,爱因斯坦的相对论方程仅描述时空本身。但在那之上,还存在其他场。有电磁场,有杨-米尔斯场,还有整个不同方程的层级结构,其中爱因斯坦方程被认为是最非线性且最困难的,但在这个层级中相对较低的,就是这种被称为波映射方程的东西。所以它是一种波,在任何给定点上,它都像固定在球面上一样。我可以想象空间和时间中有一束箭矢,是的,它们指向不同的方向。但它们像波一样传播。如果你摆动一支箭矢,它就会传播并使所有箭矢像麦田里的麦捆一样移动。

陶哲轩: 我对这个问题再次感兴趣的是全局正则性问题。这里的全部能量有可能汇聚于一点吗?我所考虑的方程实际上被称为临界方程,在该方程中,所有尺度上的行为大致相同。我勉强证明了,你实际上无法强迫所有能量集中于一点的情况发生,能量必须稍微分散一点,一旦它稍微分散,就会保持正则。是的,这要追溯到2000年。事实上,那也是我之后对气溶胶产生兴趣的部分原因。因此,我开发了一些技术来解决那个问题。

陶哲轩: 所以部分原因是,由于球体的曲率,这个问题确实是非线性的。存在某种非线性效应,它是一种非微扰效应。当你正常观察时,它看起来比波动方程的线性效应要大。因此,即使能量很小,也很难将其控制住。但我开发了一种被称为规范变换的方法。所以这个方程有点像麦堆的演变,它们都在来回弯曲。因此,存在大量的运动。但如果你想象通过在空间的不同点安装小型摄像机来稳定流体,这些摄像机试图以捕捉大部分运动的方式移动,在这种稳定化后的流体下,流体变得更加线性。我发现了一种变换方程的方法,以减少非线性效应。然后我就能求解这个方程了。

陶哲轩: 我在澳大利亚探望姑姑时发现了这种变换。我当时正试图理解所有这些场的动力学,但我无法用纸笔完成。我也没有足够算力的计算机来进行任何计算机模拟。于是我闭上眼睛,躺在地板上,想象自己就是这个矢量场,在其中摸索着看如何改变坐标,使得在所有方向上,事物都能以合理的线性方式表现。而且,是的,我姑姑在我做那件事的时候撞见了。她当时问我,我到底在做什么?

莱克斯: 这很复杂。

陶哲-轩: 是的,是的。嗯,好吧。你知道,你是个年轻人。我不多问了。

人工智能与数学的未来 解题策略与工具

莱克斯: 我必须问一下,你知道,你如何着手解决难题?如果可能的话,当你思考时,你会在脑海中将数学对象、符号可视化吗?当你思考时,你的脑海中通常会可视化什么?

陶哲轩: 大量的笔和纸。作为数学家,你会学到一种,我称之为策略性“作弊”的技巧。所以数学的魅力在于,你可以随心所欲地改变问题和规则。在任何其他领域,你都无法做到这一点。比如,如果你是一名工程师,有人让你在这条河上建一座桥,你不能说:“我想把这座桥建到别处”,或者“我想用纸而不是钢来建造它”。但作为一名数学家,你可以随心所欲。这就像玩一个电脑游戏,里面有无限的作弊码可用。

陶哲轩: 所以,你知道,如果有一个维度太大。我会把它设为一。我会先解决一维问题。于是有一个主项和一个误差项。我将做球形汽车的假设。我将假设误差项为零。因此,解决这些问题的方式,不应采用这种将事物最大程度复杂化的“钢铁侠模式”。但实际上,处理任何合理的数学问题时,如果存在10个让你感到困难的因素,你应该找到一个问题的版本,它关闭了九个难点,只保留其中一个,然后解决它。于是你安装了九个作弊码。好,如果你安装了十个作弊码,那么游戏就变得微不足道了。但如果你安装了九个作弊码,你解决了一个问题,这会教你如何处理那个特定的难点。然后你关掉那个,再打开另一个,接着解决那个问题。在你学会如何分别解决这十个问题,十个难点之后,你必须开始一次合并几个来处理。

陶哲轩: 小时候,我看了很多香港动作片。这来源于一种文化。有一件事就是,每次打斗场景,也许英雄会被上百个坏蛋打手之类的围攻。但它总是被精心编排,所以你每次都只与一个人搏斗。然后他就会击败那个人,接着对付下一个。正因为如此,他才能击败所有人。但如果他们打得更聪明一点,一拥而上围攻那个人,那会让电影变得糟糕得多。但他们会赢。

莱克斯: 你通常是使用纸笔吗?你是使用电脑和LaTeX吗?

陶哲轩: 实际上,我主要还是用纸笔。所以在我的办公室里,我有四块巨大的黑板。有时我不得不把我所知道的关于这个问题的一切都写在那四块黑板上,然后坐在沙发上,总览全局。

莱克斯: 都是符号,比如标记,还是有一些图画?

陶哲轩: 有很多图画,还有很多只对我自己有意义的定制涂鸦。这就是黑板的妙处,你可以擦掉,它是一个非常有机的东西。我开始越来越多地使用电脑,部分原因是因为人工智能让做简单的编码工作变得容易得多。如果我以前想绘制一个函数,这有点复杂,例如作为一个迭代或其他,我必须记住如何设置一个Python程序,以及for循环是如何工作的并进行调试,这会花费两个小时等等。而现在我可以在10-15分钟内完成。我正在越来越多地使用电脑进行简单的探索。

证明助手Lean与协作新范式

莱克斯: 如果可以的话,我们来谈谈人工智能。也许一个好的切入点就是泛泛地谈谈计算机辅助证明。您能描述一下Lean形式化证明编程语言,以及它如何作为证明助手提供帮助,也许还有您是如何开始使用它以及它如何帮助了您?

陶哲轩: Lean是一种计算机语言,很像Python和C等标准语言。除了在大多数语言中,重点在于使用可执行代码。代码行会执行操作。它们翻转比特,或者让机器人移动,或者在互联网上向您发送文本等等。Lean是一种也能做到这一点的语言。它也可以作为一种标准的传统语言运行,但它也可以生成证书。像Python这样的软件可能会进行计算并给出答案为7。它算出3加4等于7。但Lean不仅能得出答案,还能提供它是如何得出7这个答案的证明,包括数字3以及所有涉及的步骤。它创建这些更复杂的对象,不仅仅是陈述,而是附带证明的陈述。每一行代码都是一种将先前的陈述拼接起来以创建新陈述的方式。

陶哲轩: 这个想法并不新颖。这些被称为证明助手。它们提供了语言,您可以用这些语言创建相当复杂、精妙的数学证明。它们会生成这些证书,如果您信任Lean的编译器,这些证书能百分之百保证您的论证是正确的。但他们把编译器做得非常小,并且有几种不同的编译器可用于同一个……

莱克斯: 您能让人们直观地理解用笔和纸书写与使用Lean编程语言之间的区别吗?形式化一个陈述有多难?

陶哲轩: 很多数学家参与了Lean的设计。它的设计宗旨是让每一行代码都类似于数学论证中的每一行。你可能想引入一个变量,你可能想证明一个矛盾。有各种你可以做的标准操作,而且它的编写方式是理想情况下应该像一一对应。实践中并非如此,因为Lean就像是给一个极其吹毛求疵的同事解释一个证明,他会指出,好吧,你真的是这个意思吗?如果这是零怎么办?你如何证明这一点?

陶哲轩: 所以Lean内置了大量的自动化功能,以尽量减少麻烦。例如,每个数学对象都必须带有一个类型。如果我谈论x,x是一个实数、自然数、函数还是别的什么?如果你非正式地书写,它通常处于特定语境中。你会说,显然,设x为y和z的和,而y和z已经是实数,那么x也应该是一个实数。Lean可以做很多这样的...

本文转载自互联网,如有侵权,联系删除。

相关文章