陶哲轩：AI让数学进入「工业化」时代，数学家也可以是「包工头」

news2026/3/31 3:48:47

来源机器之心编辑张倩、陈陈很多人提到数学研究脑子里浮现的还是那个画面一个人一块白板来回踱步等灵感突然降临。但当今世界最伟大的数学家之一、菲尔兹奖得主陶哲轩却告诉我们这种「手工业时代」的数学研究模式正处于崩溃边缘一场由 AI 和形式化证明语言如 Lean引领的「工业革命」已经悄然开启。这一洞察来自陶哲轩最近的一次访谈▲视频标题Terry Tao on the future of mathematics视频链接https://www.youtube.com/watch?v4ykbHwZQ8iU在访谈中陶哲轩指出数学研究中存在大量的重复性劳动如查阅文献、调整他人论文中的参数以及繁琐的计算。通过 LLM 辅助的自动形式化Auto-formalization这些琐碎的工作正逐渐变得轻松。与此同时Lean 等形式化证明语言与 AI 的深度融合正在改变数学协作的本质。形式化并不只是「把证明写得更严格」而是把数学拆成了可以独立验证的原子步骤。这种原子化让分布式科研第一次变得可行。陶哲轩预见到数学界将出现类似软件工程的分工模式。未来的数学家可能扮演「架构师」或项目经理的角色领导大型协作项目。这种模块化的研究方式可能允许「公民数学家」非专业领域专家但具备某些技能的人参与到前沿研究中降低进入门槛。如此一来数学研究的进展或显著加速。参与访谈的另外两位数学家分别是前 OpenAI 研究科学家、Morph Labs 创始人 Jesse Han以及斯坦福大学助理教授 Jared Duker Lichtman。以下是机器之心整理的访谈记录。从几十年到 18 个月数学研究正被加速陶哲轩说实话在我整个学术生涯中我一直觉得我们做数学的方式少了点什么。我们在研究一个数学问题时总想找到那个能打开问题大门的精妙想法。但在那之前有大量枯燥的苦力活。比如文献综述比如你在别人论文里看到一个技巧想用到自己的问题上但所有的输入条件都有点不一样你就得手动调整所有的论证。还有那些计算 —— 它们确实有用能帮你建立直觉但很多时候就是硬磨不停地算啊算。我以前也试过写一些小程序来加速某些计算但那时候技术还不成熟。大概两年前就在 IPAM纯粹与应用数学研究所这里我们办了一个机器辅助证明的会议我是组织者之一。在那次会议上我们接触到了各种各样的尝试 ——SAT 求解器、计算机辅助软件包、大语言模型。ChatGPT 刚问世还有 Lean。那是一个令人兴奋的世界你突然发现很多事情变得可能了而且正在发生。比如 Peter Scholze 刚完成了一个长达 18 个月的项目把他的一个重要定理形式化了 ——Jared Duker Lichtman液态张量实验。陶哲轩对液态张量实验。这是个大工程一个定理花了 18 个月。但这已经被认为是巨大的突破了因为 20 世纪的那些形式化项目动辄要花几十年才能完成。所以这本身就是一个巨大的提速部分原因是我们已经学会了如何使用软件工程的那些工具比如 GitHub以及更智能地组织这些项目。从那以后我对 AI 和形式化都产生了浓厚的兴趣 ——Jared Duker Lichtman 就是因为那次会议。陶哲轩对没错。我开始相信这就是数学的未来也开始接受一些采访谈这个话题。但到了某个时候你不能光说不练得真正动手。所以我就去学了 Lean花了大概一个月但其实挺好玩的。这让我想起了写本科分析教材的经历 —— 真的是从基础开始把每一步都做到完全严格。感觉就像在玩电子游戏。我记得 Kevin Buzzard 说过Lean 是世界上最好玩的电子游戏大概是这个意思。Jared Duker Lichtman 让人完全上瘾。陶哲轩对某类人来说确实非常上瘾。而在过去一年里大语言模型追上来了它们现在可以自动形式化单个证明步骤真正开始减轻形式化过程中的苦力活甚至到了可以实时完成的程度。这打开了无数的可能性。形式化正在改变数学思维把含混经验转化为可检验的结构Jesse Han 我第一次接触 Kevin Buzzard是 2017 年他在 MSRI美国数学科学研究所教自守形式那门课的时候。几年后我跟他聊天他说他当时根本没在关注那门课的内容因为那个夏天他正在自学 Lean—— 在 Tom Hales 在第一届大型证明会议上告诉大家 Lean 将是未来之后。我自己在第一次学习形式化证明的时候有一个体会是我慢慢意识到其实我从来没有真正学会清晰地思考数学论证。高等数学的证明里有一种普遍的或者说文化性的混乱感。我很好奇当你越来越深入地去预判如何形式化证明时你对自己数学思维的认知有什么变化陶哲轩确实有一些变化改变了我写论文的方式。我现在能看到那些「隐形假设」—— 那些我们习惯性地默认成立的东西。你会更认真地思考怎样才是最干净的定义方式因为在 Lean 里当你定义一个概念并想使用它时你必须先建立一堆琐碎的引理就是所谓的 API围绕着每个概念。这些东西在论文里往往是「显然这个概念是单调的」「显然它在某种运算下封闭」但你其实应该证明它们。而且你会发现如果定义得不够好形式化这些「琐碎」命题要花两倍甚至五倍的时间。所以这让我学会了如何精简自己的写作。有时候我会对合作者有点不耐烦因为有些人没有这个视角还在用老式的非形式化风格写东西。Heather Macbeth 写过一篇文章讲形式化和自动化如何催生了一种新的证明写作风格。传统的证明通常是线性的从 A 到 B一步一步推比如一串等式。但有了自动化工具你可以说这里有 10 个相关的事实用一个标准工具来找出这 10 个事实的正确组合就能完成证明。而这个组合往往很无聊没什么意思 —— 你知道某种线性代数之类的东西能从这些事实得出结论。这是一种不同的证明写作风格某种意义上反而更容易读懂。对人类来说更难验证但你能更清楚地看到一个证明的输入和输出而传统写法往往把这些藏起来了。Jared Duker LichtmanPeter Scholze 的情况也是这样他说过在形式化过程中获得反馈实际上让他对某个关键引理的细节思考得更清楚了他觉得这是一个非常有价值的过程。你有一个很棒的框架 —— 前严谨阶段、严谨阶段、后严谨阶段。这个框架怎么融入我们现在讨论的话题陶哲轩对我写过一篇传播很广的文章讲学习数学的三个阶段。第一个是前严谨阶段你并不真正知道什么是证明但对什么行得通、什么行不通有一些模糊的直觉。这通常是小学阶段对数学的理解方式。有时候你的直觉是对的有时候是错的但你没有办法分辨哪个是哪个。然后是严谨阶段你被迫完全按照规矩来每一步都要做得准确无误。但在这个阶段你往往会失去直觉因为你全部的注意力都在确保每一步都正确。不过这有助于清除你所有错误的直觉因为你能看到精确的反例知道论证在哪里失败了。而所有好的直觉 —— 那些与严谨推理一致的 —— 都会保留下来。然后是后严谨阶段你可以在两种模式之间自由切换。你可以非形式化地论证但现在是安全的因为你已经清除了所有错误的直觉。你知道如果需要的话可以把它转换回严谨的形式。反过来你也可以读一个严谨的论证然后把它转换成直觉性的语言。Lean 确实帮我清理了一些思维中低效或错误的习惯。一个很常见的低效问题是当你在教科书里陈述一个定理时往往会加入太多假设。你有点过于保守想确保证明是对的就加了一堆额外条件 —— 这个非空、那个连续、这个为正之类的。Jared Duker Lichtman你会想去对这些假设进行压力测试。陶哲轩对。但其实还有自动化的 linter 工具当你在 Lean 里形式化某个东西证明结束后它会说「顺便提一下你从来没用过这个假设。」然后你就会想「哦确实我其实根本不需要正性条件。」文献里确实有过这样的真正突破人们心里有个思维定式觉得某个工具只能用在比如正数的情况下但其实证明在没有正性条件的情况下照样成立只是没人注意到。形式化能让你自动发现每个工具的自然适用范围。这已经非常有用了。Jesse Han这个说法很精辟。我们花了很多时间思考一个问题来自软件工程和计算机科学的深度洞见如何影响人们对数学认知和数学研究的思考方式。你刚才说的形式化如何让我们更清楚地理解每个定理的假设和输出这其实就是良好的软件工程实践。Dijkstra 就专门讲过人们应该更多地去推理前置条件和后置条件。同样的道理数学家习惯在定理里堆一堆可能用不上的假设这在软件工程里是典型的反模式 —— 一种公认的坏习惯。两个顿悟时刻形式化正在改变数学领域协作方式Jesse Han我特别想问你的是你在形式化过程中的「顿悟时刻」是什么显然一开始有很高的启动门槛你得学习所有这些关于这门小众学术编程语言的晦涩知识。但是在哪个时刻你意识到把数学变成软件这个过程不仅仅是翻译还能加速你的理解加速数学发现的过程对我来说是在形式化连续统假设的独立性时。有一个时刻我完全迷失了所有的参考资料都是错的但我发现可以打开或关闭某些关键假设然后很快就获得了比任何教科书都深得多的理解。我很好奇你有没有类似的经历。陶哲轩有我有两个印象特别深刻的时刻。第一个是我在形式化一个和合作者一起证明的定理叫 PFR 猜想 —— 多项式 Freiman-Ruzsa 猜想。结论里有一个指数常数我们当时证明的是存在一个常数使得某个性质成立而这个常数最后算出来是 12。原因并不神秘只是把证明中所有零零碎碎的小常数一路累积下来最后自然就变成了 12。我们花了大概三周时间把这个「C 等于 12」的结论完整形式化成 Lean 代码。那是一个完全没有 AI 的年代整整 20 个人全靠手工是一次非常浩大的工程。后来有人往 arXiv 上放了一个很短的预印本说如果你回到原始论文只要做五个小改动就可以把这个 12 降到 11。于是大家就开始讨论那我们要不要把 C 等于 11 也形式化一遍问题在于C 等于 12 已经花了我们三周时间那再来一遍岂不是又是三周实际情况并不完全是这样但直觉上你几乎只是把最终定理里的 12 改成 11。然后你会发现大概有五行代码变红了也就是证明不再成立了。但你去看那篇新的预印本就会发现哦这五行我知道该怎么改。结果一改这五行是好了又有另外十行变红了。于是你再回去改那十行。就这样来回几次我们在一天之内就把整个证明更新成了 C 等于 11。所以形式化确实很繁琐尤其是第一次把一个结果完整写出来的时候。但一旦你想修改一个已有的证明它就比传统数学方式好得多。这是我第一个非常深刻的体会。第二个经历来自一个名为 Equation of Theories 的项目然后对一项研究进行形式化时有一次很深的体会。当时有人在把另一位作者写的证明形式化结果卡在了某一步。我当时也并不了解整个证明的全貌甚至可以说完全不理解整体结构但我盯着那一行代码看了一会儿发现我其实能理解这一行在做什么。我能够理解足够多的上下文从而指出你这里其实只需要复制并稍微修改这一行让它在类型上匹配这样就能调用这个工具了。也就是说我只通过检查一千多行代码中的三行就给出了一个非常原子级atomic的诊断精确地指出了这个证明该如何修复。我认为这正是 Lean乃至形式化验证软件的一大特点它具有一种高度模块化的结构这是很多其他软件甚至传统数学中并不具备的。你可以围绕某一行、某一个非常具体的局部问题展开极其精细的讨论而完全不需要理解系统的其余部分。而在传统数学中只有在与你长期合作、彼此已经在思维方式上高度对齐的情况下才能做到这一点。那种状态下你们几乎可以在极其细微的层面上互相理解甚至补全对方的句子。通常情况下当你和一个尚未在思维方式上充分同步的人讨论数学问题时是很难进行这种粒度如此之细的交流的。所以你确实可以进入那种高度专注、默契协作的状态那种感觉非常好。但现实是能让我进入这种状态的合作者其实只有少数。更多时候合作中充满了翻译成本你需要反复澄清定义、解释背景也不可避免地会出现各种误解。而在 Lean 中这些问题在很大程度上都会消失。因为你面对的是一个对问题和修复方式都有着精确定义的类型描述。问题是什么、哪里不匹配、该如何修复都被明确地写进了系统里。Lean 以一种此前从未有过的方式把数学原子化了 —— 这是其他做数学的方法所不具备的。数学进入「工业化」时代数学家也可以是架构师Jared Duker Lichtman顺着这个话题再往前想其实也很有意思我们正在用一种全新的方式来使用数学。你经历过互联网的兴起也算是较早参与并推动了类似 Polymath 博学者项目这种协作式研究项目的人之一。也许你可以谈谈你对协作的直觉是如何形成的在过去大约二十年的时间里这种协作方式是如何演化的以及展望未来在一种高度模块化的交互模式下有时甚至是匿名的协作中数学研究可能会呈现出怎样的新形态Jesse Han我想再补充一点。你在几年前发表于《Notices of the American Mathematical Society》的一篇文章里提到过一个非常有意思的观点你如何看待数学家角色的演变。我也很想听你进一步展开这一点因为这和我们刚才讨论的内容高度相关比如当你开始主导、协调这些形式化项目时你是否也感受到自己角色的变化以及你在组织 Polymath 项目过程中积累的经验又是如何与这种变化发生交汇、相互影响的陶哲轩我一直都有一种很强烈的感觉我想做的数学远远超过了一个人所能完成的量。因此我始终觉得合作极其高效、也极其重要。我从合著者身上学到了很多同样也从互联网上一些看似偶然的交流中学到了很多。举个例子我最早开始写博客其实源于一次非常偶然的经历。有一次我在自己的网页上随手贴了一个数学问题并没有期待会有人回应。但当时已经有不少人会浏览我的页面结果在短短三天之内就有人给了我一个非常完整的参考说明直接指出这个问题最早的来源。放在今天这可能只需要一次简单的 ChatGPT 查询就能得到答案但在当时这对我来说是一种颠覆性的体验。后来英国数学家 Timothy Gowers 提出了 Polymath 项目希望通过众包的方式来做数学研究而我也非常享受参与其中。这种想法和我的直觉高度契合数学中存在着大量潜在的联系参与的人越多就越有可能产生那些偶然的连接这些连接往往是任何单一专家、无论多么资深都很难凭一己之力发现的。但与此同时这种协作方式始终存在一个明显的瓶颈。在 Polymath 项目中当同时有十几、二十个人参与贡献时总需要有人来逐条检查这些想法确保逻辑上一致并把零散的讨论整理成一个连贯、可读的整体。这个工作通常由我、Timothy Gowers或者其他少数人来承担而这件事实际上是非常耗费精力的。Jared Duker Lichtman原本看似去中心化的群体协作最终还是回到了一个核心人物众多贡献者的老模式。陶哲轩对这种模式虽然很有潜力但并没有真正实现规模化。不过它确实促成了一些非常宏大的研究项目来自数学中完全不同方向的人会因为偶然的灵感贡献出大量有价值的线索。很多时候项目的组织者事先根本不知道这些人彼此之间存在任何关联但他们提供的想法却是相关且有用的。问题在于当时我们并没有完善的组织与验证基础设施。而且那时我们主要是通过博客和 Wiki 来运作项目而不是像今天这样使用 GitHub 这类更成熟的协作平台。也正是在这里形式化工具和 AI 展现出了另一项关键能力它们真正实现了不同技能背景人群之间的无缝协作。在一个形式化项目中并不是每个人都需要懂 Lean也不是每个人都需要精通数学更不是每个人都要熟悉 GitHub。你只需要一个技能集合彼此有重叠的群体每个关键环节都有一部分人能够胜任整体就能顺利推进。这也使得数学研究第一次真正具备了分工协作的可能性。在传统数学研究中无论是单人还是合作参与者几乎都需要什么都懂既要理解全部数学内容又要会写 LaTeX、检查推导、整理论文每个人都要覆盖所有环节。而在真正意义上的分工体系中就像工业化生产一样会有人负责项目管理有人负责质量验证有人专注于具体技术细节。软件工程其实早就完成了这种转变。早期的软件开发也是一个人包办一切但这种方式无法扩展一旦进入企业级开发就必须依赖高度专业化的角色分工。因此我确实预见到一种趋势在规模化、工业化的条件下生产数学成果并且伴随着清晰的专业分工。当然传统的、手工式的数学研究依然会存在也依然会被高度珍视只是未来会出现一种与之互补的、全新的数学生产方式。Jesse Han那么这是否意味着你预见到大多数职业数学家的角色将会演变为这些工业化数学体系的架构师陶哲轩我认为数学家的定义本身会被拓宽。未来会出现一类人他们擅长运作和管理大型项目就像大型工程中的项目负责人一样。这些大型项目的管理者会掌握足够多的数学和 Lean 知识能够在宏观层面理解项目在做什么但他们未必擅长定位和修复某一条具体的形式化问题。尽管如此他们能够协调复杂项目的推进而这本身就是一种非常重要的能力。同时也会有一些人他们可能并不是某个数学领域的专家但非常擅长形式化工作或者非常善于使用新的 AI 工具。这些能力本身同样有价值。在这样的体系中人们可以更自由地加入或离开项目协作将变得更加流动。当然也仍然会存在更传统的研究方式由一个规模较小的团队组成所有人都深度参与项目的每一个环节。这种方式依然非常重要也不会消失。关键在于我们终于拥有了多种选择。在当前体系下许多真正热爱数学的人被挡在数学研究之外只是因为门槛太高了。如果你想参与前沿研究就必须掌握博士阶段水平的数学你还得会用 LaTeX得知道如何写作、如何避免任何细节错误…… 这些要求叠加在一起对很多人来说极具威慑性进入门槛过高。即便成功进入这一体系的人也常常因为自身技能结构不完整而被忽视或边缘化。但未来并不必然如此随着工具、形式化和协作方式的变化这种状况有可能被根本性地改变。Jared Duker Lichtman在门槛被工具和协作机制降低之后数学研究不再只属于少数职业数学家而可以像公民科学一样吸纳大量具有兴趣和部分技能的普通参与者。陶哲轩是的我们其实已经在看到这种趋势了。比如我自己就深度参与过一个数学问题网站。它逐渐发展成了一个社区聚集了几十位数学背景和受教育程度各不相同的参与者大家各自贡献一些小而具体的内容。我们学会了把一个问题模块化拆解也许你没法完整地解决这个问题但你可以帮忙查找相关参考文献或者把问题和某个整数序列联系起来或者评论、改进他人的证明又或者做一些数值实验和计算。正是通过这种方式很多人都能在自己能力范围内参与进来。而现实中确实存在着一个非常庞大的群体他们渴望参与研究级别的数学工作只是过去缺乏合适的入口和工具。我希望也相信这些新的工具和协作方式能够真正释放出这股力量。AI 应该先帮数学家「干脏活」Jesse Han到目前为止我们已经谈了很多内容一方面是你在形式化数学前沿工作的经验另一方面是你在协调大规模协作项目、加速数学研究方面的实践。而我觉得正好在这两者的交汇点上是一个非常合适的时机来谈谈你目前特别投入、也非常兴奋推动的一个项目解析数论中数学界限Bounds的形式化证明。或许我们可以从一个简要的介绍开始面向非专业读者能否先解释一下 —— 为什么这个问题本身如此重要以及它在某种程度上如何成为我们刚才讨论过的那些问题协作、形式化、规模化研究的一个缩影或体现陶哲轩我想先从一个更宏观的角度来讲。我一直认为自动化本质上是对人类思维的补充工具。最直观的一种思路是把人类最想解决、也最困难的数学问题 —— 比如像黎曼猜想这样的重大猜想直接交给计算机让它们来尝试解决。计算机在这些问题上确实可能取得一定进展但我认为在可预见的未来它们更有可能在另一类完全不同的任务上发挥巨大优势。这些任务往往与人类真正擅长、或乐于从事的工作是正交的尤其是那些需要进行大量枯燥的数值计算、枚举海量可能性、反复筛选组合情况的工作。这类任务人类通常并不享受甚至极易出错但对 AI 和计算机来说却并不构成障碍。以我所从事的领域之一解析数论为例这里就存在一个非常典型的困难其中有大量极其繁琐、细碎的组合性计算工作长期以来几乎只能由人类亲自完成而这正是自动化和 AI 最有潜力介入、并发挥巨大价值的地方。Jared Duker Lichtman对我个人来说在思考一个解析数论问题时至少有 70% 的时间都花在这种繁琐、机械性的工作上。陶哲轩是的我认为我们其实已经掌握了很多非常精巧的思想和工具可以把关于数字的一类陈述或者关于和的展开、各种算术函数等内容转化为我们真正关心的另一类陈述。解析数论中正是依靠这些工具在不同表述之间来回转换。但问题在于这些工具都有各自的输入和输出条件而真正做研究时你需要把它们一环一环地串联起来。相关的工具和结果分散在不同的论文中每篇论文使用的记号体系都不一样假设条件也往往和你手头的问题并不完全匹配。于是你不得不重新拆解原有证明根据自己的需求重写一套版本。在这个过程中就会产生大量的重复劳动反复调整参数、对齐条件、重建推导链条而且非常容易出错。为了让事情稍微不那么痛苦我们发展出了一些权宜之计。其中一个最常见的做法是不去关心具体常数。比如这里原本是 27那里是 38我们干脆都记成一个统一的常数 C只说明存在某个常数而不去计算它的具体数值。这样可以显著减少计算量也能在一定程度上避免错误即便你在常数上算错了只要结论仍然成立通常也不会造成严重后果。但这种做法是有代价的。它导致解析数论中的很多结果都是非显式的。比如你可能证明了所有足够大的奇数都可以表示为三个素数之和但足够大究竟是多大这个常数 C 到底是多少我们并没有算出来说白了是懒得算。因此真正去显式计算所有常数的解析数论研究只占整个领域中非常小的一部分。这类工作极其繁琐、计算量巨大做的人很少论文也往往不太好理解。这并不是作者水平的问题而是因为研究内容本身就充斥着大量细碎、明确的计算过程几乎没有那种直观的结构美感可言。说实话这种研究并不好理解。但我认为这恰恰是自动化最理想的应用场景之一。如果我们能够搭建一条流水线把这些显式型的论文纳入进来其中的思想和工具本身其实已经相当成熟真正困难的只是把大量彼此略微不兼容的工具拼接在一起并把所有参数对齐那么用现有的方法就完全有可能在规模化条件下完成这些形式化工作。在此基础上我们甚至可以引入 AI 或机器学习去探索这些工具链的最优组合方式。这将为整个领域打开许多全新的观察视角。举个具体的例子如果有人在某个算术函数上证明了一个新的界我们希望能把这个结果直接丢进一个已经形式化好的、包含上百条定理的系统中然后像操作 Excel 表格一样自动更新改动一格所有依赖它的结果都会自动刷新。这样一来我们就可以拥有一个持续演化、动态更新的领域最前沿状态而不再是那些写死了指数和常数的论文。现在的做法是每当某个关键结果被改进研究者往往需要重写整篇论文重新推导所有相关界限才能弄清楚最新的最好结果是什么。而这类更新通常十年才发生一次但如果工具链足够成熟这些工作完全可以在几分钟内完成。Jesse Han所以你的意思是这本质上是一个软件问题对吗就像早期编程时代人们看待汇编语言时那样它非常繁琐到处都是子程序逻辑隐藏在代码细节里既不直观也谈不上可读性。但一旦能够在更高层次上对这些内容进行抽象和推理情况就会完全不同。陶哲轩可以这么理解。而且在现代软件工程中原则上一切都是可以互操作的。你可以调用别人的子程序不同工具之间有标准化的接口和格式它们能够彼此通信从而构建起极其复杂、庞大的软件生态系统。当然这样的系统也会带来一个问题正是因为系统复杂、组件众多软件中不可避免会出现各种错误。但在数学形式化这件事上像 Lean 这样的工具至少在理论上让我们有机会构建一种尽可能无 bug 的协作体系。通过形式化验证你可以希望、甚至确信这些由大量研究者共同构建的成果是相互兼容、逻辑一致的。而这正是我们目前在数学研究中所缺失的东西一种真正可靠、可互操作、可规模化扩展的基础设施。当新工具出现数学的研究路径会整体改写吗Jared Duker Lichtman那么你是否愿意做一个大致的判断或推测在数论乃至其他数学领域中有多大比例的工作其实是由这些相对枯燥、机械性的劳动构成的如果这种工作负担的比例发生改变是否可能由此催生一种截然不同的研究工作流程Jesse Han我想在这个问题上再补充一句。事实上在数学史上应该已经出现过不少并非基于形式化验证、也不依赖计算机的例子某些更好的数学技术或方法被发明出来之后使数学家得以摆脱以往的一些繁琐劳动从而能够把精力投入到全新的问题和思考方式中。我也很好奇在解析数论的发展过程中是否存在过这样的重要例子比如是否有某些关键方法的出现真正改变了人们理解和研究这一领域的方式如果是这样的话那么我们是否也可以把如今的形式化工具如 Lean以及自动形式化技术视为历史上这一类技术演进的又一个实例一次新的数学技术革命陶哲轩我认为数论其实是最早采用实验性方法的数学分支之一。例如数论中的一个核心问题关于素数分布的规律最早就是由高斯提出的猜想。高斯当年通过一种极其艰苦的方式来获得直觉他手工计算了前几十万、甚至上百万个素数并从这些数据中观察到了某些模式由此提出了后来影响深远的素数分布猜想。从今天的角度看这几乎就是一种早期的计算实验数学通过大量具体数据的积累来引导理论判断和猜想的形成。这在当时是非常开创性的做法也深刻影响了数论此后的发展方向。Jared Duker Lichtman而且当时所依赖的其实只是规模很小的数据。陶哲轩是的。高斯展现出了一种非凡的能力他能够从规模非常小的数据集中概括出极其深刻、普遍的规律这正是高斯天才的体现也正因为如此后来很多工具都会以他的名字命名。而随着计算技术的发展我们才真正能够系统性地展开这种探索。后来也陆续出现了不少类似的例子一些重要的猜想最初正是通过数值实验和计算探索被发现的而在更近的时代还有一些结果是借助大规模枚举甚至结合机器学习方法才逐渐显现出其结构和规律的。这些进展都说明了一点新的技术手段不断扩展着数学家可探索的空间也在持续改变人们理解和研究数论的方式。Jared Duker Lichtman我想甚至连图灵当年也在做类似的事情亲自去计算函数的零点。陶哲轩像某些算术函数的研究其实早期就大量依赖数值计算。比如黎曼猜想在很长一段时间里正是通过大量数值实验获得了强有力的支持。因此历史上早就存在这样的先例计算机的引入催生了一种新的数学研究方式不再只是依赖纯粹的抽象思考而是结合数据和实验来推动理论的发展。当然我们现在讨论的这种形式化工作并不完全等同于数据驱动的数学但它无疑是一种计算机辅助的研究模式。Jared Duker Lichtman那么撇开机器学习领域里那一小部分人或者少数主动尝试新工具的研究者不谈对于一位普通的数学家来说无论是在数论还是其他领域在日常研究工作中有多大比例其实是被这种繁琐、机械性的苦工所拖慢、所构成瓶颈的陶哲轩这个问题其实很难给出一个精确的百分比但我觉得关键并不在于直接统计时间比例而在于一种间接影响。正是因为这些繁琐劳动的存在我们往往会有意识地改变做数学的方式尽量减少自己要面对的苦工。比如当我们意识到某一步组合推导开始变得非常凌乱、计算量巨大时往往会选择刻意绕开改用另一条思路继续推进。因此如果你只看最终论文里呈现出来的内容会觉得我们似乎做的都是高判断力的工作真正的苦工并不多。但那是因为我们在研究过程中已经下意识地避开了道路上的一个个坑用一个比喻来说我们是在不断绕开崎岖路段而不是去填平它们。而一旦这些工具真正到位情况可能会发生根本变化。那时我们会改变做事方式如果前方出现一个巨大而繁重的计算任务我们不再选择绕路而是直接碾过去动用所有可用的技术手段借助计算、形式化工具甚至直接交给计算机说清楚从这里到那里该怎么走然后继续前进。这样一来我们就可以穿越那些现在几乎是下意识回避的障碍。所以从表面上看当前数学研究中苦工的比例似乎并不高但如果把那些被我们主动规避掉的工作也算进去那这个比例其实远比看上去要大得多。Jesse Han之前你提到过一个非常重要的瓶颈在于寻找合适的合作者本身就很困难更不用说还要在工作方式、思路层面与他们建立足够的默契。我想具体问的是在这种情况下你觉得在研究过程中有多大比例的时间其实是被人与人之间沟通、对齐思路、传递和同步这些界限结果所消耗的也就是说为了在人类专家之间完成某种分布式计算我们究竟付出了多大的沟通成本以及如果你所设想的这一愿景真的实现了形式化、自动化工具能够承担起这些传递与整合工作你认为这一领域的数学研究整体上有可能被加速多少倍陶哲轩我觉得确实如此。首先这是一个信任问题。在这类计算密集的研究中只要某一步出了错整个推导就可能全部失效。因此你必须清楚哪些作者是可靠的、哪些结果是可以放心使用的而这些信息往往是隐性的并不会明确写在论文里。现实中我们不会公开列出哪些工作存在严重问题于是你只能依赖对学术共同体的熟悉程度你得知道这个圈子知道该去问谁。很多时候如果某个结果还没有正式发表但你认识相关领域的专家就可以直接去问他这个地方是不是只需要稍微改一下就行对方可能就会给你一个可靠的判断。这就形成了一个明显的瓶颈你必须身处这个关系网络之中认识足够多对的人才能高效地在这个领域工作。而一旦我们能够通过形式化工具比如 Lean提供这种可验证的信任保证情况就会发生根本改变。那时你可以放心使用来自陌生研究者的结果即便你从未见过他们因为所有证明都已经由系统严格验证过。正是在这一点上我认为形式化将会极大地解锁生产力消除大量由于信任与沟通成本造成的阻塞从而释放出此前被压抑的大量研究潜力。Jared Duker Lichtman是的我明白你的意思。你刚才提到信任这个概念其实在数学研究中信任往往是通过长期积累的学术记录建立起来的。一个研究者在某个领域持续工作、不断产出成果随着时间推移其他人自然会越来越信任他的结论。而真正让我开始对形式化和数学基础问题产生强烈兴趣的一个重要故事正是关于一位数学家的经历。他曾经建立起极高的学术声誉证明过许多非常了不起的结果因此在学界拥有极强的可信度。但在 20 世纪 90 年代末他写过一篇论文后来大约在十年之后他才意识到其中存在一个关键性的错误。回过头来看他自己也反思到当时很多人之所以接受那篇结论很大程度上是因为大家在相信他这个人而不是因为证明本身被彻底、逐行地验证过。而这正揭示了一个核心问题个人声誉和过往记录并不等同于真理的保证。这类经历也正是形式化证明与基础工具如此重要的原因之一它们提供的不是基于人的信任而是基于可验证结构的信任。陶哲轩当然这种做法在深度上是有极限的。我们能够推动数学前进的程度终究会受到限制。当前在分析学中这个问题相对没那么严重是因为这里逐渐形成了一张不断加密的信任之网而且我们的工作方式往往更接近从第一性原理出发比其他一些领域更少依赖远距离的结果。但即便如此这种基于信任的结构依然是数学发展的一个限制因素。从长远来看这是一个无法回避的问题也是形式化和基础工具之所以重要的又一个原因。Jared Duker Lichtman我想再追问一个相关的问题。随着我们开始系统性地回溯并形式化一些经典论文以及从 20 世纪 60 年代以来的大量文献你会如何看待这样一个问题第一在现有的数学文献中可能还存在多少尚未被发现的错误第二这些错误中有多少只是可以通过小修小补解决的技术性问题换句话说整个数学体系作为一个整体对这类错误究竟有多强的鲁棒性也就是说即便我们真的通过形式化手段暴露出大量隐藏的问题它们是否大多不会动摇理论的核心结构而只是需要局部修正还是说其中也可能存在少量但影响深远的根本性漏洞陶哲轩说实话我也很想知道实际的错误率到底是多少。也许结果会让我们惊喜也可能会让我们不太愉快。等六个月之后再来问我吧。Jesse Han今天这次交流真的非常愉快真希望能再多聊一会儿。那就希望六个月之后我们还能再进行一次这样的对话。阅读最新前沿科技趋势报告请访问21世纪关键技术研究院的“未来知识库”未来知识库是“21世纪关键技术研究院”建立的在线知识库平台收藏的资料范围包括人工智能、脑科学、互联网、超级智能数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告加入未来知识库全部资料免费阅读和下载牛津未来研究院《将人工智能安全视为全球公共产品的影响、挑战与研究重点》麦肯锡超级智能机构赋能人们释放人工智能的全部潜力AAAI 2025 关于人工智能研究未来研究报告斯坦福2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告191 页壳牌2025 能源安全远景报告能源与人工智能57 页盖洛普牛津幸福研究中心2025 年世界幸福报告260 页Schwab 2025 未来共生以集体社会创新破解重大社会挑战研究报告36 页IMD2024 年全球数字竞争力排名报告跨越数字鸿沟人才培养与数字法治是关键214 页DS 系列专题DeepSeek 技术溯源及前沿探索50 页 ppt联合国人居署2024 全球城市负责任人工智能评估报告利用 AI 构建以人为本的智慧城市86 页TechUK2025 全球复杂多变背景下的英国科技产业战略韧性与增长路径研究报告52 页NAVEX Global2024 年十大风险与合规趋势报告42 页《具身物理交互在机器人 - 机器人及机器人 - 人协作中的应用》122 页2025 - 2035 年人形机器人发展趋势报告 53 页Evaluate Pharma2024 年全球生物制药行业展望报告增长驱动力分析29 页【AAAI2025 教程】基础模型与具身智能体的交汇350 页 pptTracxn2025 全球飞行汽车行业市场研究报告45 页谷歌2024 人工智能短跑选手AI Sprinters捕捉新兴市场 AI 经济机遇报告39 页【斯坦福博士论文】构建类人化具身智能体从人类行为中学习《基于传感器的机器学习车辆分类》最新 170 页美国安全与新兴技术中心2025 CSET 对美国人工智能行动计划的建议18 页罗兰贝格2024 人形机器人的崛起从科幻到现实如何参与潜在变革研究报告11 页兰德公司2025 从研究到现实NHS 的研究和创新是实现十年计划的关键报告209 页康桥汇世Cambridge Associates2025 年全球经济展望报告44 页国际能源署2025 迈向核能新时代麦肯锡人工智能现状组织如何重塑自身以获取价值威立Wiley2025 全球科研人员人工智能研究报告38 页牛津经济研究院2025 TikTok 对美国就业的量化影响研究报告470 万岗位14 页国际能源署IEA能效 2024 研究报告127 页Workday 2025 发挥人类潜能人工智能AI技能革命研究报告20 页CertiKHack3D2024 年 Web3.0 安全报告28 页世界经济论坛工业制造中的前沿技术人工智能代理的崛起》报告迈向推理时代大型语言模型的长链推理研究综述波士顿咨询2025 亚太地区生成式 AI 的崛起研究报告从技术追赶者到全球领导者的跨越15 页安联Allianz2025 新势力崛起全球芯片战争与半导体产业格局重构研究报告33 页IMT2025 具身智能Embodied AI概念、核心要素及未来进展趋势与挑战研究报告25 页IEEE2025 具身智能Embodied AI综述从模拟器到研究任务的调查分析报告15 页CCAV2025 当 AI 接管方向盘自动驾驶场景下的人机交互认知重构、变革及对策研究报告124 页《强化学习自我博弈方法在兵棋推演分析与开发中的应用》最新 132 页《面向科学发现的智能体人工智能进展、挑战与未来方向综述》全国机器人标准化技术委员会人形机器人标准化白皮书2024 版96 页美国国家科学委员会NSB2024 年研究与发展 - 美国趋势及国际比较51 页艾昆纬IQVIA2025 骨科手术机器人技术的崛起白皮书创新及未来方向17 页NPLBeauhurst2025 英国量子产业洞察报告私人和公共投资的作用25 页IEA PVPS2024 光伏系统经济与技术关键绩效指标KPI使用最佳实践指南65 页AGI 智能时代2025 让 DeepSeek 更有趣更有深度的思考研究分析报告24 页2025 军事领域人工智能应用场景、国内外军事人工智能发展现状及未来趋势分析报告37 页华为2025 鸿蒙生态应用开发白皮书133 页《超级智能战略研究报告》中美技术差距分析报告 2025欧洲量子产业联盟QuIC2024 年全球量子技术专利态势分析白皮书34 页美国能源部2021 超级高铁技术Hyperloop对电网和交通能源的影响研究报告60 页罗马大学2025 超级高铁Hyperloop第五种新型交通方式 - 技术研发进展、优势及局限性研究报告72 页兰德公司2025 灾难性网络风险保险研究报告市场趋势与政策选择93 页GTI2024 先进感知技术白皮书36 页AAAI2025 人工智能研究的未来报告17 大关键议题88 页安联 Allianz2025 新势力崛起全球芯片战争与半导体产业格局重构研究报告威达信2025 全球洪水风险研究报告现状、趋势及应对措施22 页兰德公司迈向人工智能治理研究报告2024EqualAI 峰会洞察及建议19 页哈佛商业评论2025 人工智能时代下的现代软件开发实践报告12 页德安华全球航空航天、国防及政府服务研究报告2024 年回顾及 2025 年展望27 页奥雅纳2024 塑造超级高铁Hyperloop的未来监管如何推动发展与创新研究报告28 页HSOAC2025 美国新兴技术与风险评估报告太空领域和关键基础设施24 页Dealroom2025 欧洲经济与科技创新发展态势、挑战及策略研究报告76 页《无人机辅助的天空地一体化网络学习算法技术综述》谷歌云Google Cloud2025 年 AI 商业趋势白皮书49 页《新兴技术与风险分析太空领域与关键基础设施》最新报告150 页《DeepSeek 大模型生态报告》军事人工智能行业研究报告技术奇点驱动应用加速智能化重塑现代战争形态 - 25030940 页真格基金2024 美国独角兽观察报告56 页璞跃Plug and Play2025 未来商业研究报告六大趋势分析67 页国际电工委员会IEC2025 智能水电技术与市场展望报告90 页RWS2025 智驭 AI 冲击波人机协作的未来研究报告39 页国际电工委员会IEC2025 智能水电技术与市场展望报告90 页RWS2025 智驭 AI 冲击波人机协作的未来研究报告39 页未来今日研究所 2025 年科技趋势报告第 18 版 1000 页模拟真实世界多模态生成模型的统一综述中国信息协会低空经济分会低空经济发展报告2024 - 2025117 页浙江大学2025 语言解码双生花人类经验与 AI 算法的镜像之旅42 页人形机器人行业由 “外” 到 “内” 智能革命 - 25030651 页大成2025 年全球人工智能趋势报告关键法律问题28 页北京大学2025 年 DeepSeek 原理和落地应用报告57 页欧盟委员会人工智能与未来工作研究报告加州大学伯克利分校面向科学发现的多模态基础模型在化学、材料和生物学中的应用电子行业从柔性传感到人形机器人触觉革命 - 25022635 页RT 轨道交通2024 年中国城市轨道交通市场数据报告188 页FastMoss2024 年度 TikTok 生态发展白皮书122 页Check Point2025 年网络安全报告 - 主要威胁、新兴趋势和 CISO 建议57 页【AAAI2025 教程】评估大型语言模型挑战与方法199 页 ppt《21 世纪美国的主导地位核聚变》最新报告沃尔特基金会Volta Foundation2024 年全球电池行业年度报告518 页斯坦福2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告191 页国际科学理事会2025 为人工智能做好国家研究生态系统的准备 - 2025 年战略与进展报告英文版118 页光子盒2025 全球量子计算产业发展展望报告184 页奥纬论坛2025 塑造未来的城市研究报告全球 1500 个城市的商业吸引力指数排名124 页Future Matters2024 新兴技术与经济韧性日本未来发展路径前瞻报告17 页《人类与人工智能协作的科学与艺术》284 页博士论文《论多智能体决策的复杂性从博弈学习到部分监控》115 页《2025 年技术展望》56 页 slides大语言模型在多智能体自动驾驶系统中的应用近期进展综述【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用皮尤研究中心2024 美国民众对气候变化及应对政策的态度调研报告气候政策对美国经济影响的多元观点审视28 页空间计算行业深度发展趋势、关键技术、行业应用及相关公司深度梳理 - 25022433 页Gartner2025 网络安全中的 AI明确战略方向研究报告16 页北京大学2025 年 DeepSeek 系列报告 - 提示词工程和落地场景86 页北京大学2025 年 DeepSeek 系列报告 - DeepSeek 与 AIGC 应用99 页CIC 工信安全2024 全球人工智能立法的主要模式、各国实践及发展趋势研究报告42 页中科闻歌2025 年人工智能技术发展与应用探索报告61 页AGI 智能时代2025 年 Grok - 3 大模型技术突破与未来展望报告28 页上下滑动查看更多

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2467168.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！