量子位 16小时前
半世纪难题48小时破解!陶哲轩组队把AI数学玩成打怪游戏了
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

刚刚,陶哲轩与多名数学家通力合作,为 Erd ő s。

至此,这个尘封 50 年的难题终于得到完全解决。

关键是,AI 又立大功了。在多种 AI 工具的辅助下,整个解题流程仅用48 小时便完成。

博采众家 &AI 之长,正在成为解决问题的关键。

正如陶哲轩本人所说:

用传统方法,一两位数学家用简单的编程和文献检索工具,最终也能完成,但可能需要数周或者数月才能解决

陶哲轩随后亲自梳理并公开了此次问题被解决的完整过程。

消息传出后,网友纷纷感叹 " 太酷了 ":

一起来看看他们究竟是如何解决的?

48 小时解决 Erd ő s

Erd ő s问题最早在 1975 年被提出,初始问题为:

但该问题表述相当模糊,于是数学家 Desmond Weisenberg 提议对这个函数的最小可能值进行研究,引入一个最大常数的量 c ( n ) ,使得:

其中 c ( n ) 是所有长度为 n 的不同实数序列。

如果用博弈论来解释该问题,那么就是:

假设 Alice 有 N 个硬币,她将硬币分为 n 堆,每堆大小都为,Bob 只能选择一个单调子序列的堆,并拿走这些堆里的所有硬币。

问 Bob 无论 Alice 如何分配硬币,至少能保证拿走全部硬币的多少比例?其中 c ( n ) 是 Bob 拿走的最小比例。

这里陶哲轩还用 AI 画了一张简单的说明图:

陶哲轩随即给出了他的初步答案,显然 c ( 1 ) =1 时,Alice 只有一堆,Bob 可以拿走全部;c ( 2 ) =1 时,两堆一定处于单调,Bob 可以拿两堆;c ( 3 ) =2/3 时,Bob 至少可以取两堆,但无法保证全部三堆。

数学家 Stijn Cambie 提出了更进一步的猜想。

通过计算 c ( n ) 的前几个值可以得到,存在以下近值:1,1,2/3,1/2,1/2,3/7,2/5,3/8,1/3。

所以如果 ,..., 是不同的正实数且,那么总存在一个和至少为 1/k 的单调子序列。

但该问题随后一直没有出现进展,直到 Boris Alexeev 使用 Harmonic 的数学 AI 模型亚里士多德,在证明助手 Lean 中自动构造并证明了关键不等式。

该证明成功将原问题转化为一个计算几何领域的矩形填充问题。

一个小时不到,另一位数学家 Koishi Chan 加入其中,给出了一个基于原始Erd ő s – Szekeres 定理的替代证明,印证了前面 AI 的发现。

第二天,陶哲轩注意到了这个问题,他将该问题放入 AlphaEvolve,要求它通过生成总和为固定值(这里选择的是 10 的 6 次方)的实数(或整数)序列,来获取 c ( n ) 的上界,并尽可能确保 S 的值够小。

在运行一小时后,AlphaEvolve 生成了以下 c ( n ) 的上界,其中包含了一些结构清晰的潜在极值解:

显然数值分数(除以 10 的 6 次方)正在试图逼近简单有理数,于是陶哲轩又利用 John Cook 的公开专用工具,将序列整理成:

这为序列 c ( n ) 的值提供了一种猜想,之后 Boris Alexeev 继续找到了该猜想的简洁表述,即:

满足和。

另外,他还提供了一个明确的上界构造

该上界通过构造不利配置的序列实现,基本思想仍然来自 Erd ő s – Szekeres 定理,即复杂设计数字排列顺序,会使得长单调序列无法同时拥有很好的权重。

这种构造是组合性的,需要精心设计序列结构与分块策略,才能使最长序列单调和受限。

用 ChatGPT Pro 生成 1/c ( n ) 的图像,能够直观看出,它基本上是对平方根函数的分段线性逼近。

不久之后,数学家 Lawrence Wu 就该问题,结合正方形填充(Erd ő s)进行了阐述。

根据 Erd ő s,他将 f ( n ) 引入该问题,设定其为最小数,使得把 n 个正方形按平行坐标轴打包进一个大正方形时,满足:

其中对于 n=10 时,用 ChatGPT Pro 生成转换成方形打包的图像,如图所示:

在此基础上,Lawrence Wu 通过 AI 论文检索,找到了一篇去年由 Baek、Koizumi 和 Ueoro 联合发表的论文,最终证明了猜想中的公式,从而完成了整体证明。

接下来陶哲轩将上述所有信息全部输入了 ChatGPT,生成了连贯证明。

人 + 人 +AI= 数学破壁机

当然,这已经不是陶哲轩第一次用 AI 解题了。

最近,他还借助 Gemini 2.5 Deep Think 破解了 Erd ő s 问题。

这是他本人很擅长的连续整数结构的乘法数论问题,该问题建立在前人并不完整的反证基础上,陶哲轩借助 Gemini Deep Think 进行证明补全。

全程只用了十分钟,Gemini 就从论证分析打通了结论确认。

另外,陶哲轩前段时间还利用 GPT-5 进行半自动化文献检索。

他借助 GPT-5 对相关数列进行高精度计算,随后将得到的结果输入 OEIS(一个收录全球数列的数据库)进行检索对照,进而发现部分 Erd ő s 问题其实早已在既有研究中被解决——只是长期没人注意到,未把结果与问题库对应起来。

至于什么是 Erd ő s 问题?

它出自 20 世纪著名匈牙利数学家 Paul Erd ő s。此人一辈子合作了超 500 位数学家,毕生发表了约 1525 篇数学论文,数量之多,至今无人能及。相应地,他也提出或转述了千道问题,给后人留下了 "Erd ő s 问题 "。

其中大量题目被收录于 erdosproblems.com 网站。该网站由数学家 Thomas Bloom 制作,记录了每道题目的当前状态。目前,绝大多数难题依然悬而未解。

随着 AI 技术的不断进步,接连有人利用 AI 成功解答了这些几十年来未曾解决的难题。

陶哲轩本人就表示," 在 Erd ő s 问题网站上,AI 辅助已经变得很常见 "。

就在前几天,来自 Harmonic 的数学 AI 模型还被曝独立证明了 Erd ő s 问题

微软前 AI 副总裁、目前在 OpenAI 研究 AGI 的 Sebastien Bubeck 表示 " 该解决方案 100% 由 AI 生成,总计耗时 6 小时 "。

目前,Erd ő s 网站也公开鼓励大家借助 AI 等工具辅助解题:

允许使用 AI 辅助撰写评论,但需满足: ( a ) 公开说明使用了 AI; ( b ) 内容(包括数学内容、代码、数值数据及相关来源)已由用户本人独立(不借助 AI)仔细检查和验证; ( c ) 评论长度合理。

而这次 Erd ő s,离不开 " 人与人的协作 "+" 人与 AI 的协作 "。

这种协作方式,也正在成为一种新趋势。

参考链接:

[ 1 ] https://www.erdosproblems.com/forum/thread/1026

[ 2 ] https://terrytao.wordpress.com/2025/12/08/the-story-of-erdos-problem-126/

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

点亮星标

科技前沿进展每日见

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

陶哲轩 ai 句号 编程
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论