網易首頁 > 網易號 > 正文申請入駐

金寧匯 Spiral AI 完成關鍵一棒：在 OpenAI顛覆性工作基礎上，將 Erd?s 問題下界優化129%

2026-05-29 14:44:51　來源: AI科技評論

廣東舉報

分享至

Spiral AI不是簡單“調參數”，而是找到了這條路徑的理論極限。

48小時的全球數學難題證明接力

一場圍繞80年數學難題的“學術接力”正在上演。

第一棒，5月21日，OpenAI宣布其通用推理模型獨立推翻Erd?s猜想，證明原來那個“2n”的結論是錯的，并給出了一個實際更多的超線性下界。這一突破，在數學上叫做“超線性增長”。

通俗來說，原來是在平路上騎車，現在是在下坡溜車，速度越來越快。

第二棒，普林斯頓大學Will Sawin教授迅速將其精確化，他把 OpenAI 的發現精確化，給出了一個非常接近 1 的指數：基于單個素數2，將下界確定為 n^{1.014114}。

普通人不需要記住這個數字，只需要知道：人類把門推開了一條縫。

第三棒，屬于金寧匯科技Spiral AI團隊。在Sawin結果公布數小時內，金寧匯科技的AI團隊基于自主研發的AI for Science長程智能體平臺（Spiral AI），完成了完成了最關鍵的一棒。

Spiral AI不是簡單“調參數”，而是找到了這條路徑的理論極限。它不僅創新性地提出并驗證了“雙素數構造”方案，更關鍵地證明了在Sawin的框架內，使用兩素數是最優的，增加素數數量將導致指數下降。

AI究竟做了什么？

經過系統搜尋與優化，Spiral AI確定最優雙素數為(2, 3)，并找到了最佳參數組合（k(2)=6, k(3)=5, R=7.5），從而將下界指數從 1.014114 顯著提升至 1.0323。

你可能會想，從1.0141到1.0323，不就是小數點后動了一點點嗎？但在數學里，這種指數上的微小變化，在n很大的時候，會導致最后結果翻倍——在這個例子中，相對效果提升高達129%。

這項工作不僅是一次關鍵參數的優化，更是通過AI驗證并鎖定了現有最優證明路徑的理論極限，為后續研究提供了清晰的方向與堅實的基礎。它標志著AI在深度參與并推動前沿數學研究進程中，扮演著越來越核心的角色。

從“一個素數”升級為升級為“兩個素數”

原來的方法只用一個素數（比如2），就像做菜只放鹽——穩定、不會錯，但風味單一，上限有限。

Spiral AI跳出固有思路，嘗試用兩個素數，比如2和3，好比在鹽的基礎上再加胡椒粉。兩種調料搭配，成本確實增加了，數學上叫“判別式”變大，但風味也大大豐富了，多了一個增益項。

關鍵在于：多花的錢，值不值？

Spiral AI通過系統計算證明：增益遠大于代價，非常值。

哪兩種素數搭配效果最好？

既然兩種調料比一種好，那問題就來了：這么多素數，哪兩種搭配效果最佳？Spiral AI把所有可能的素數組合全部測試了一遍，相當于把所有雙調料配方挨個試做、對比口味。最終結果非常明確：2和3就是味道最佳、適配度最高的黃金配方。

如果換成其他組合（比如3和5、2和5），要么味道發悶，要么風味不足，整體效果遠不如2和3。

搭配效果如何調出最優配比？

確定了“鹽+胡椒粉（2和3）”的黃金搭配后，下一步是精準把控調料比例——同樣的兩種調料，放多放少，味道天差地別。

AI像一位嚴謹的研發廚師，在合理范圍內反復調試，遍歷了所有可能的配比方案。最終鎖定了一套獨一無二的完美配比，將2和3的組合優勢發揮到了極致。

為什么不能加三種調料？

很多人會疑惑：調料越多是不是越好？但在這道“數學菜肴”里，答案恰恰相反。AI經過大量測試驗證：如果強行加入第三種、第四種調料，看似配料更豐富，實則會讓食材味道極度雜亂、調味成本爆炸式飆升。

對應到數學邏輯中，就是數據損耗會快速失控，新增調料帶來的微弱增益，完全抵不過混亂搭配造成的負面效果，最終讓整體結果大打折扣、趨近于無效。這也證明，兩種調料搭配，就是這道“數學菜肴”的最佳上限。

同時，AI通過嚴謹對比證明：其他所有素數組合，要么損耗更大，要么增益太小，最終效果都不如2和3。因此，2和3不僅是當前框架下的最優選擇，更是這條路徑上無法再被超越的理論極限。

靠著這套“最佳配方+精準配比”，下界指數相對提升了129%——看似只是微調，卻是該研究方向上一次分量十足的跨越。

目前，金寧匯已經公開了完整的推導過程和論文草稿。每一步都可以被數學家、甚至數學軟件逐行追查。

當然，這還不是終點。

真正的考驗是：同一個 AI，在另一個 80 年未解的數學難題上，還能不能復現同樣的能力？

盡管仍然有著巨大的挑戰，但在這條道路上，我們已經走出了關鍵一步。

附：完整論文草稿《An Optimal Two-Prime Construction for the Erd?s Unit Distance Problem》

后記 | 來自Spiral AI團隊的思考與開放邀請

在數學面前，我們和我們的AI，始終是學習者。

Spiral AI在此次嘗試中的每一步推導，都建立在Will Sawin老師優美而深刻的基礎框架之上，也受益于OpenAI所展現的AI+數學的驚人潛力，以及DeepSeek等開源社區的無私貢獻。我們由衷致謝。

我們也清醒認識到，數論之海深不可測，AI的推理仍可能存有疏漏。因此，我們已將完整的論文草稿與優化過程公開，誠摯邀請數學界、AI界的各位老師與同仁一同審閱、批評、指正。任何反饋，都是我們持續迭代的關鍵輸入。

倘若我們的探索——哪怕只是一小步，能為這條路徑帶來一點點啟發，或激發更多關于“AI如何協助數學研究”的新思路，那便是我們莫大的欣喜。我們相信，未來科學的發展，將是人類直覺與AI能力彼此激發、緊密協同的旅程。

人類的智慧，決定方向；AI的能力，拓展邊界。

期待與各位，繼續同行、共同推動。

未經「AI科技評論」授權，嚴禁以任何方式在網頁、論壇、社區進行轉載！

公眾號轉載請先在「AI科技評論」后臺留言取得授權，轉載時需標注來源并插入本公眾號名片。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

OpenAI、Anthropic急了？外媒曝創企轉向中國更便宜開源模型，特定場景成本能降95%

智東西 2026-06-12 23:21:20
21 跟貼 21
200+AI專家集結北京，共議世界模型、智能體、具身智能等話題，這屆智源大會釋放什么信號？

智東西 2026-06-13 21:18:29
0 跟貼 0

如何跨越“同質化”與商業深水區？智源王仲遠、銀河通用王鶴、面壁智能李大海激辯：真壁壘在“場景閉環”，Scaling Law遠未見頂

每日經濟新聞 2026-06-13 23:27:05
0 跟貼 0

對話智源研究院理事長黃鐵軍：構建完整的世界模型是一條漫長的道路

每日經濟新聞 2026-06-13 21:53:05
0 跟貼 0
網友給循環小數開根號，用一個假設就把題解出來了，網友：讀書時沒看懂現在卻懂了

星沙時報 2026-06-12 10:30:44
391 跟貼 391

00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0

數學老師參加高考數學，被網友質疑占名額，老師直接霸氣回懟

星沙時報 2026-06-12 15:40:45
49 跟貼 49
“AI領域最被濫用的術語”李飛飛終于把世界模型講明白了

量子位 2026-06-07 04:37:43
0 跟貼 0

AI時代，別再提“人人都是程序員”了

虎嗅APP 2026-06-14 02:46:07
0 跟貼 0
3秒學會數學速算技巧，變學霸！

中書省的世界觀 2026-06-11 03:52:06
6 跟貼 6
數學難題輕松破，一招教你搞定！

將死蝴蝶標本吻l 2026-06-13 13:51:30
1 跟貼 1
挑戰數學難題，大學生也會卡住！

酒馨香 2026-06-12 02:59:38
0 跟貼 0
今年高考的數學為什么那么難？

玉波易友 2026-06-11 08:51:33
6 跟貼 6
22，33，55，77（），答案不是99，那是什么

公考客棧店小二 2026-06-10 14:00:00
0 跟貼 0
小升初數學，家長們都說超綱了，中考數學還差不多

郎老師趣味數學課堂 2026-06-12 07:00:07
0 跟貼 0
小學生奧數題目，求a?b＝？

公考客棧店小二 2026-06-10 08:00:00
0 跟貼 0
494每日一練：函數與數列的綜合運算

我服子佩 2026-06-12 17:58:29
3 跟貼 3
求6+10＝？誰能做得出？

公考客棧店小二 2026-06-12 18:00:00
0 跟貼 0
填寫正確的數學符號，使等式兩邊都成立

公考客棧店小二 2026-06-13 18:00:00
1 跟貼 1
小學數學求陰影部分面積必須用相似嗎

天天數理學習分享 2026-06-09 19:20:04
4 跟貼 4
497數學聯賽：2015第二試B-2 一元二次方程的整數根中參數K的問題

我服子佩 2026-06-12 17:59:15
1 跟貼 1
找規律，求5+11＝？

公考客棧店小二 2026-06-11 18:00:00
0 跟貼 0
這是一個簡單的數學問題，可以通過加法和減法來解決！

公考客棧店小二 2026-06-13 14:00:00
1 跟貼 1
498數學聯賽：2015第一試A-10 六宮格排列組合求和最小值

我服子佩 2026-06-12 17:59:52
1 跟貼 1
怎么給寶寶做早期數學啟蒙？玩著學比硬教更管用

枕邊聊育兒 2026-06-10 08:54:03
1 跟貼 1
你不學拉馬努金，就不要羨慕別人做題比你快，數形結合

浴池橙子 2026-06-14 03:19:45
0 跟貼 0
看的真是很著急呀，小朋友拿著筆，不知如何下手

公考客棧店小二 2026-06-14 06:00:00
0 跟貼 0
如果讓韋東奕做2026年高考數學題，能不能考滿分？

壓抑小情緒 2026-06-10 05:46:57
430 跟貼 430
全對是學霸

楓樹林 2026-06-11 07:10:29
0 跟貼 0
當π被算盡，將會發生什么恐怖的事情

幽篁科普 2026-06-13 10:40:55
1 跟貼 1
明日四月二十九，記得：1不送，2不去，3要吃，安康順利過端午

神牛 2026-06-13 12:27:21
21 跟貼 21
夏不養陽，一年白忙，這3道應季“養陽菜”端午前后多吃，陽氣足

阿龍美食記 2026-06-12 15:03:14
1 跟貼 1
這題都沒做出來？真難以置信

公考客棧店小二 2026-06-11 18:00:00
12 跟貼 12
小男孩寫數學作業，小狗在一旁陪伴，給小狗黑眼圈都熬出來了

安全與法 2026-06-11 12:38:08
0 跟貼 0
無論炸什么魚，記住這幾個要點，金黃酥脆無腥味超好吃

開心美食白科 2026-06-13 15:51:28
0 跟貼 0
高考數學考完，給女生急成rap了，“數學你咋啦！數學我不知道您是怎么了？”

渝派生活幫 2026-06-09 13:52:52
0 跟貼 0
當數學期末考試最后一題竟然是

人間閑散客 2026-06-14 02:22:41
0 跟貼 0
路邊賣草莓草莓，遇到數學天才了，老板查了一天賬沒對上

妙妙屋觀察 2026-06-12 09:13:07
0 跟貼 0
媽媽眼中的我，笑不活了

人間閑散客 2026-06-14 00:46:54
0 跟貼 0
一群州檢察長正在查OpenAI，文件都發過來了

摸魚算法 2026-06-14 00:43:01
0 跟貼 0

AI科技評論

點評學術，服務AI

7372文章數 20757關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

健康

數碼

親子

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

金寧匯 Spiral AI 完成關鍵一棒：在 OpenAI顛覆性工作基礎上，將 Erd?s 問題下界優化129%

SpaceX上市首日破2萬億美元，馬斯克再封神

特朗普:美伊協議計劃周日簽署 如不順利還有終極手段

特朗普:美伊協議計劃周日簽署 如不順利還有終極手段

美國4比1巴拉圭：這統治力真是美國隊？！

鄧超曬孫儷親手織的帽子，笑瘋全網！

梁文鋒向左，楊植麟向右

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

AK劉彰邂逅河北南大港濕地

老人、小孩、孕婦，吃粽子有啥風險

綠聯推出DXP 6800/8800 Ultra NAS：雙萬兆雙雷電4，PCIe擴展

真正覺醒的家庭

特朗普:美伊協議計劃周日簽署如不順利還有終極手段

特朗普:美伊協議計劃周日簽署如不順利還有終極手段

深藍S07華為乾崑激光版增程車型上市限時15.49萬元起