![]()
Spiral AI不是簡單“調參數”,而是找到了這條路徑的理論極限。
01
48小時的全球數學難題證明接力
一場圍繞80年數學難題的“學術接力”正在上演。
第一棒,5月21日,OpenAI宣布其通用推理模型獨立推翻Erd?s猜想,證明原來那個“2n”的結論是錯的,并給出了一個實際更多的超線性下界。這一突破,在數學上叫做“超線性增長”。
通俗來說,原來是在平路上騎車,現在是在下坡溜車,速度越來越快。
第二棒,普林斯頓大學Will Sawin教授迅速將其精確化,他把 OpenAI 的發現精確化,給出了一個非常接近 1 的指數:基于單個素數2,將下界確定為 n^{1.014114}。
普通人不需要記住這個數字,只需要知道:人類把門推開了一條縫。
第三棒,屬于金寧匯科技Spiral AI團隊。在Sawin結果公布數小時內,金寧匯科技的AI團隊基于自主研發的AI for Science長程智能體平臺(Spiral AI),完成了完成了最關鍵的一棒。
Spiral AI不是簡單“調參數”,而是找到了這條路徑的理論極限。它不僅創新性地提出并驗證了“雙素數構造”方案,更關鍵地證明了在Sawin的框架內,使用兩素數是最優的,增加素數數量將導致指數下降。
02
AI究竟做了什么?
經過系統搜尋與優化,Spiral AI確定最優雙素數為(2, 3),并找到了最佳參數組合(k(2)=6, k(3)=5, R=7.5),從而將下界指數從 1.014114 顯著提升至 1.0323。
你可能會想,從1.0141到1.0323,不就是小數點后動了一點點嗎?但在數學里,這種指數上的微小變化,在n很大的時候,會導致最后結果翻倍——在這個例子中,相對效果提升高達129%。
這項工作不僅是一次關鍵參數的優化,更是通過AI驗證并鎖定了現有最優證明路徑的理論極限,為后續研究提供了清晰的方向與堅實的基礎。它標志著AI在深度參與并推動前沿數學研究進程中,扮演著越來越核心的角色。
從“一個素數”升級為升級為“兩個素數”
原來的方法只用一個素數(比如2),就像做菜只放鹽——穩定、不會錯,但風味單一,上限有限。
Spiral AI跳出固有思路,嘗試用兩個素數,比如2和3,好比在鹽的基礎上再加胡椒粉。兩種調料搭配,成本確實增加了,數學上叫“判別式”變大,但風味也大大豐富了,多了一個增益項。
關鍵在于:多花的錢,值不值?
Spiral AI通過系統計算證明:增益遠大于代價,非常值。
哪兩種素數搭配效果最好?
既然兩種調料比一種好,那問題就來了:這么多素數,哪兩種搭配效果最佳?Spiral AI把所有可能的素數組合全部測試了一遍,相當于把所有雙調料配方挨個試做、對比口味。最終結果非常明確:2和3就是味道最佳、適配度最高的黃金配方。
如果換成其他組合(比如3和5、2和5),要么味道發悶,要么風味不足,整體效果遠不如2和3。
![]()
搭配效果如何調出最優配比?
確定了“鹽+胡椒粉(2和3)”的黃金搭配后,下一步是精準把控調料比例——同樣的兩種調料,放多放少,味道天差地別。
AI像一位嚴謹的研發廚師,在合理范圍內反復調試,遍歷了所有可能的配比方案。最終鎖定了一套獨一無二的完美配比,將2和3的組合優勢發揮到了極致。
03
為什么不能加三種調料?
很多人會疑惑:調料越多是不是越好?但在這道“數學菜肴”里,答案恰恰相反。AI經過大量測試驗證:如果強行加入第三種、第四種調料,看似配料更豐富,實則會讓食材味道極度雜亂、調味成本爆炸式飆升。
對應到數學邏輯中,就是數據損耗會快速失控,新增調料帶來的微弱增益,完全抵不過混亂搭配造成的負面效果,最終讓整體結果大打折扣、趨近于無效。這也證明,兩種調料搭配,就是這道“數學菜肴”的最佳上限。
同時,AI通過嚴謹對比證明:其他所有素數組合,要么損耗更大,要么增益太小,最終效果都不如2和3。因此,2和3不僅是當前框架下的最優選擇,更是這條路徑上無法再被超越的理論極限。
靠著這套“最佳配方+精準配比”,下界指數相對提升了129%——看似只是微調,卻是該研究方向上一次分量十足的跨越。
目前,金寧匯已經公開了完整的推導過程和論文草稿。每一步都可以被數學家、甚至數學軟件逐行追查。
當然,這還不是終點。
真正的考驗是:同一個 AI,在另一個 80 年未解的數學難題上,還能不能復現同樣的能力?
盡管仍然有著巨大的挑戰,但在這條道路上,我們已經走出了關鍵一步。
附:完整論文草稿《An Optimal Two-Prime Construction for the Erd?s Unit Distance Problem》
04
后記 | 來自Spiral AI團隊的思考與開放邀請
在數學面前,我們和我們的AI,始終是學習者。
Spiral AI在此次嘗試中的每一步推導,都建立在Will Sawin老師優美而深刻的基礎框架之上,也受益于OpenAI所展現的AI+數學的驚人潛力,以及DeepSeek等開源社區的無私貢獻。我們由衷致謝。
我們也清醒認識到,數論之海深不可測,AI的推理仍可能存有疏漏。因此,我們已將完整的論文草稿與優化過程公開,誠摯邀請數學界、AI界的各位老師與同仁一同審閱、批評、指正。任何反饋,都是我們持續迭代的關鍵輸入。
倘若我們的探索——哪怕只是一小步,能為這條路徑帶來一點點啟發,或激發更多關于“AI如何協助數學研究”的新思路,那便是我們莫大的欣喜。我們相信,未來科學的發展,將是人類直覺與AI能力彼此激發、緊密協同的旅程。
人類的智慧,決定方向;AI的能力,拓展邊界。
期待與各位,繼續同行、共同推動。
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!
公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.