數(shù)學(xué)的上帝粒子！一個運算符能導(dǎo)出所有基本函數(shù)

2026-04-16 12:15:41　來源: 人工智能學(xué)家

北京舉報

分享至

來源：機器之心

僅用一個簡單二元運算符加上常數(shù) 1，就能推導(dǎo)出現(xiàn)代科學(xué)計算器上的所有基本函數(shù)了？

最近，計算機科學(xué)領(lǐng)域被一個新研究打破了認(rèn)知。

人們認(rèn)為，這種能將復(fù)雜數(shù)學(xué)系統(tǒng)極度簡化的底層突破極具革命性。該論文的作者 Andrzej Odrzywo?ek 來自波蘭雅蓋隆大學(xué)（Uniwersytet Jagielloński）。

論文標(biāo)題：All elementary functions from a single operator
論文鏈接：https://arxiv.org/pdf/2603.21852v2

在數(shù)字電路的世界里，有一個廣為人知的奇跡：NAND 門。只需要這一種雙輸入邏輯門，就能搭建出任何布爾電路。整個計算機的底層邏輯，全部可以由同一種基本單元堆疊而成。

1913 年 Henry Sheffer 發(fā)現(xiàn)的「Sheffer 豎線」，揭示了一個令人震撼的事實：看似紛繁復(fù)雜的數(shù)字邏輯世界，本質(zhì)上只有一個原子。

那數(shù)學(xué)呢？

論文作者 Andrzej Odrzywo?ek 嘗試將繁雜的數(shù)學(xué)運算符徹底拆解，并且成功找到了數(shù)學(xué)的「上帝粒子」。

這可能是解構(gòu)現(xiàn)有數(shù)學(xué)運算的開始。

嘗試「拆解計算器」

論文的方法是：從一張標(biāo)準(zhǔn)的科學(xué)計算器功能清單出發(fā) —— 包含 36 個原語（命名常量、一元函數(shù)和二元運算符），然后逐一進行「消融測試」：每次移除一個元素，檢驗剩余集合是否仍能重建所有原始功能。

這個過程并非一帆風(fēng)順。論文將縮減過程記錄為一個遞減序列：

Calc 3：6 個原語（取反、倒數(shù)、exp、ln、加法），首次超越了 Wolfram Language 的指令集
Calc 2：進一步縮減至 3 個原語（exp、ln、減法）
Calc 1：換了一條路，使用二元冪運算及其逆（二元對數(shù)）作為基礎(chǔ)，需要 e 或 π 作為終端常量
Calc 0：將常數(shù) e 吸收進 exp 函數(shù)本身，僅剩 3 個原語

每一步縮減都讓「單一運算符可能存在」的猜想變得更加可信。最終，在 Calc 0 的啟發(fā)下，研究者開始枚舉初等二元函數(shù)作為候選單運算符，配合同樣生成的常數(shù)逐一測試。

經(jīng)過大量失敗和若干誤報之后，他找到了答案：

這個被命名為EML（Exp-Minus-Log）的雙輸入運算符，配合常數(shù) 1，構(gòu)成了完整的初等函數(shù)基礎(chǔ)。

換句話說，一臺只有兩個按鈕 ——EML 和 1—— 的計算器，能完成今天任何科學(xué)計算器所能做的一切。

EML 并非唯一解。論文還報告了它的兩個「近親」：

EDL：，配常數(shù) e

EML：，配常數(shù) -∞

EML 生萬物

理解 EML 的威力，關(guān)鍵在于看它如何逐層構(gòu)建出那些我們熟悉的數(shù)學(xué)對象。

最直觀的例子從深度 1 開始：

把 y 固定為 1，ln (1)=0 ，于是。指數(shù)函數(shù)就這樣出來了。

自然對數(shù)稍復(fù)雜一些，需要嵌套三層：，展開后等價于。看起來繞了一大圈，但在 EML 的語法體系里，這只是三個節(jié)點的二叉樹。

更令人印象深刻的是，EML 能夠生成那些「不可能」的東西。虛數(shù)單位 i、圓周率 π、自然常數(shù) e，全部可以從 EML + 1 推導(dǎo)出來。以 i 為例：通過 ln (-1) 在復(fù)平面上取主值得到 iπ ，再結(jié)合其他已構(gòu)建的常量即可分離出 i 本身。三角函數(shù)則通過歐拉公式從復(fù)指數(shù)中自然涌現(xiàn)。

上圖展示了完整的「系統(tǒng)發(fā)育樹」（phylogenetic tree）：從 EML 這個「最后共同祖先」（LUCA）出發(fā)，螺旋展開，每一個箭頭代表一次 EML 組合操作，逐步衍生出全部 36 個原語。粗箭頭標(biāo)記的是直接由 EML 和 1 構(gòu)成的表達式，細(xì)箭頭則依賴中間產(chǎn)物。

在形式語言層面，EML 表達式的文法簡潔到令人難以置信：

這意味著每一個初等函數(shù)表達式，本質(zhì)上都是一棵由完全相同的節(jié)點構(gòu)成的滿二叉樹。

不同函數(shù)所需的樹深度差異很大：指數(shù)函數(shù)只需深度 1，而乘法則需要深度 8。大多數(shù)常用數(shù)學(xué)函數(shù)落在深度 5–9 的區(qū)間。這種深度的參差反映了不同函數(shù)在 EML 表示下的「編碼距離」。

從數(shù)學(xué)到機器學(xué)習(xí)

EML 可能在機器學(xué)習(xí)領(lǐng)域有著影響力巨大的潛在應(yīng)用。

現(xiàn)代符號回歸（Symbolic Regression）方法試圖從數(shù)據(jù)中發(fā)現(xiàn)閉式表達式（closed-form formula），但其搜索空間通常涉及多種異構(gòu)算子，包含加減乘除、三角函數(shù)、指數(shù)對數(shù)等等。算子集選少了可能不完備，選多了又會讓搜索空間爆炸。

EML 提供了一種全新的思路：既然所有初等函數(shù)都可以用同一種節(jié)點表示，那么搜索空間就變成了統(tǒng)一的二叉樹結(jié)構(gòu)。

論文作者將這一想法付諸實踐。他構(gòu)造了參數(shù)化的「主公式」（master formula）：將 EML 樹的每個輸入端替換為線性組合，其中作為可訓(xùn)練參數(shù)。通過 softmax 將三組系數(shù)歸一化，使得每個節(jié)點可以在「輸出常數(shù) 1」「傳遞輸入變量 x」和「傳遞子樹結(jié)果 f」之間切換。

實驗結(jié)果：

深度 2：100% 成功率，隨機初始化即可精確恢復(fù)目標(biāo)函數(shù)
深度 3–4：約 25% 成功率
深度 5：低于 1%（448 次嘗試中未見成功）
深度 6：未觀察到成功恢復(fù)

但當(dāng)權(quán)重從正確值附近加入高斯噪聲時，優(yōu)化器在 100% 的運行中都能收斂回精確值，即使對于深度 5–6 的樹也是如此。這說明 EML 樹的正確參數(shù)盆地（basin of attraction）確實存在，但問題在于隨機初始化很難進入這一范圍。

一旦訓(xùn)練成功，權(quán)重的「硬化」（hardening）過程會將浮點參數(shù) snap 到精確的二進制值（0 或 1），此時均方誤差降至機器精度量級（~10?32），意味著模型精確恢復(fù)了閉式表達式。

這帶來了一種可能性：可解釋的符號發(fā)現(xiàn)。

傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的內(nèi)部機制是不透明的黑箱，而 EML 樹在訓(xùn)練成功后可以直接被「讀」出來，每一棵訓(xùn)練好的樹都對應(yīng)一個人類可讀的數(shù)學(xué)公式。

論文作者在文章結(jié)尾坦言，EML 可能只是冰山一角。初等函數(shù)這個看似龐雜的家族，其內(nèi)部的統(tǒng)一性遠(yuǎn)超我們的想象。

這一只有兩個按鈕的計算器，也許比我們以為的要強大得多。

閱讀最新前沿科技趨勢報告，請訪問21世紀(jì)關(guān)鍵技術(shù)研究院的“未來知識庫”

未來知識庫是 “21世紀(jì)關(guān)鍵技術(shù)研究院”建立的在線知識庫平臺，收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級智能，數(shù)智大腦、能源、軍事、經(jīng)濟、人類風(fēng)險等等領(lǐng)域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告

（加入未來知識庫，全部資料免費閱讀和下載）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.