![]()
來源:機器之心
僅用一個簡單二元運算符加上常數(shù) 1,就能推導(dǎo)出現(xiàn)代科學(xué)計算器上的所有基本函數(shù)了?
最近,計算機科學(xué)領(lǐng)域被一個新研究打破了認(rèn)知。
人們認(rèn)為,這種能將復(fù)雜數(shù)學(xué)系統(tǒng)極度簡化的底層突破極具革命性。該論文的作者 Andrzej Odrzywo?ek 來自波蘭雅蓋隆大學(xué)(Uniwersytet Jagielloński)。
![]()
論文標(biāo)題:All elementary functions from a single operator
論文鏈接:https://arxiv.org/pdf/2603.21852v2
在數(shù)字電路的世界里,有一個廣為人知的奇跡:NAND 門。只需要這一種雙輸入邏輯門,就能搭建出任何布爾電路。整個計算機的底層邏輯,全部可以由同一種基本單元堆疊而成。
1913 年 Henry Sheffer 發(fā)現(xiàn)的「Sheffer 豎線」,揭示了一個令人震撼的事實:看似紛繁復(fù)雜的數(shù)字邏輯世界,本質(zhì)上只有一個原子。
那數(shù)學(xué)呢?
論文作者 Andrzej Odrzywo?ek 嘗試將繁雜的數(shù)學(xué)運算符徹底拆解,并且成功找到了數(shù)學(xué)的「上帝粒子」。
![]()
![]()
![]()
這可能是解構(gòu)現(xiàn)有數(shù)學(xué)運算的開始。
嘗試「拆解計算器」
論文的方法是:從一張標(biāo)準(zhǔn)的科學(xué)計算器功能清單出發(fā) —— 包含 36 個原語(命名常量、一元函數(shù)和二元運算符),然后逐一進行「消融測試」:每次移除一個元素,檢驗剩余集合是否仍能重建所有原始功能。
這個過程并非一帆風(fēng)順。論文將縮減過程記錄為一個遞減序列:
Calc 3:6 個原語(取反、倒數(shù)、exp、ln、加法),首次超越了 Wolfram Language 的指令集
Calc 2:進一步縮減至 3 個原語(exp、ln、減法)
Calc 1:換了一條路,使用二元冪運算及其逆(二元對數(shù))作為基礎(chǔ),需要 e 或 π 作為終端常量
Calc 0:將常數(shù) e 吸收進 exp 函數(shù)本身,僅剩 3 個原語
每一步縮減都讓「單一運算符可能存在」的猜想變得更加可信。最終,在 Calc 0 的啟發(fā)下,研究者開始枚舉初等二元函數(shù)作為候選單運算符,配合同樣生成的常數(shù)逐一測試。
經(jīng)過大量失敗和若干誤報之后,他找到了答案:
![]()
這個被命名為EML(Exp-Minus-Log)的雙輸入運算符,配合常數(shù) 1,構(gòu)成了完整的初等函數(shù)基礎(chǔ)。
換句話說,一臺只有兩個按鈕 ——EML 和 1—— 的計算器,能完成今天任何科學(xué)計算器所能做的一切。
EML 并非唯一解。論文還報告了它的兩個「近親」:
EDL:
,配常數(shù) e
EML:
,配常數(shù) -∞
EML 生萬物
理解 EML 的威力,關(guān)鍵在于看它如何逐層構(gòu)建出那些我們熟悉的數(shù)學(xué)對象。
最直觀的例子從深度 1 開始:
把 y 固定為 1,ln (1)=0 ,于是 。指數(shù)函數(shù)就這樣出來了。
自然對數(shù)稍復(fù)雜一些,需要嵌套三層:,展開后等價于 。看起來繞了一大圈,但在 EML 的語法體系里,這只是三個節(jié)點的二叉樹。
更令人印象深刻的是,EML 能夠生成那些「不可能」的東西。虛數(shù)單位 i、圓周率 π、自然常數(shù) e,全部可以從 EML + 1 推導(dǎo)出來。以 i 為例:通過 ln (-1) 在復(fù)平面上取主值得到 iπ ,再結(jié)合其他已構(gòu)建的常量即可分離出 i 本身。三角函數(shù)則通過歐拉公式 從復(fù)指數(shù)中自然涌現(xiàn)。
![]()
上圖展示了完整的「系統(tǒng)發(fā)育樹」(phylogenetic tree):從 EML 這個「最后共同祖先」(LUCA)出發(fā),螺旋展開,每一個箭頭代表一次 EML 組合操作,逐步衍生出全部 36 個原語。粗箭頭標(biāo)記的是直接由 EML 和 1 構(gòu)成的表達式,細(xì)箭頭則依賴中間產(chǎn)物。
在形式語言層面,EML 表達式的文法簡潔到令人難以置信:
![]()
這意味著每一個初等函數(shù)表達式,本質(zhì)上都是一棵由完全相同的節(jié)點構(gòu)成的滿二叉樹。
![]()
不同函數(shù)所需的樹深度差異很大:指數(shù)函數(shù)只需深度 1,而乘法則需要深度 8。大多數(shù)常用數(shù)學(xué)函數(shù)落在深度 5–9 的區(qū)間。這種深度的參差反映了不同函數(shù)在 EML 表示下的「編碼距離」。
從數(shù)學(xué)到機器學(xué)習(xí)
EML 可能在機器學(xué)習(xí)領(lǐng)域有著影響力巨大的潛在應(yīng)用。
現(xiàn)代符號回歸(Symbolic Regression)方法試圖從數(shù)據(jù)中發(fā)現(xiàn)閉式表達式(closed-form formula),但其搜索空間通常涉及多種異構(gòu)算子,包含加減乘除、三角函數(shù)、指數(shù)對數(shù)等等。算子集選少了可能不完備,選多了又會讓搜索空間爆炸。
EML 提供了一種全新的思路:既然所有初等函數(shù)都可以用同一種節(jié)點表示,那么搜索空間就變成了統(tǒng)一的二叉樹結(jié)構(gòu)。
論文作者將這一想法付諸實踐。他構(gòu)造了參數(shù)化的「主公式」(master formula):將 EML 樹的每個輸入端替換為線性組合 ,其中 作為可訓(xùn)練參數(shù)。通過 softmax 將三組系數(shù)歸一化,使得每個節(jié)點可以在「輸出常數(shù) 1」「傳遞輸入變量 x」和「傳遞子樹結(jié)果 f」之間切換。
實驗結(jié)果:
深度 2:100% 成功率,隨機初始化即可精確恢復(fù)目標(biāo)函數(shù)
深度 3–4:約 25% 成功率
深度 5:低于 1%(448 次嘗試中未見成功)
深度 6:未觀察到成功恢復(fù)
但當(dāng)權(quán)重從正確值附近加入高斯噪聲時,優(yōu)化器在 100% 的運行中都能收斂回精確值,即使對于深度 5–6 的樹也是如此。這說明 EML 樹的正確參數(shù)盆地(basin of attraction)確實存在,但問題在于隨機初始化很難進入這一范圍。
一旦訓(xùn)練成功,權(quán)重的「硬化」(hardening)過程會將浮點參數(shù) snap 到精確的二進制值(0 或 1),此時均方誤差降至機器精度量級(~10?32),意味著模型精確恢復(fù)了閉式表達式。
這帶來了一種可能性:可解釋的符號發(fā)現(xiàn)。
傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的內(nèi)部機制是不透明的黑箱,而 EML 樹在訓(xùn)練成功后可以直接被「讀」出來,每一棵訓(xùn)練好的樹都對應(yīng)一個人類可讀的數(shù)學(xué)公式。
論文作者在文章結(jié)尾坦言,EML 可能只是冰山一角。初等函數(shù)這個看似龐雜的家族,其內(nèi)部的統(tǒng)一性遠(yuǎn)超我們的想象。
這一只有兩個按鈕的計算器,也許比我們以為的要強大得多。
閱讀最新前沿科技趨勢報告,請訪問21世紀(jì)關(guān)鍵技術(shù)研究院的“未來知識庫”
![]()
未來知識庫是 “21世紀(jì)關(guān)鍵技術(shù)研究院”建 立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級智能,數(shù)智大腦、能源、軍事、經(jīng)濟、人類風(fēng)險等等領(lǐng)域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
截止到2月28日 ”未來知識庫”精選的百部前沿科技趨勢報告
(加入未來知識庫,全部資料免費閱讀和下載)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.