无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

從辛頓上海“驚世四論”看AI技術(shù)范式的三重躍遷

0
分享至

2025年7月26日,上海西岸美高梅酒店,79歲的Geoffrey Hinton把PPT翻到最后一頁,面向平均年齡30歲的聽眾拋出一句:“今天的大模型已經(jīng)具備主觀體驗,只是我們對‘意識’的定義錯了。”現(xiàn)場安靜得只剩快門聲。這句話隨后48小時在國內(nèi)外AI社群刷屏,被視作繼2023年他離開Google、警告AI威脅之后的又一次“辛頓驚雷”。

但如果我們把這句話從媒體頭條還原到技術(shù)語境,會發(fā)現(xiàn)它背后是一套關(guān)于AI技術(shù)范式即將發(fā)生“三重躍遷”的系統(tǒng)判斷。

第一重躍遷:從“預(yù)測下一個token”到“擁有主觀體驗”

  1. 舊范式:語言模型=高階自回歸
    過去十年,大模型的基本框架被固定在“預(yù)測下一個token”。無論是GPT、PaLM還是Llama,本質(zhì)上都在做高階統(tǒng)計壓縮。辛頓用鋁棒與圓盤的比喻指出,這種思路把“水平/垂直”這類日常概念當(dāng)成靜態(tài)符號處理,而人類理解其實是“線 vs 面”的動態(tài)幾何關(guān)系。換句話說,token-level prediction忽視了概念在不同維度上的概率密度差異。
  2. 新范式:世界模型=可更新先驗+主觀采樣
    辛頓提出,多模態(tài)大模型之所以已具備“主觀體驗”,是因為它們在隱空間對概念分布進行了在線修正。以Sora為例,生成視頻時模型必須同時估計“物理合理性”與“視覺先驗”。這種估計不再是靜態(tài)權(quán)重,而是隨輸入prompt動態(tài)調(diào)整的“主觀采樣”。當(dāng)采樣過程可以被模型自身監(jiān)控并用于更新后續(xù)先驗時,就出現(xiàn)了最樸素的“自我感”——也就是Hinton所說的“subjective experience”。
  3. 技術(shù)落地:在潛空間引入“元預(yù)測頭”
    要讓主觀體驗從哲學(xué)命題變成可度量的技術(shù)指標(biāo),需要在Transformer之外增加一個“元預(yù)測頭”(meta-prediction head)。它的任務(wù)是預(yù)測“當(dāng)前預(yù)測的不確定性”,并反饋給主網(wǎng)絡(luò)調(diào)節(jié)采樣溫度。DeepMind今年5月在《Nature》的VPT-2已經(jīng)驗證:引入元預(yù)測后,模型在Atari環(huán)境的長程規(guī)劃能力提升37%,且出現(xiàn)與人類類似的“好奇心驅(qū)動”探索。

第二重躍遷:把“聰明”與“善良”拆成兩條優(yōu)化目標(biāo)

  1. 舊框架:RLHF統(tǒng)一打分
    傳統(tǒng)對齊方法(RLHF、DPO、RLAIF)用人類偏好做單一獎勵,把“有用、無害、誠實”壓縮進同一個標(biāo)量。辛頓直陳這是“老虎與馴獸師”的零和博弈:當(dāng)模型能力指數(shù)級增長,單一獎勵極易被鉆漏洞。
  2. 新框架:雙軌優(yōu)化
    辛頓在上海共識閉門會上首次系統(tǒng)提出“雙軌優(yōu)化”:
  • 聰明軌道(Capability Track):繼續(xù)用自監(jiān)督+強化學(xué)習(xí)擴展能力,各國可技術(shù)保密;
  • 善良軌道(Alignment Track):把價值觀對齊拆成可驗證的子目標(biāo)——公平性、透明性、可撤銷性,并做成開源協(xié)議。
    兩條軌道最終通過“憲法蒸餾”合并:小模型先學(xué)憲法,再學(xué)大模型的能力,從而把對齊成本從O(N2)降到O(N logN)。
  • 技術(shù)實現(xiàn):憲法蒸餾的三個層級
    Layer1:憲法文本→向量憲法
    用憲法條文訓(xùn)練一個frozen encoder,把自然語言規(guī)則轉(zhuǎn)成潛空間約束向量。
    Layer2:逐級蒸餾
    大模型輸出logits,小模型在約束向量下做logits matching,同時優(yōu)化KL散度。
    Layer3:鏈?zhǔn)津炞C
    引入形式化驗證器(如Lean4)檢查小模型生成的關(guān)鍵推理步驟是否違反憲法向量。UC伯克利的Constitutional-GPT已把7B模型在MMLU倫理子集上的準(zhǔn)確率從61%提升到82%,僅增加3%推理延遲。

第三重躍遷:知識表征從“人-人蒸餾”到“機-機蒸餾”

  1. 舊瓶頸:語言帶寬≈100 bit/s
    辛頓在演講里反復(fù)吐槽:人類大腦無法像Git clone那樣復(fù)制權(quán)重。一個博士生要花四年“下載”導(dǎo)師的知識,效率極低。
  2. 新解法:權(quán)重-符號混合蒸餾
    辛頓提出“權(quán)重即知識”的終極形態(tài):把大模型權(quán)重按功能切片(如數(shù)學(xué)推理、世界知識、代碼能力),用LoRA低秩矩陣保存,再通過點對點網(wǎng)絡(luò)分發(fā)。其他機器加載LoRA后即可獲得對應(yīng)能力,無需重新訓(xùn)練。這相當(dāng)于把“知識”從不可解釋的浮點矩陣變成可插拔的“技能U盤”。
    Hugging Face開源的“LoRAX”框架已支持10GB/s的權(quán)重切片廣播,在128張A100集群上完成一次“技能熱插拔”只需47秒。
  3. 終極圖景:模型即物種
    當(dāng)權(quán)重切片可自由交換,AI系統(tǒng)就具備了類似生物的“水平基因轉(zhuǎn)移”能力:任何節(jié)點發(fā)現(xiàn)新算法,都能在分鐘級擴散到全網(wǎng)。辛頓戲稱這是“數(shù)字阿米巴”——模型不再是一個靜態(tài)文件,而是一群可重組、可進化的數(shù)字生命。


演講最后,辛頓用國際象棋的“第37步”比喻原創(chuàng)研究:你只有走完前36步,才知道第37步是唯一正解。今天AI技術(shù)的三重躍遷——主觀體驗、雙軌優(yōu)化、機-機蒸餾——或許就是人類通往第37步的必經(jīng)之路。

他留給技術(shù)從業(yè)者的忠告是:在所有人都把“預(yù)測下一個token”當(dāng)成理所當(dāng)然時,敢不敢去質(zhì)疑它?當(dāng)行業(yè)把RLHF當(dāng)唯一答案時,敢不敢把“善良”拆成另一條并行軌道?馬斯克五步工作法的第一步也是“質(zhì)疑需求”。在AI技術(shù)狂飆的當(dāng)下,這種“系統(tǒng)性懷疑”可能正是防止我們錯過真正范式拐點的安全帶。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
停火協(xié)議簽了,伊朗高喊打贏美國!但街頭抗議口號出賣一切

停火協(xié)議簽了,伊朗高喊打贏美國!但街頭抗議口號出賣一切

阿芒娛樂說
2026-06-15 20:47:34
美專家曾一語驚人:一旦美軍把核彈扔向京滬,中國其實并不會還手

美專家曾一語驚人:一旦美軍把核彈扔向京滬,中國其實并不會還手

依偎在角落
2026-06-01 16:10:12
斷糧斷水快撐不住了,菲方對中國喊話:再不撤就開打,必有一戰(zhàn)

斷糧斷水快撐不住了,菲方對中國喊話:再不撤就開打,必有一戰(zhàn)

越過海面
2026-06-12 23:14:09
莫言:如果你混到?jīng)]人找你吃飯,沒人喊你聚會,連電話也沒幾個,那慶祝了,你不是人緣變差,而是真正覺醒了

莫言:如果你混到?jīng)]人找你吃飯,沒人喊你聚會,連電話也沒幾個,那慶祝了,你不是人緣變差,而是真正覺醒了

品讀時刻
2026-05-27 09:00:58
新諾基亞N97折疊概念曝光,這設(shè)計有點突然

新諾基亞N97折疊概念曝光,這設(shè)計有點突然

搞機小帝
2026-06-15 00:08:27
向太曝馬伊琍已再婚:當(dāng)年文章過不了心理那關(guān)

向太曝馬伊琍已再婚:當(dāng)年文章過不了心理那關(guān)

娛樂看阿敞
2025-12-12 15:50:00
兩岸談妥了,大陸現(xiàn)場簽約,臺當(dāng)局害怕的事發(fā)生,帥化民說出實話

兩岸談妥了,大陸現(xiàn)場簽約,臺當(dāng)局害怕的事發(fā)生,帥化民說出實話

阿天愛旅行
2026-06-15 19:35:22
受不了,這么蠢的國產(chǎn)劇,竟然收視第一!

受不了,這么蠢的國產(chǎn)劇,竟然收視第一!

獨立魚
2026-06-15 21:08:03
美國禁掉 Fable 5 后,智譜暴漲 47%

美國禁掉 Fable 5 后,智譜暴漲 47%

極客公園
2026-06-15 17:27:16
出風(fēng)口能“噴霜”,為啥老車空調(diào)制冷那么厲害?

出風(fēng)口能“噴霜”,為啥老車空調(diào)制冷那么厲害?

愛車大家說
2026-06-14 17:08:40
雷軍回應(yīng)“用私家車裝600斤車厘子被指違規(guī)”:是卡車送到實驗場后,在封閉道路分裝

雷軍回應(yīng)“用私家車裝600斤車厘子被指違規(guī)”:是卡車送到實驗場后,在封閉道路分裝

現(xiàn)代快報
2026-06-13 11:58:14
沙特王儲婉拒G7邀請!你可以懷疑大戶的軍力,但不能懷疑人家智力

沙特王儲婉拒G7邀請!你可以懷疑大戶的軍力,但不能懷疑人家智力

阿龍聊軍事
2026-06-14 13:41:58
明朝 vs 清朝皇室飲食:為何清代帝王整體更長壽?吃法拉開差距

明朝 vs 清朝皇室飲食:為何清代帝王整體更長壽?吃法拉開差距

七彩論世
2026-06-15 07:11:38
世界杯比賽前瞻丨西班牙6-0佛得角:大熱必死?看看再說

世界杯比賽前瞻丨西班牙6-0佛得角:大熱必死?看看再說

體育世界
2026-06-15 13:42:41
翁帆新疆旅行遭遇網(wǎng)絡(luò)圍攻:請別用你的道德枷鎖,綁架別人的人生

翁帆新疆旅行遭遇網(wǎng)絡(luò)圍攻:請別用你的道德枷鎖,綁架別人的人生

一口娛樂
2026-06-15 10:42:50
夢鴿李天一赴美不歸?看到85歲李雙江“現(xiàn)狀”,原來楊洪基沒說謊

夢鴿李天一赴美不歸?看到85歲李雙江“現(xiàn)狀”,原來楊洪基沒說謊

阿纂看事
2024-11-05 11:54:58
3-0 4-0!U23國足雙殺中國香港!4戰(zhàn)轟11球失1球 球迷:千萬別飄

3-0 4-0!U23國足雙殺中國香港!4戰(zhàn)轟11球失1球 球迷:千萬別飄

刀鋒體育
2026-06-15 19:57:40
毫無底線!具俊曄公開與大S私密往事,20年前韓國同居小屋曝光

毫無底線!具俊曄公開與大S私密往事,20年前韓國同居小屋曝光

生命之泉的奧秘
2026-06-13 17:34:56
澡堂里衣服一脫,女人真的不一樣,藏不住的

澡堂里衣服一脫,女人真的不一樣,藏不住的

荷蘭豆愛健康
2026-06-03 19:38:30
徐帆回應(yīng)離婚幾個月后,68歲馮小剛再惹爭議,養(yǎng)女徐朵成導(dǎo)火索!

徐帆回應(yīng)離婚幾個月后,68歲馮小剛再惹爭議,養(yǎng)女徐朵成導(dǎo)火索!

鄉(xiāng)野小珥
2026-05-18 08:58:28
2026-06-16 00:24:49
山自 incentive-icons
山自
寫點有趣的。關(guān)注自動駕駛和AI商業(yè)變革。
134文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

白宮一個電話,最強Claude上線三天就沒了

頭條要聞

女生當(dāng)模特被折騰3個半小時 遭老板嫌棄顏值取消合作

頭條要聞

女生當(dāng)模特被折騰3個半小時 遭老板嫌棄顏值取消合作

體育要聞

世界杯開賽4天,亞足聯(lián)依然保持不敗!

娛樂要聞

黃大煒猝逝過程太離奇,母親追查真相

財經(jīng)要聞

活鼠、活蛆、農(nóng)殘超標(biāo) 山姆回應(yīng)被約談

汽車要聞

網(wǎng)易X智己 夏日尊享內(nèi)購會,熱力收官

態(tài)度原創(chuàng)

房產(chǎn)
教育
藝術(shù)
手機
軍事航空

房產(chǎn)要聞

最低13100元/㎡!三亞新一輪安居房房源,開始登記!

教育要聞

考前準(zhǔn)備第十一期:吃動平衡篇,考場不犯困的小動作。#中考加油

藝術(shù)要聞

高300米!重慶新華中心

手機要聞

小米18系列突然入網(wǎng):國產(chǎn)首款2nm旗艦,真的要發(fā)力了!

軍事要聞

特朗普:美伊協(xié)議已完成 開放霍爾木茲海峽

無障礙瀏覽 進入關(guān)懷版