![]()
剛聽完小珺這期對(duì)姚順宇的訪談,信息密度直接拉滿。
這位從清華物理轉(zhuǎn)斯坦福高能物理、再從 Anthropic 跳到 Google DeepMind 的研究員,參與過 Claude 3.7 / 4.5 和 Gemini 3 系列開發(fā)。
他有一句話非常反常識(shí):
AI 這個(gè)行業(yè)真的不太需要腦子,最重要的特質(zhì)是靠譜。
這句話聽起來像凡爾賽,但他后面展開之后,你會(huì)發(fā)現(xiàn)背后其實(shí)是一套非常樸素的判斷:AI 行業(yè)已經(jīng)從個(gè)人英雄主義,進(jìn)入了系統(tǒng)工程時(shí)代。真正稀缺的不是聰明,而是把簡單事情做細(xì)、做穩(wěn)、做可靠的能力。
這期把最硬的反常識(shí)觀點(diǎn)、行業(yè)內(nèi)幕、模型真實(shí)差距,以及普通人能抄的實(shí)操,全拆一遍。
兩個(gè)姚順宇,以及一個(gè)物理半道出家的 AI 研究員
先說背景。
姚順宇本科是清華物理,后來去了斯坦福做理論高能物理和量子信息,短暫做過伯克利 postdoc,之后直接進(jìn)入 Anthropic,今年 9 月底跳到 Gemini。
有意思的是,AI 圈里還有另一個(gè)姚順宇,也就是 OpenAI 系的姚順宇。兩人本科就認(rèn)識(shí),是好朋友,但路線完全不同。
他自嘲說:自己是半道出家,物理出身;另一個(gè)姚順宇是純 CS 科班。
但物理背景給他的最大幫助,不是某個(gè)具體工具,而是兩件事:系統(tǒng)性思考,以及刨根問底。
這在 AI 里反而成了稀缺品。
因?yàn)楝F(xiàn)在很多問題表面上是模型問題、訓(xùn)練問題、工程問題,但底層往往是:你有沒有能力把一個(gè)復(fù)雜系統(tǒng)拆開,一層一層排查,到底哪里出了問題。
AI 本質(zhì)上很簡單,不需要那么多“天才腦子”
姚順宇反復(fù)強(qiáng)調(diào)一個(gè)觀點(diǎn):
AI 現(xiàn)在是簡單的。
這句話非常反常識(shí)。因?yàn)橥饨缈?AI,總覺得這是最聰明的人才能玩的領(lǐng)域,數(shù)學(xué)、代碼、推理、強(qiáng)化學(xué)習(xí)、系統(tǒng)工程,每個(gè)詞都嚇人。
但他說,恰恰相反。
以前大家覺得最難的東西,比如寫代碼、數(shù)學(xué)、推理,反而是 AI 最容易干好的。原因很簡單:這些任務(wù)有清晰的 reward signal,也就是反饋信號(hào)。
代碼能不能跑,測(cè)試能不能過,數(shù)學(xué)答案對(duì)不對(duì),推理有沒有撞上驗(yàn)證集,這些都相對(duì)容易判斷。
反而是人最擅長的東西,比如產(chǎn)品判斷、復(fù)雜場(chǎng)景里的直覺、用戶到底想要什么,這些更難訓(xùn)練。因?yàn)闆]有一個(gè)標(biāo)準(zhǔn)答案,也沒有一個(gè)干凈的反饋信號(hào)。
所以他真正想說的不是“AI 沒有技術(shù)含量”,而是:AI 的核心難點(diǎn),已經(jīng)越來越不像傳統(tǒng)意義上的聰明題,而更像系統(tǒng)工程題。
個(gè)人英雄主義時(shí)代已經(jīng)過去了。
他用了一個(gè)很形象的說法:
沖浪的人不重要,重要的是浪本身。
AI 這波浪在往前走,你沖不沖,它都會(huì)拍到岸上。真正重要的是,你能不能站在這波浪上,把自己組織成一個(gè)可靠的系統(tǒng)。
靠譜大于天才:硅谷最缺的不是聰明人
這期最值得記住的一句話是:
硅谷最缺的不是聰明人,是靠譜的人。
姚順宇說,AI 行業(yè)最重要的特質(zhì)就是:做事細(xì),對(duì)自己做的事負(fù)責(zé)任。
這點(diǎn)特別樸素,但也特別殘酷。
因?yàn)楝F(xiàn)在很多人會(huì)把 AI 當(dāng)成一種外包能力:任務(wù)丟給模型,模型生成一堆東西,然后自己不看、不懂、不驗(yàn)證,最后出了問題再怪模型。
但他真正看重的是另一種人:你可以用 AI,但你必須真正理解 AI 做了什么。你要知道它哪里可能錯(cuò),哪里需要驗(yàn)證,哪些結(jié)論可以信,哪些地方必須自己把關(guān)。
他面試時(shí)會(huì)給候選人一個(gè) 24 小時(shí)的強(qiáng)化學(xué)習(xí)小項(xiàng)目。
這個(gè)項(xiàng)目不只是考你會(huì)不會(huì)寫代碼,而是看你怎么用 AI。你是把任務(wù)全扔給 AI,然后自己完全不理解;還是能利用 AI 提速,同時(shí)真正理解每一步,最后討論時(shí)能把問題、方案、取舍講清楚。
很多花里胡哨的技巧,最后都比不過一件事:
把簡單事做干凈。
這可能也是 AI 時(shí)代對(duì)工程師最殘酷的篩選。AI 會(huì)放大你的能力,也會(huì)放大你的不靠譜。
模型紙面打平,但真實(shí)體驗(yàn)仍然不同
聊到模型差距,姚順宇的判斷很實(shí)在。
到 2026 年,Claude、OpenAI、Gemini 這三家的紙面 benchmark 很多都已經(jīng)打到 80%+ 附近。很多差距其實(shí)主要是 noise,也就是噪聲。
但這不代表模型體驗(yàn)完全一樣。
他認(rèn)為真實(shí)使用里仍然有明顯差別。
Claude 仍然是 agent、tool use 和 coding 最強(qiáng)。
Codex 最近在純 coding 上追得很快。
Gemini 在純 reasoning 和日常使用上最好。
這些差異不只是能力本身,也和不同公司早期的意愿、產(chǎn)品方向、基礎(chǔ)設(shè)施和數(shù)據(jù)積累有關(guān)。比如 Claude 很早就更專注 coding 和 agent 場(chǎng)景,所以在這些方向上形成了更強(qiáng)的產(chǎn)品體感。
但現(xiàn)在真正難的,已經(jīng)不是盯著 benchmark 多漲一點(diǎn)。
更難的是:
定義問題。
模型越來越強(qiáng)之后,問題不再是“它會(huì)不會(huì)做”,而是“你到底要它做什么”“怎么驗(yàn)證它做對(duì)了”“怎么把它放進(jìn)一個(gè)可靠系統(tǒng)里”。
OpenClaw / Manus 不是技術(shù)革命,而是可能性展示
聊到 OpenClaw 和 Manus 這類項(xiàng)目,姚順宇的判斷也很冷靜。
他說,業(yè)內(nèi)其實(shí)沒那么驚訝。很多大模型 lab 內(nèi)部早就做過類似 demo。
它們真正火的原因,不是展示了一個(gè)完全沒人見過的技術(shù)奇跡,而是讓更多人第一次意識(shí)到:
模型已經(jīng)可以做 long-horizon 工作了。
也就是把很多模型、工具、上下文、任務(wù)步驟拼起來,連續(xù)完成一個(gè)長任務(wù)。
這件事的意義很大,但它不等于殼公司已經(jīng)徹底脫離模型公司。
Manus 和 OpenClaw 最后都賣給了大模型公司,這說明現(xiàn)階段很多外層應(yīng)用和 agent 殼,還逃不掉底層模型能力的掌心。
姚順宇判斷,這類公司想活下去大概有兩條路。
第一,逃得足夠快。Cursor 現(xiàn)在賭的就是這條路。
第二,市場(chǎng)足夠小,大公司懶得管。
這聽起來有點(diǎn)殘酷,但也很真實(shí)。AI 時(shí)代的應(yīng)用層,如果沒有足夠強(qiáng)的速度、數(shù)據(jù)、工作流綁定或垂直場(chǎng)景優(yōu)勢(shì),很容易被模型公司向上吞掉。
預(yù)訓(xùn)練 Scaling Law 遠(yuǎn)沒到頭,很多“撞墻”其實(shí)是 bug
關(guān)于 Scaling Law 是否到頭,姚順宇的觀點(diǎn)很明確:
至少從他的親身感受看,預(yù)訓(xùn)練能力還在持續(xù)變強(qiáng)。
過去幾個(gè)月,預(yù)訓(xùn)練的能力仍然在往前走。未來 4 個(gè)月,他也沒看到明確到頭的跡象。
他特別提醒,很多人喊“到頭了”,其實(shí)可能有三種情況。
第一,規(guī)律適用范圍真的到頭了。
第二,數(shù)據(jù)或算力條件不滿足。
第三,也是最常見的:自己有 bug 沒發(fā)現(xiàn)。
這點(diǎn)很有意思,也很“物理”。
當(dāng)實(shí)驗(yàn)結(jié)果和預(yù)期不一致時(shí),第一反應(yīng)不應(yīng)該是宣布世界規(guī)律失效,而是系統(tǒng)性排查每一種可能性。數(shù)據(jù)有沒有問題?訓(xùn)練管線有沒有問題?評(píng)估有沒有問題?算力有沒有問題?實(shí)現(xiàn)有沒有 bug?
很多所謂的天花板,可能只是工程 bug 被誤認(rèn)為自然規(guī)律。
這也是他一直強(qiáng)調(diào)“靠譜”和“系統(tǒng)性思考”的原因。
Coding 為什么爆得最快?因?yàn)樗焐m合 AI
這一段特別適合所有程序員看。
姚順宇認(rèn)為,coding 是 AI 能力爆發(fā)最快的方向之一,背后有兩個(gè)核心原因。
第一,代碼的 reward signal 極其清晰。輸入是什么,輸出是什么,測(cè)試能不能過,類型檢查能不能通過,程序能不能跑,這些都有明確反饋。
第二,GitHub 本身就是天然的高質(zhì)量數(shù)據(jù)海洋。大量真實(shí)代碼、issue、PR、commit、文檔、測(cè)試,全都給模型提供了極好的學(xué)習(xí)材料。
所以從 Claude 3.5 New,也就是外界說的 3.6 開始,coding 能力一直高速發(fā)展。
他自己現(xiàn)在 90%+ 的代碼都由模型生成。人主要負(fù)責(zé)設(shè)計(jì)邏輯、review 接口、把關(guān)架構(gòu)。
工作效率可以提升 20 到 50 倍。
但這里也有一個(gè)反直覺后果:效率變高以后,大腦反而成了瓶頸,工作時(shí)間甚至?xí)冮L。
因?yàn)槟悴辉偈窃诼龑懘a,而是在持續(xù)做判斷、做設(shè)計(jì)、做 review、做系統(tǒng)把關(guān)。AI 把執(zhí)行速度拉滿之后,人類真正累的是決策密度。
未來最大機(jī)會(huì):Long Horizon 和有限 context 實(shí)現(xiàn)無限上下文
姚順宇最看好的兩個(gè)方向,一個(gè)是 ML Coding,一個(gè)是 Long Horizon。
ML Coding 的意思是,讓 AI 不只是幫你寫業(yè)務(wù)代碼,而是完整做研究流程:寫代碼、跑實(shí)驗(yàn)、分析結(jié)果、提出新假設(shè),再繼續(xù)下一輪實(shí)驗(yàn)。
這相當(dāng)于把 AI 從 coding assistant 推向 research assistant。
Long Horizon 則是更大的方向:讓模型能夠完成長時(shí)序任務(wù)。
這里最關(guān)鍵的問題是 context。
訓(xùn)練時(shí)模型的 context 是有限的,但使用時(shí)要接近 infinite context。也就是說,模型要像人一樣,學(xué)會(huì)選擇性遺忘、檢索、壓縮和恢復(fù)關(guān)鍵信息,而不是把所有東西都塞進(jìn)上下文窗口。
一旦這個(gè)能力實(shí)現(xiàn),很多應(yīng)用都會(huì)解鎖。
個(gè)人助手會(huì)真正變得長期有用,持續(xù)交互會(huì)變得自然,Agent 也能執(zhí)行更長周期的任務(wù)。
姚順宇判斷,今年技術(shù)上一定能做到,現(xiàn)在拼的是哪條路線效率最高。
普通人真正能抄的,不是技巧,而是工作方式
這期聽下來,對(duì)普通人最有價(jià)值的建議其實(shí)很簡單。
如果你想進(jìn) AI 行業(yè),不要只想著證明自己多聰明。靠譜比聰明重要。先把簡單事做干凈,把任務(wù)理解清楚,把輸出驗(yàn)證清楚,對(duì)自己交付的東西負(fù)責(zé)。
如果你已經(jīng)在用 AI 寫代碼,不要只改 spec,也不要把模型當(dāng)成自動(dòng)補(bǔ)全機(jī)器。你應(yīng)該多花時(shí)間設(shè)計(jì)接口,建立統(tǒng)一語言,強(qiáng)制測(cè)試,做 TDD,讓模型在清晰反饋里工作。
如果你是未來程序員,也不用簡單焦慮“程序員會(huì)不會(huì)消失”。
姚順宇的判斷是,千分之一甚至萬分之一的人會(huì)活得非常好。這些人不一定是最會(huì)手寫代碼的人,而是懂大系統(tǒng)、能和 AI 高效協(xié)作、懂業(yè)務(wù)、能做架構(gòu)判斷的人。
換句話說,未來程序員不是“寫代碼的人”,而是“讓一組 AI 和系統(tǒng)可靠產(chǎn)出的人”。
最大反常識(shí)總結(jié)
這期最反常識(shí)的地方,其實(shí)可以總結(jié)成三句話。
AI 不是越來越難,而是越來越簡單。
個(gè)人英雄主義已經(jīng)過去,靠譜和系統(tǒng)性思考才是真正的護(hù)城河。
預(yù)訓(xùn)練還沒到頭,很多 bug 只是被誤以為是天花板。
以前我們總怕 AI 搶飯碗,但這期聽完,我反而覺得 AI 正在把人從執(zhí)行者升級(jí)成系統(tǒng)設(shè)計(jì)師。
真正稀缺的,從來不是寫代碼本身,而是知道要造什么、怎么造、怎么驗(yàn)證、怎么讓整個(gè)系統(tǒng)可靠運(yùn)轉(zhuǎn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.