![]()
在敬畏中沖刺,重寫 AI 權力的游戲。
整理 | 王啟隆
出品丨AI 科技大本營(ID:rgznai100)
今早,一條簡短的推文讓整個硅谷的目光從各大廠商的產品發布會上移開。
全球人工智能領域的標志性人物、OpenAI 聯合創始人、前特斯拉 AI 總監 Andrej Karpathy 在社交媒體 X 上正式宣布:“個人近況:我已經加入了 Anthropic。我認為未來幾年,在大語言模型(LLM)的最前沿,將是極其具有‘塑造性(formative)’的時期。我非常興奮能加入這里的團隊并重返研發一線(R&D)。我依然對教育充滿熱情,并計劃在適當時機恢復這方面的工作。”
![]()
這條消息立刻震動了整個推特 AI 圈,畢竟這幾年,Karpathy 的 “網紅” 屬性已經逐漸超越了他的其他標簽,從去年帶火氛圍編程這個詞,到現在 Agent 時代的各種造詞造梗,都離不開這個大神的身影。
英偉達具身自主研究負責人 Jim Fan 在推文下半開玩笑地評論,這比當天舉行的 Google I/O 開發者大會 Keynote 是“更重磅的新聞”;而 Anthropic 麾下的 Claude Code 作者 Boris Cherny 等一眾開發者圈核心人物,則迅速轉發表達了狂熱的歡迎。
![]()
Karpathy 的加盟,是一次對前沿 AI 研發方向極其赤裸的“公開站隊”。在 OpenAI 深陷內憂外患、被馬斯克的官司強勢打壓、沖刺千億美金 IPO 的劇烈動蕩期,這位“建校元老”選擇走向它最致命的競爭對手,不僅給 Anthropic 帶去了不可估量的技術號召力,更向整個行業釋放了一個冷酷的信號:大模型競爭的下半場,尚未到純粹拼商業變現的時刻,最慘烈的戰役,依然在最前沿的研發(R&D)腹地。
![]()
Who is Karpathy?
平時各大媒體都會直接叫“卡帕西大神”,主要是因為 Andrej Karpathy 的 title 太長,他在當前的硅谷,確實擁有著三重身份。
![]()
他是深度學習正史的書寫者之一。師從李飛飛,在斯坦福創立了傳奇的 CS231n 課程,隨后作為最初的 11 名創始成員之一,與 Ilya Sutskever、Sam Altman 共同締造了 OpenAI。
他是將理論轉化為工程現實的頂級架構師。在 Elon Musk 的招募下,他曾執掌特斯拉 AI 部門五年,力排眾議主導了純視覺(Vision-Only)自動駕駛神經網絡架構,是在實體物理世界部署超大規模 AI 的先驅。
他更是大模型時代的底層布道者。他早年提出的“軟件 2.0(Software 2.0)”概念——即用神經網絡權重取代傳統手寫代碼——如今已成為行業共識。而在創辦 Eureka Labs 期間,他更是引領了面向開發者的“AI 原生”教育。
這樣一位兼具頂級學術視野、超強工程落地能力與開發者社區“神格”的復合型天才,他的下注,本質上是在用自己的職業生涯,為當前 AI 行業的兩條不同路線進行“公投”。
2024 年他離開 OpenAI,2026 年重返一線。他沒有選擇回歸那個他親手創辦、如今估值逼近 8520 億美元的舊主,而是轉身走向了 Anthropic。
Karpathy 在推文中特意強調了兩個詞:“塑造性(formative)”和“重返 R&D”。這不僅是個人志向的抒發,更是對當前行業一種悲觀論調的正面回擊。
過去十八個月里,硅谷彌漫著一種焦慮:預訓練大模型的“Scaling Laws”正在放緩。
雖然這兩年,英偉達老黃兩次 GTC Keynote 都在證明 Scaling Law 的神話還在繼續,但畢竟,他要賣顯卡啊。
![]()
總之,靠粗暴堆砌參數和算力,似乎已經很難再砸出 GPT-3 到 GPT-4 那種階躍式的奇跡。于是,大廠們紛紛將重心轉向了后訓練(Post-training)、模型微調和商業化應用包裝。
但不僅是老黃不信邪,Anthropic 也不信邪,Karpathy 更是不信。
根據 Anthropic 預訓練主管 Nicholas Joseph 的確認,Karpathy 此次直接殺入了最核心、最昂貴的“預訓練團隊”。但他不是去繼續手寫代碼做實驗的,他的任務是:“使用 Claude 模型本身來加速預訓練研究。”
![]()
在此之前,Karpathy 在 GitHub 上開源的autoresearch和nanochat項目已經初露鋒芒。他提出了一種全新的科研范式:研究人員不再手動寫 Python,而是編寫 Markdown 文件,指揮一個由眾多 AI 組成的“智能體蜂群(Agent Swarms)”去自主搞科研。在這個系統里,模型自己討論、自己調整超參數、自己清洗數據,將原本需要一周的訓練時間指數級壓縮到了個位數小時。
Karpathy 加盟 Anthropic 的核心使命,就是打破傳統的預訓練瓶頸,開啟人工智能的圣杯——遞歸自我改進(Recursive Self-Improvement)。
今年有個明顯的信號,就是 AI 研發本身正在被 AI 化。谷歌前段時間開發者大會就透露自己內部代碼很多是 AI 寫的,而 Claude 現在也是被用來分析它自己的訓練日志,尋找人類工程師根本無法察覺的微小算法瑕疵,篩選更高質量的數據,最終自己訓練下一代更強大的 Claude。當前沿競爭陷入焦灼,誰能率先讓模型形成“自我進化的飛輪”,誰就能在下一個世代的算力軍備競賽中形成降維打擊。
這正是 Karpathy 所說的“最具塑造性的時期”。
AI 開發者計劃開放申請,免費領 50 小時云算力券
支持主流 AI 框架與模型部署
![]()
兩條路線的殊途,與前沿格局的重構
如果脫離 2026 年的宏觀商業語境,就無法看懂 Anthropic 為何對 Karpathy 具備如此致命的吸引力。這背后,是兩家頂級 AI 實驗室在“科研純粹性”與“商業狂奔”上的徹底分道揚鑣。
此時的 OpenAI,正困于一場焦頭爛額的“生死局”。
為了沖刺 2026 年底 8520 億美元的驚天 IPO,Sam Altman 正在強推極度激進的商業化路線。他們把 ChatGPT、Codex(編碼)和 API 強行揉合成一個意圖壟斷市場的“超級應用(Super App)”。
代價是慘痛的。為了商業讓路,OpenAI 取消了曾高調宣傳的“OpenAI for Science”部門,永久下線了科研工具 Prism,甚至在 4 月關停了 Sora 的所有網頁端和 API 服務。隨之而來的是核心人才的大失血:科學團隊負責人 Kevin Weil、Sora 負責人 Bill Peebles 離職;更早之前,從 Ilya Sutskever 到 Jan Leike,再到后訓練負責人 John Schulman(同樣加入了 Anthropic),建校元老與安全技術中堅力量幾乎被徹底掏空。
反觀 Anthropic,卻在 2026 年迎來了恐怖的爆發。
CEO Dario Amodei 披露,今年一季度,Anthropic 實現了擊穿所有預測模型的“80 倍增長”,ARR(年化經常性收入)暴漲至 300 億美元。
更可怕的是他們解決算力危機的方式——Anthropic 極其戲劇性地與 Elon Musk 旗下的 SpaceX 達成了絕地交易,整體接管了擁有 22 萬張 GPU 的 Colossus 1 數據中心。要知道,Musk 此刻正因為 1300 億美元的訴訟要求法院解散 OpenAI,但他卻對 Anthropic 開放了彈藥庫,甚至直言這支團隊“沒有觸發我的邪惡探測器”。
擁有了 SpaceX 級別的無限算力,外加免于 IPO 季度財報壓力的純粹研發環境,Anthropic 自然成為了 Karpathy 這種頂級極客重返 R&D 戰場的唯一選擇。
如果說算力和預訓練團隊是 Anthropic 的“重武器”,那么他們在開發者工具鏈上的戰略吞噬,則是吸引 Karpathy 的“軟生態”。
Karpathy 曾提出過“氛圍編程(Vibe Coding)”,而現在的硅谷,這種趨勢已經異化為一種瘋狂的生產力狀態。Karpathy 坦言自己現在手工代碼與 AI 生成代碼的比例已經是 0:100,他甚至稱這種停不下來的狀態為“AI 精神狂躁(AI Psychosis)”。
為了承載這種極端的開發效率,Anthropic 在過去幾個月完成了極其兇狠的垂直整合:
收購 Bun:將大模型執行代碼的底層解釋器啟動時間壓縮到 3 毫秒,直接掌控了下一代智能體敏捷執行的“發動機”。
收購 Stainless:就在 Karpathy 官宣加盟的前一天,Anthropic 斥資超 3 億美元買下了這家壟斷了全球 AI 公司 API 生成 SDK 的基礎設施企業,并隨后切斷了外部供應。這一招“釜底抽薪”,直接讓 OpenAI 和 Google 瞬間失去了維護自身開發者生態的關鍵自動化工具鏈。
從大語言模型,到連接外部環境的 MCP 協議,再到毫秒級的底層運行環境 Bun,Anthropic 已經形成了一個極其封閉且高效的全棧壟斷。對于一生致力于推動 AI 開發者教育的 Karpathy 來說,這里的土壤,比世界上任何地方都更接近他腦海中的“軟件 3.0”時代。
擁有最頂尖的智囊、無限的算力、壟斷的工具鏈,以及由 Opus 4.7 領銜的旗艦模型矩陣,Anthropic 已經具備了顛覆格局的所有籌碼。
但更讓行業側目的是他們的“克制”。當他們內部那個展現出災難級網絡攻防實力(甚至能反向工程零日漏洞)的怪物模型 Claude Mythos 誕生時,Anthropic 沒有拿它去資本市場換取估值,而是啟動了絕密補貼項目,直接向美國國防部和 G20 國家財長預警,協助修復全球金融基建。同時,他們正在利用“自然語言自編碼器(NLA)”技術,試圖完全透明化模型的內部思維。
一邊是對前沿能力無休止的探索(遞歸自我改進),一邊是對力量邊界的絕對敬畏。這或許才是 Karpathy 選擇 Anthropic 最根本的原因。
前沿大語言模型的戰爭遠未結束,它甚至還沒有進入真正的高潮。
當 OpenAI 正在努力成為一家賣“超級應用”的成熟商業公司時,Anthropic 正在聚合這個時代最聰明的大腦,試圖在實驗室里孕育出真正超越人類理解的“下一次工業革命”。Karpathy 回到了他的研發主戰場,而全球人工智能權力的天平,已經隨著他的轉身,轟然傾斜。
免費領取 50 小時 AI 算力|限時開放
加入 AI 開發者計劃
獲取:
? AI 算力資源
? 官方技術社群
? Workshop 與 AI Academy
? 開發者專屬福利
完成認證后,額外領取:
? 9.9 元瑞幸咖啡券
立即加入
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.