網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

馬斯克甩出兩張王牌，Grok Build殺入AI編程

2026-05-26 15:35:32　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

【新智元導(dǎo)讀】AI編程三國(guó)殺來(lái)了！5月14日，xAI上線了Grok Build，一個(gè)跑在終端里、能自己規(guī)劃任務(wù)和改代碼的編程智能體。馬斯克曾承認(rèn)xAI在編程上落后，這是它正面追趕Claude Code和OpenAI Codex的第一步。

馬斯克補(bǔ)齊xAI編程短板的兩張牌，已經(jīng)打出。

5月14日，xAI發(fā)布Grok Build早期Beta，官方把它定位為「編程智能體和CLI（命令行工具）」，優(yōu)先面向SuperGrok Heavy訂閱用戶開放。

到了25日，xAI在官網(wǎng)正式發(fā)布Grok Build公告，準(zhǔn)入也從SuperGrok Heavy擴(kuò)大到所有SuperGrok和X Premium Plus用戶。至此，它才從一個(gè)高門檻的小范圍Beta，變成更多付費(fèi)用戶能上手的工具。

https://x.ai/news/grok-build-cli

馬斯克此前公開承認(rèn)過(guò)，xAI在編程場(chǎng)景上落后。據(jù)Bloomberg報(bào)道，xAI內(nèi)部曾有高管要求團(tuán)隊(duì)，把Grok做到能在各類任務(wù)上追平Claude。而Grok Build，就是這場(chǎng)追趕賽的第一個(gè)產(chǎn)品。

但產(chǎn)品一上線，很快就有用戶提出了一個(gè)尖銳的問(wèn)題：雖然產(chǎn)品界面不錯(cuò)，可底層模型不夠強(qiáng)：

只要xAI拿出一個(gè)真正SOTA（業(yè)界最強(qiáng)水平）的模型，Grok Build一夜之間就能和Codex、Claude Code正面競(jìng)爭(zhēng)。

馬斯克隨后在X上回了話，亮出了xAI下一代基礎(chǔ)模型：

「我們最近完成的Grok V9 1.5T運(yùn)行效果非常出色，這還是在尚未加入Cursor數(shù)據(jù)進(jìn)行補(bǔ)充訓(xùn)練之前的結(jié)果。」

他還專門發(fā)帖，捋了一遍xAI那套「有點(diǎn)令人困惑」的版本號(hào)：內(nèi)部正在開發(fā)的V9，參數(shù)1.5T，在數(shù)據(jù)整理、訓(xùn)練方法、模型規(guī)模等每個(gè)方面都顯著優(yōu)于V8，并針對(duì)Blackwell架構(gòu)進(jìn)行了優(yōu)化；而面向公眾的v4.2，基于V8訓(xùn)練，參數(shù)僅0.5T，在訓(xùn)練數(shù)據(jù)的質(zhì)量、全面性和比例上存在重大缺陷。

從V8到V9，馬斯克用了一個(gè)詞來(lái)形容：「差距巨大」。

三大維度重建V9

馬斯克口中的「差距巨大」，主要來(lái)源于三個(gè)維度的重建。

參數(shù)規(guī)模

首先，是參數(shù)規(guī)模，從0.5T漲到1.5T，實(shí)現(xiàn)了三倍擴(kuò)張。

參數(shù)量擴(kuò)大，可能提升模型容量、復(fù)雜任務(wù)建模能力，以及長(zhǎng)鏈路工具調(diào)用中的穩(wěn)定性。但上下文窗口、倉(cāng)庫(kù)級(jí)理解和長(zhǎng)程任務(wù)表現(xiàn)，并不由參數(shù)量單獨(dú)決定。

V9是否能在復(fù)雜代碼倉(cāng)庫(kù)、跨文件修改和多步驟智能體任務(wù)中明顯提升，仍需等公開版上線后通過(guò)實(shí)測(cè)驗(yàn)證。

由于Claude、GPT、Gemini 等頭部模型普遍不公開具體參數(shù)量，V9的1.5T更適合作為xAI自身代際比較的指標(biāo)，而不宜直接拿來(lái)和Sonnet、Opus或GPT系列做橫向比較。

Hopper不夠用了

xAI把Blackwell頂上去

按馬斯克的說(shuō)法，公開版v4.2所基于的V8約為0.5T參數(shù)，訓(xùn)練在Hopper芯片上；內(nèi)部V9則擴(kuò)大到1.5T參數(shù)，并面向Blackwell架構(gòu)優(yōu)化。

這意味著，V9的升級(jí)不只是模型尺寸變大，也伴隨著底層硬件平臺(tái)的代際切換。

相比Hopper，Blackwell面向更大規(guī)模模型集群做了進(jìn)一步設(shè)計(jì)，包括更高的互聯(lián)帶寬、更強(qiáng)的低精度計(jì)算能力，以及面向萬(wàn)億級(jí)模型訓(xùn)練和推理的系統(tǒng)級(jí)擴(kuò)展能力。

需要注意的是，Hopper本身已經(jīng)支持FP8，Blackwell的新增重點(diǎn)更應(yīng)放在FP4、第五代NVLink和更大規(guī)模集群互聯(lián)上。

xAI的算力底牌，是部署在孟菲斯的Colossus超級(jí)集群。

馬斯克過(guò)去一年多次更新過(guò)Colossus的擴(kuò)張進(jìn)度。

這次V9被稱為面向Blackwell優(yōu)化，也意味著xAI正試圖把集群擴(kuò)張和硬件升級(jí)，轉(zhuǎn)化為下一代基礎(chǔ)模型的訓(xùn)練與運(yùn)行能力。

真實(shí)的開發(fā)者數(shù)據(jù)

第二個(gè)是數(shù)據(jù)質(zhì)量。

馬斯克直言不諱：V8的數(shù)據(jù)質(zhì)量有缺陷，全面性不夠，比例不對(duì)。這意味著V8并非只是「規(guī)模小一點(diǎn)的模型」，而是一個(gè)數(shù)據(jù)基礎(chǔ)就沒(méi)打好的模型。

而V9補(bǔ)充訓(xùn)練的核心一步，是引入Cursor數(shù)據(jù)。

馬斯克在5月15日的帖子里特別提到：V9的訓(xùn)練剛剛跑完，Cursor數(shù)據(jù)還沒(méi)有加進(jìn)去，將在補(bǔ)充訓(xùn)練階段引入。

5月17日他更新了進(jìn)度：下一步加入Cursor數(shù)據(jù)做補(bǔ)充訓(xùn)練，然后是SFT（監(jiān)督微調(diào)）和RL（強(qiáng)化學(xué)習(xí)），整個(gè)流程大約還需要3到4周。

Cursor數(shù)據(jù)的價(jià)值，在于它是過(guò)程數(shù)據(jù)。GitHub上有海量代碼，但是終態(tài)數(shù)據(jù)。

從空白文件到最終代碼之間發(fā)生的數(shù)據(jù)：開發(fā)者補(bǔ)全、回退、糾錯(cuò)、與智能體互動(dòng)……這些過(guò)程數(shù)據(jù)才是訓(xùn)練編程智能體真正稀缺的資源。

在補(bǔ)充訓(xùn)練中加入Cursor數(shù)據(jù)之后，V9將是第一個(gè)在真實(shí)開發(fā)者行為上系統(tǒng)性訓(xùn)練過(guò)的Grok。

這次馬斯克點(diǎn)名Cursor，也不是隨意的。xAI與Cursor的關(guān)系由來(lái)已久：2025 年grok-code-fast-1發(fā)布時(shí)，Cursor是其限時(shí)免費(fèi)接入的合作平臺(tái)之一。

至于V9補(bǔ)充訓(xùn)練所用的Cursor數(shù)據(jù)具體來(lái)源和授權(quán)細(xì)節(jié)，目前沒(méi)有公開信息。

Grok Build到底是什么

功能上，Grok Build是一個(gè)跑在終端里的CLI工具，安裝只要一行命令。

https://x.ai/cli

功能上，這是一個(gè)跑在終端里的CLI工具，安裝只要一行命令。

裝好之后，進(jìn)入項(xiàng)目目錄敲一個(gè)grok，它就開始工作。你可以讓它解釋整個(gè)代碼倉(cāng)庫(kù)的結(jié)構(gòu)，也可以直接丟給它一個(gè)任務(wù)，比如「給這個(gè)API加上限流」，它會(huì)自己定位文件、改代碼、跑測(cè)試、再修自己的錯(cuò)。

它有三種用法。一是TUI（終端圖形交互界面），全屏、可鼠標(biāo)操作；二是headless（無(wú)界面）模式，塞進(jìn)腳本和自動(dòng)化流程里；三是通過(guò)ACP（智能體客戶端協(xié)議）接入其他應(yīng)用。

真正值得關(guān)注的是它的工作方式：先規(guī)劃，后執(zhí)行。

面對(duì)復(fù)雜任務(wù)，Grok Build會(huì)先把思路寫成一份計(jì)劃，停下來(lái)等你確認(rèn)。你可以逐條批注、整段重寫，甚至讓它帶著問(wèn)題先反問(wèn)你一句，再動(dòng)手。計(jì)劃通過(guò)后，每一處改動(dòng)都以清晰的diff（差異對(duì)比）呈現(xiàn)，改了什么一目了然。當(dāng)一個(gè)編程智能體直接在真實(shí)項(xiàng)目文件里動(dòng)手，這道審核關(guān)卡就不是可有可無(wú)。

它還支持子智能體并行，把一個(gè)任務(wù)拆給多個(gè)子智能體分頭處理；支持MCP（模型上下文協(xié)議）服務(wù)器；有skills（技能）、plugins（插件）和marketplace（應(yīng)用市場(chǎng)）的擴(kuò)展體系；斜杠命令里甚至帶著用/imagine生成圖片、用/imagine-video生成視頻。

把這些拼在一起，Grok Build對(duì)標(biāo)的是Claude Code、Codex CLI和Cursor的智能體，而并非傳統(tǒng)聊天機(jī)器人。xAI這次拿出的，是一個(gè)完整的開發(fā)者工作流入口。

底座是grok-build-0.1

V9還沒(méi)上線

按xAI官方文檔，驅(qū)動(dòng)Grok Build的是一個(gè)專門訓(xùn)練的模型：grok-build-0.1。

它在5月19日前后進(jìn)入API早期訪問(wèn)，官方對(duì)它的定位是「為智能體編程訓(xùn)練的快速編碼模型」。

這是一款專門定位于編程的模型。它支持文本和圖像輸入，原生具備工具調(diào)用、結(jié)構(gòu)化輸出和推理能力，上下文窗口256K（約25.6萬(wàn)token）。它被訓(xùn)練成能在一個(gè)長(zhǎng)鏈路里反復(fù)循環(huán)：讀問(wèn)題、寫代碼、用終端、查錯(cuò)、改錯(cuò)。

grok-build-0.1已單獨(dú)上架xAI API，開發(fā)者可以把它直接塞進(jìn)自己的智能體循環(huán)或者IDE集成里，并不一定要套Grok Build這個(gè)外殼。

它的出現(xiàn)，也意味著xAI編程模型線的一次重整。更早的grok-code-fast-1已在5月中旬退役，xAI官方建議把代碼工作負(fù)載遷移到grok-build-0.1，并稱后者在智能體編程和Web開發(fā)能力上有顯著提升。

從一個(gè)「快而便宜的代碼模型」，到一整套編程智能體產(chǎn)品，xAI走的是從模型API到開發(fā)者入口的路。

目前，xAI官方模型頁(yè)仍把Grok 4.3列為通用主模型，只在用途表里把「編程」對(duì)應(yīng)到Grok Build 0.1。

xAI官網(wǎng)API頁(yè)面，當(dāng)前對(duì)外主模型仍為Grok 4.3。https://x.ai/api

馬斯克口中的V8、V9，是xAI基礎(chǔ)模型的代際編號(hào)，和對(duì)外的產(chǎn)品版本號(hào)是兩回事：他帖子里把公開模型稱作v4.2，xAI官網(wǎng)則標(biāo)為Grok 4.3。

grok-build-0.1則是另一條線上面向編程的專用模型，它和V9是不是同一套底座、有沒(méi)有用上V9的預(yù)訓(xùn)練成果，xAI都沒(méi)有公開說(shuō)明。

真正的較量在6月

V9訓(xùn)練跑完，并不等于上線。整套后訓(xùn)練流程走完，公開版還要再等幾周。

在這幾周里，同行不會(huì)閑著。Claude Code保持著極高的迭代密度，最快兩天內(nèi)完成bug修復(fù)并發(fā)版；OpenAI的Codex持續(xù)小步推進(jìn)；Cursor作為IDE平臺(tái)，也在加深智能體能力、擴(kuò)展模型選擇、增強(qiáng)平臺(tái)粘性。

V9上線之后，還有問(wèn)題待驗(yàn)證。參數(shù)翻3倍，并不等于能力翻3倍。1.5T能不能在編程基準(zhǔn)上拉開和Claude、GPT的差距，要等實(shí)戰(zhàn)。

xAI補(bǔ)齊了產(chǎn)品線，V9訓(xùn)練已跑完、硬件已就位，幾周后就要拿出公開版，接受所有人檢驗(yàn)。

xAI的兩張牌已經(jīng)攤開，但牌桌上不止它一家。

Claude Code、Codex、Grok Build即將正面相遇，Cursor也在一旁持續(xù)加碼。

誰(shuí)是王者，要等6月的代碼實(shí)戰(zhàn)才能揭曉。

參考資料：

https://x.com/elonmusk/status/2055914584373141906

編輯：元宇 Moses

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.