![]()
新智元報(bào)道
![]()
【新智元導(dǎo)讀】AI編程三國(guó)殺來(lái)了!5月14日,xAI上線了Grok Build,一個(gè)跑在終端里、能自己規(guī)劃任務(wù)和改代碼的編程智能體。馬斯克曾承認(rèn)xAI在編程上落后,這是它正面追趕Claude Code和OpenAI Codex的第一步。
馬斯克補(bǔ)齊xAI編程短板的兩張牌,已經(jīng)打出。
5月14日,xAI發(fā)布Grok Build早期Beta,官方把它定位為「編程智能體和CLI(命令行工具)」,優(yōu)先面向SuperGrok Heavy訂閱用戶開放。
到了25日,xAI在官網(wǎng)正式發(fā)布Grok Build公告,準(zhǔn)入也從SuperGrok Heavy擴(kuò)大到所有SuperGrok和X Premium Plus用戶。至此,它才從一個(gè)高門檻的小范圍Beta,變成更多付費(fèi)用戶能上手的工具。
![]()
https://x.ai/news/grok-build-cli
馬斯克此前公開承認(rèn)過(guò),xAI在編程場(chǎng)景上落后。據(jù)Bloomberg報(bào)道,xAI內(nèi)部曾有高管要求團(tuán)隊(duì),把Grok做到能在各類任務(wù)上追平Claude。而Grok Build,就是這場(chǎng)追趕賽的第一個(gè)產(chǎn)品。
但產(chǎn)品一上線,很快就有用戶提出了一個(gè)尖銳的問(wèn)題:雖然產(chǎn)品界面不錯(cuò),可底層模型不夠強(qiáng):
只要xAI拿出一個(gè)真正SOTA(業(yè)界最強(qiáng)水平)的模型,Grok Build一夜之間就能和Codex、Claude Code正面競(jìng)爭(zhēng)。
![]()
馬斯克隨后在X上回了話,亮出了xAI下一代基礎(chǔ)模型:
「我們最近完成的Grok V9 1.5T運(yùn)行效果非常出色,這還是在尚未加入Cursor數(shù)據(jù)進(jìn)行補(bǔ)充訓(xùn)練之前的結(jié)果。」
![]()
他還專門發(fā)帖,捋了一遍xAI那套「有點(diǎn)令人困惑」的版本號(hào):內(nèi)部正在開發(fā)的V9,參數(shù)1.5T,在數(shù)據(jù)整理、訓(xùn)練方法、模型規(guī)模等每個(gè)方面都顯著優(yōu)于V8,并針對(duì)Blackwell架構(gòu)進(jìn)行了優(yōu)化;而面向公眾的v4.2,基于V8訓(xùn)練,參數(shù)僅0.5T,在訓(xùn)練數(shù)據(jù)的質(zhì)量、全面性和比例上存在重大缺陷。
![]()
從V8到V9,馬斯克用了一個(gè)詞來(lái)形容:「差距巨大」。
三大維度重建V9
馬斯克口中的「差距巨大」,主要來(lái)源于三個(gè)維度的重建。
參數(shù)規(guī)模
首先,是參數(shù)規(guī)模,從0.5T漲到1.5T,實(shí)現(xiàn)了三倍擴(kuò)張。
參數(shù)量擴(kuò)大,可能提升模型容量、復(fù)雜任務(wù)建模能力,以及長(zhǎng)鏈路工具調(diào)用中的穩(wěn)定性。但上下文窗口、倉(cāng)庫(kù)級(jí)理解和長(zhǎng)程任務(wù)表現(xiàn),并不由參數(shù)量單獨(dú)決定。
V9是否能在復(fù)雜代碼倉(cāng)庫(kù)、跨文件修改和多步驟智能體任務(wù)中明顯提升,仍需等公開版上線后通過(guò)實(shí)測(cè)驗(yàn)證。
由于Claude、GPT、Gemini 等頭部模型普遍不公開具體參數(shù)量,V9的1.5T更適合作為xAI自身代際比較的指標(biāo),而不宜直接拿來(lái)和Sonnet、Opus或GPT系列做橫向比較。
Hopper不夠用了
xAI把Blackwell頂上去
按馬斯克的說(shuō)法,公開版v4.2所基于的V8約為0.5T參數(shù),訓(xùn)練在Hopper芯片上;內(nèi)部V9則擴(kuò)大到1.5T參數(shù),并面向Blackwell架構(gòu)優(yōu)化。
這意味著,V9的升級(jí)不只是模型尺寸變大,也伴隨著底層硬件平臺(tái)的代際切換。
相比Hopper,Blackwell面向更大規(guī)模模型集群做了進(jìn)一步設(shè)計(jì),包括更高的互聯(lián)帶寬、更強(qiáng)的低精度計(jì)算能力,以及面向萬(wàn)億級(jí)模型訓(xùn)練和推理的系統(tǒng)級(jí)擴(kuò)展能力。
需要注意的是,Hopper本身已經(jīng)支持FP8,Blackwell的新增重點(diǎn)更應(yīng)放在FP4、第五代NVLink和更大規(guī)模集群互聯(lián)上。
xAI的算力底牌,是部署在孟菲斯的Colossus超級(jí)集群。
馬斯克過(guò)去一年多次更新過(guò)Colossus的擴(kuò)張進(jìn)度。
這次V9被稱為面向Blackwell優(yōu)化,也意味著xAI正試圖把集群擴(kuò)張和硬件升級(jí),轉(zhuǎn)化為下一代基礎(chǔ)模型的訓(xùn)練與運(yùn)行能力。
真實(shí)的開發(fā)者數(shù)據(jù)
第二個(gè)是數(shù)據(jù)質(zhì)量。
馬斯克直言不諱:V8的數(shù)據(jù)質(zhì)量有缺陷,全面性不夠,比例不對(duì)。這意味著V8并非只是「規(guī)模小一點(diǎn)的模型」,而是一個(gè)數(shù)據(jù)基礎(chǔ)就沒(méi)打好的模型。
而V9補(bǔ)充訓(xùn)練的核心一步,是引入Cursor數(shù)據(jù)。
馬斯克在5月15日的帖子里特別提到:V9的訓(xùn)練剛剛跑完,Cursor數(shù)據(jù)還沒(méi)有加進(jìn)去,將在補(bǔ)充訓(xùn)練階段引入。
5月17日他更新了進(jìn)度:下一步加入Cursor數(shù)據(jù)做補(bǔ)充訓(xùn)練,然后是SFT(監(jiān)督微調(diào))和RL(強(qiáng)化學(xué)習(xí)),整個(gè)流程大約還需要3到4周。
![]()
Cursor數(shù)據(jù)的價(jià)值,在于它是過(guò)程數(shù)據(jù)。GitHub上有海量代碼,但是終態(tài)數(shù)據(jù)。
從空白文件到最終代碼之間發(fā)生的數(shù)據(jù):開發(fā)者補(bǔ)全、回退、糾錯(cuò)、與智能體互動(dòng)……這些過(guò)程數(shù)據(jù)才是訓(xùn)練編程智能體真正稀缺的資源。
在補(bǔ)充訓(xùn)練中加入Cursor數(shù)據(jù)之后,V9將是第一個(gè)在真實(shí)開發(fā)者行為上系統(tǒng)性訓(xùn)練過(guò)的Grok。
這次馬斯克點(diǎn)名Cursor,也不是隨意的。xAI與Cursor的關(guān)系由來(lái)已久:2025 年grok-code-fast-1發(fā)布時(shí),Cursor是其限時(shí)免費(fèi)接入的合作平臺(tái)之一。
至于V9補(bǔ)充訓(xùn)練所用的Cursor數(shù)據(jù)具體來(lái)源和授權(quán)細(xì)節(jié),目前沒(méi)有公開信息。
Grok Build到底是什么
功能上,Grok Build是一個(gè)跑在終端里的CLI工具,安裝只要一行命令。
![]()
https://x.ai/cli
功能上,這是一個(gè)跑在終端里的CLI工具,安裝只要一行命令。
裝好之后,進(jìn)入項(xiàng)目目錄敲一個(gè)grok,它就開始工作。你可以讓它解釋整個(gè)代碼倉(cāng)庫(kù)的結(jié)構(gòu),也可以直接丟給它一個(gè)任務(wù),比如「給這個(gè)API加上限流」,它會(huì)自己定位文件、改代碼、跑測(cè)試、再修自己的錯(cuò)。
它有三種用法。一是TUI(終端圖形交互界面),全屏、可鼠標(biāo)操作;二是headless(無(wú)界面)模式,塞進(jìn)腳本和自動(dòng)化流程里;三是通過(guò)ACP(智能體客戶端協(xié)議)接入其他應(yīng)用。
真正值得關(guān)注的是它的工作方式:先規(guī)劃,后執(zhí)行。
面對(duì)復(fù)雜任務(wù),Grok Build會(huì)先把思路寫成一份計(jì)劃,停下來(lái)等你確認(rèn)。你可以逐條批注、整段重寫,甚至讓它帶著問(wèn)題先反問(wèn)你一句,再動(dòng)手。計(jì)劃通過(guò)后,每一處改動(dòng)都以清晰的diff(差異對(duì)比)呈現(xiàn),改了什么一目了然。當(dāng)一個(gè)編程智能體直接在真實(shí)項(xiàng)目文件里動(dòng)手,這道審核關(guān)卡就不是可有可無(wú)。
它還支持子智能體并行,把一個(gè)任務(wù)拆給多個(gè)子智能體分頭處理;支持MCP(模型上下文協(xié)議)服務(wù)器;有skills(技能)、plugins(插件)和marketplace(應(yīng)用市場(chǎng))的擴(kuò)展體系;斜杠命令里甚至帶著用/imagine生成圖片、用/imagine-video生成視頻。
把這些拼在一起,Grok Build對(duì)標(biāo)的是Claude Code、Codex CLI和Cursor的智能體,而并非傳統(tǒng)聊天機(jī)器人。xAI這次拿出的,是一個(gè)完整的開發(fā)者工作流入口。
底座是grok-build-0.1
V9還沒(méi)上線
按xAI官方文檔,驅(qū)動(dòng)Grok Build的是一個(gè)專門訓(xùn)練的模型:grok-build-0.1。
它在5月19日前后進(jìn)入API早期訪問(wèn),官方對(duì)它的定位是「為智能體編程訓(xùn)練的快速編碼模型」。
這是一款專門定位于編程的模型。它支持文本和圖像輸入,原生具備工具調(diào)用、結(jié)構(gòu)化輸出和推理能力,上下文窗口256K(約25.6萬(wàn)token)。它被訓(xùn)練成能在一個(gè)長(zhǎng)鏈路里反復(fù)循環(huán):讀問(wèn)題、寫代碼、用終端、查錯(cuò)、改錯(cuò)。
grok-build-0.1已單獨(dú)上架xAI API,開發(fā)者可以把它直接塞進(jìn)自己的智能體循環(huán)或者IDE集成里,并不一定要套Grok Build這個(gè)外殼。
它的出現(xiàn),也意味著xAI編程模型線的一次重整。更早的grok-code-fast-1已在5月中旬退役,xAI官方建議把代碼工作負(fù)載遷移到grok-build-0.1,并稱后者在智能體編程和Web開發(fā)能力上有顯著提升。
從一個(gè)「快而便宜的代碼模型」,到一整套編程智能體產(chǎn)品,xAI走的是從模型API到開發(fā)者入口的路。
目前,xAI官方模型頁(yè)仍把Grok 4.3列為通用主模型,只在用途表里把「編程」對(duì)應(yīng)到Grok Build 0.1。
![]()
xAI官網(wǎng)API頁(yè)面,當(dāng)前對(duì)外主模型仍為Grok 4.3。https://x.ai/api
馬斯克口中的V8、V9,是xAI基礎(chǔ)模型的代際編號(hào),和對(duì)外的產(chǎn)品版本號(hào)是兩回事:他帖子里把公開模型稱作v4.2,xAI官網(wǎng)則標(biāo)為Grok 4.3。
grok-build-0.1則是另一條線上面向編程的專用模型,它和V9是不是同一套底座、有沒(méi)有用上V9的預(yù)訓(xùn)練成果,xAI都沒(méi)有公開說(shuō)明。
真正的較量在6月
V9訓(xùn)練跑完,并不等于上線。整套后訓(xùn)練流程走完,公開版還要再等幾周。
在這幾周里,同行不會(huì)閑著。Claude Code保持著極高的迭代密度,最快兩天內(nèi)完成bug修復(fù)并發(fā)版;OpenAI的Codex持續(xù)小步推進(jìn);Cursor作為IDE平臺(tái),也在加深智能體能力、擴(kuò)展模型選擇、增強(qiáng)平臺(tái)粘性。
V9上線之后,還有問(wèn)題待驗(yàn)證。參數(shù)翻3倍,并不等于能力翻3倍。1.5T能不能在編程基準(zhǔn)上拉開和Claude、GPT的差距,要等實(shí)戰(zhàn)。
xAI補(bǔ)齊了產(chǎn)品線,V9訓(xùn)練已跑完、硬件已就位,幾周后就要拿出公開版,接受所有人檢驗(yàn)。
xAI的兩張牌已經(jīng)攤開,但牌桌上不止它一家。
Claude Code、Codex、Grok Build即將正面相遇,Cursor也在一旁持續(xù)加碼。
誰(shuí)是王者,要等6月的代碼實(shí)戰(zhàn)才能揭曉。
參考資料:
https://x.com/elonmusk/status/2055914584373141906
編輯:元宇 Moses
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.