編輯 | 澤南、陳陳
剛剛被 SpaceX 宣布以 600 億美元收購的 Cursor,發布大模型了。
本周二,Cursor 宣布了一個新的1.5 萬億 + 參數模型,該模型在超過10 萬塊 GPU上進行了預訓練。
![]()
消息是在舊金山舉行的 Cursor Compile 上宣布的,這是 Cursor 舉辦的首屆旗艦大會。
根據 Cursor 年僅 25 歲的 CEO Michael Truell 的說法,新模型規模和 Opus、GPT 一樣大。Opus 4.5 到 4.8,以及 GPT-5 到 GPT-5.5,其實都沒有那么大!它們都低于 2 萬億參數(啊!好像發現了什么大秘密)。
這意味著,以 GPT-5.5 和 Opus 4.8 當前的性能,對開源模型來說是可以達到的。
![]()
Michael 認為現在這個階段,唯一的護城河就是規模化擴展。
到目前為止,Anthropic 是唯一一家成功躍遷到約 10 萬億參數規模的 AI 實驗室,Michael 認為 OpenAI 想在年底前重新追上 Anthropic 并不容易。Anthropic 只需要在接下來一到兩年里繼續往 Mythos 上砸 RL 計算資源,它就會持續變強。
Michael 也談到了他對其他幾家頭部 AI 實驗室的看法。在他看來,Google 的模型規模沒有推到同等水平,同時在稀疏化路線上走得過于激進,后訓練和強化學習能力也還沒有充分轉化為穩定、好用的產品體驗。OpenAI 則仍在消化 GPT-4.5 之后的路線調整壓力,xAI 和 Meta 還在為下一階段的大模型競爭做準備。
![]()
不過,也有人很快提出質疑:Michael 所說的「Opus 和 GPT-5.5 萬億參數模型」到底從何而來?令人懷疑。
![]()
拋開這些外部判斷,Cursor 這次真正值得關注的地方在于:它不再只滿足于調用現成模型,而是開始系統性訓練自己的底座模型。
這也是 Michael Truell 在演講中首次較完整披露的新模型計劃。
![]()
視頻鏈接:https://mp.weixin.qq.com/s/12M8FmYM5Sv8jVpBQCGyPw
和 Cursor 過去使用的模型相比,這個新模型有三個明顯變化。
第一,它的規模更大。這是他們迄今為止訓練過的最大模型,規模已經接近前沿大模型公司的水準。
第二,它是從零開始訓練的,不是基于開源模型繼續微調(這家公司前段時間還曾卷入「Cursor 套殼 Kimi」的爭議)。Michael 也特別補充說,他們依然喜歡開源,也希望未來能找到更多回饋開源社區的方式。但從零訓練的好處在于,團隊可以更完整地控制模型行為,并讓模型更貼合他們和開發者真正關心的工作負載。
第三,這次訓練使用的算力規模遠超以往。相比他們過去能動用的算力,這次大約提升了 10 到 20 倍。過去從 Composer 1 到 Composer 2.5,相關模型更多是在相對有限的算力條件下訓練出來的,和前沿實驗室相比差距很大。這也限制了模型能力繼續提升的空間。因為很多改進最終都會受制于一個問題:能不能用更多 GPU、跑更長時間的訓練。現在算力規模上來之后,他們認為模型會有機會帶來真正差異化的能力。
更重要的是,這個新模型不會只面向代碼能力。團隊希望它具備更通用的智能,因為 Cursor 的目標不只是讓 AI 寫代碼,而是讓任何人都能構建自己想要的東西。眼下真正的瓶頸,已經不只是「代碼寫得好不好」,而是 AI 能不能像一個工程師同事一樣工作。
這意味著模型需要會使用工程師常用的工具,能做規劃,能測試軟件,能真正點進界面里檢查按鈕和交互,也能清楚地向用戶展示 Agent 到底改了什么。換句話說,Cursor 想把模型能力從單純的代碼生成,推進到更完整的軟件工程協作能力。
演講中,Michael 還提到,這個模型的訓練已經啟動,預計會在接下來的幾周內發布。相關能力背后也有外部算力或基礎設施合作支持。這背后的支持說的肯定是 SpaceX 了。
當然,真正的答案還要等模型發布后才能揭曉。
https://x.com/scaling01/status/2067017700384125238
https://x.com/Yuchenj_UW/status/2066891492187320405
https://x.com/nickadobos/status/2066929277757800833?s=46
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.