網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

爆料一個(gè)新模型，平替 Opus 4.8 的國(guó)產(chǎn)之光來(lái)了

2026-06-17 13:11:52　來(lái)源: 唐韌

北京舉報(bào)

分享至

今天有個(gè)重磅消息，智譜正式發(fā)布了 GLM-5.2 模型，同時(shí)也開(kāi)源了。

在全球百萬(wàn)用戶(hù)參與盲測(cè)的前端開(kāi)發(fā)評(píng)估系統(tǒng) Code Arena 上，GLM-5.2 取得目前可用模型第一的成績(jī)。

有一說(shuō)一，國(guó)產(chǎn)模型這次真的站在了世界前列，屬于我們普通人能用得上用得起的國(guó)產(chǎn)之光了。

這次 GML-5.2 有兩個(gè)關(guān)鍵信息，我覺(jué)得應(yīng)該重點(diǎn)聊聊。

第一，Coding 繼續(xù)保持國(guó)產(chǎn)第一、開(kāi)源第一。

在 FrontierSWE、SWE-Marathon、PostTrainBench 等多個(gè)長(zhǎng)程任務(wù)基準(zhǔn)上，GLM-5.2 的表現(xiàn)介于 Claude Opus 4.8 與 GPT 5.5 之間，是排名最高的開(kāi)源模型。

我在網(wǎng)上看到一個(gè) AI 博主說(shuō)，如果你是通過(guò)中轉(zhuǎn)服務(wù)使用 Opus，那你可能分不出有可能是 GLM-5.2 冒充的。

第二，1M token 上下文。

注意，不是標(biāo)稱(chēng) 1M，是真正能用的 1M。

現(xiàn)在市面上標(biāo)稱(chēng) 1M 的模型不少，但大部分到了長(zhǎng)上下文后半段效果衰減得厲害。

GLM-5.2 通過(guò)注意力結(jié)構(gòu)層面的創(chuàng)新，把 1M 長(zhǎng)度下的效果衰減和推理成本同時(shí)壓了下來(lái)。

說(shuō)人話，就是它在處理超長(zhǎng)任務(wù)時(shí)不會(huì)到后面就開(kāi)始犯糊涂、忘前面說(shuō)過(guò)什么。

這個(gè)能力為什么重要？我換個(gè)說(shuō)法你就明白了。

現(xiàn)在用 AI 寫(xiě)代碼最大的痛點(diǎn)不是它寫(xiě)不出來(lái)，而是任務(wù)一長(zhǎng)它就忘了。

你讓它改一個(gè)大項(xiàng)目，改到第 30 步的時(shí)候它忘了第 2 步定下的規(guī)則。你不得不反復(fù)提醒它、反復(fù)把上下文喂回去，累的不是 AI，是你。

說(shuō)白了，就是「能干活，但記性差」。

因此，1M 上下文解決的就是這個(gè)問(wèn)題。

一個(gè)持續(xù)工作數(shù)小時(shí)的 AI 要經(jīng)歷幾千次工具調(diào)用、讀寫(xiě)數(shù)萬(wàn)行代碼、積累大量中間狀態(tài)。

如果上下文窗口不夠長(zhǎng)，模型就被迫不斷壓縮、丟棄、再回憶，每一次壓縮都是信息損耗，每一次遺忘都可能讓任務(wù)在第 N 步偏離第 2 步的約束。

長(zhǎng)程任務(wù)的失敗，很多時(shí)候不是模型不夠聰明，而是它忘了。

GLM-5.2 做到的是在一次任務(wù)中完整持有整個(gè)項(xiàng)目的全部代碼、全部決策歷史、全部約束條件。

這個(gè)過(guò)程，就像一個(gè)不會(huì)忘事的工程師，從頭推進(jìn)到尾。

這里說(shuō)個(gè)案例。

之前我自己用其他模型結(jié)合 Claude Code 開(kāi)發(fā)了一個(gè)小程序，當(dāng)時(shí)光是 PRD 文檔就有 5000 多字，因?yàn)閱蝹€(gè)文件太大，還是拆分上傳的。

這次我換成 GLM-5.2 試了下，試圖讓它重構(gòu)這個(gè)項(xiàng)目，還是同一份 PRD 文檔。

開(kāi)啟 CC 的 Plan Mode 模式后，我先讓模型自己加載分析需求文檔并制定開(kāi)發(fā)計(jì)劃，然后再進(jìn)入開(kāi)發(fā)階段。

過(guò)程中，我還加了一些需求，并且對(duì)一開(kāi)始的信息做了修改。此時(shí)，GLM-5.2 的 1M 上下文優(yōu)勢(shì)就出來(lái)了，全程無(wú)紕漏。

大概用了 25 分鐘左右，這個(gè)基于 PRD 的項(xiàng)目就全部開(kāi)發(fā)完了，而且自己調(diào)起了本地的微信開(kāi)發(fā)者工具。

我讓它統(tǒng)計(jì)了代碼量，總共 16000 行代碼，而且能成功預(yù)覽。

不過(guò)有一說(shuō)一，我覺(jué)得 GLM-5.2 在前端頁(yè)面的設(shè)計(jì)美觀度上還有提升空間，現(xiàn)在屬于可用，但還不是絕對(duì)好的狀態(tài)。

如果是用來(lái)做一些大型項(xiàng)目的重構(gòu)或者開(kāi)發(fā)，這種 1M 上下文空間的體驗(yàn)就會(huì)明顯好很多。

在 Terminal-Bench 2.1 上，這是一個(gè)評(píng)測(cè) Agent 通過(guò)命令行操作一臺(tái)計(jì)算機(jī)的數(shù)據(jù)集，GLM-5.2僅比Opus 4.8低4%，相比GLM-5.1提升了17.5%。

在 MCP-Atlas 上（工具使用tool-use評(píng)測(cè)的數(shù)據(jù)集），GLM-5.2僅比Opus 4.8 低 0.8%。

此外，能做的事情也變了。

整個(gè)代碼庫(kù)扔進(jìn)去做跨文件重構(gòu)，一句話需求直接出完整全棧項(xiàng)目，大型 SaaS 級(jí)工程持續(xù)推進(jìn)不跑偏。

這些場(chǎng)景以前只能拆成無(wú)數(shù)個(gè)小任務(wù)反復(fù)喂上下文，現(xiàn)在可以一次性給完、一次性干完。

我自己也測(cè)了一個(gè)場(chǎng)景，就是優(yōu)化我之前用 Agent 開(kāi)發(fā)的個(gè)人網(wǎng)站。

先說(shuō)下，如果你們想用上 GLM-5.2，就得去搶智譜的 Coding Plan，不過(guò)這個(gè)現(xiàn)在很緊俏，你們可以每天去盯一盯官方放量的時(shí)間。

如果搶到了配額，就可以配置到你的 Agent 里直接開(kāi)始用，我是用 Claude Code 配合 GLM-5.2 用的。

之前開(kāi)發(fā)這個(gè)網(wǎng)站我用了幾個(gè)模型混合完成，包括 GLM-5.1、Claude Opus 4.6 和 4.8。

從前端開(kāi)發(fā)質(zhì)量來(lái)看，Claude 的模型確實(shí)做得更好，但是在代碼本身的開(kāi)發(fā)質(zhì)量上，我覺(jué)得 GLM 和 Claude 的差距并沒(méi)有那么大。

這次優(yōu)化，我完全用 GLM-5.2 來(lái)完成，核心就是優(yōu)化我之前覺(jué)得別扭的幾個(gè)模塊。

第一個(gè)問(wèn)題就是我網(wǎng)站上案例墻這部分，現(xiàn)在的問(wèn)題就是重點(diǎn)不突出、沒(méi)有數(shù)據(jù)、視覺(jué)不美觀。

我跟 GLM-5.2 提的需求并沒(méi)有那么明確，只是表達(dá)了一句話需求。

但是，它的分析和問(wèn)題拆解卻很精準(zhǔn)，而且還發(fā)現(xiàn)了代碼中存在的命名問(wèn)題。

講真，它跟我說(shuō)話真的是毫不客氣。

不僅找準(zhǔn)了問(wèn)題，而且還給出了方案。

不僅按照這個(gè)新方案做了重新開(kāi)發(fā)，還對(duì)我原有的代碼結(jié)構(gòu)做了優(yōu)化，整個(gè)網(wǎng)站的代碼都有被它 review。

我有一個(gè)很直觀的感覺(jué)，就是一次性成功率更高，而且模型在需求理解、代碼執(zhí)行、完成質(zhì)量上做得都不錯(cuò)。

優(yōu)化后的最終效果，明顯比之前好太多。

說(shuō)實(shí)話，結(jié)果超出預(yù)期。

從實(shí)際體感來(lái)看，我覺(jué)得寫(xiě)出來(lái)的代碼質(zhì)量和最終呈現(xiàn)的效果跟之前我用的 Claude 模型差異并不是很大。

還是我之前說(shuō)的，現(xiàn)在 GLM 系列的模型在國(guó)產(chǎn) coding 領(lǐng)域的確是做得非常好的一家。

說(shuō)實(shí)話，對(duì)于我們這些每天重度使用 AI 的人來(lái)說(shuō)，智譜的操作是值得點(diǎn)贊的。

之前大家選模型默認(rèn)選海外的，Claude、GPT，能力確實(shí)強(qiáng)。

但穩(wěn)定性呢？可用性呢？賬號(hào)說(shuō)封就封，模型說(shuō)停就停，上周 Anthropic 的事就是最好的例子。

現(xiàn)在，國(guó)產(chǎn)開(kāi)源模型的價(jià)值正在被重新評(píng)估。

不是說(shuō)它今天在所有維度上都比 Claude 好，而是它穩(wěn)定、可控、不會(huì)哪天突然告訴你「因?yàn)檎咴颍悴荒苡昧恕埂?/p>

還有一點(diǎn)，現(xiàn)在國(guó)產(chǎn) AI 都在不同程度上被限卡，如果這個(gè)環(huán)節(jié)能突破，我覺(jué)得不會(huì)比國(guó)外差。

GLM-5.2 這次的做法也值得一說(shuō)，Coding Plan 全量用戶(hù)直接可用，包括免費(fèi)的 Lite 版。

這種發(fā)布方式本身就是一種態(tài)度，不搞花活，你自己試，數(shù)據(jù)說(shuō)話。

最后，說(shuō)下我自己的判斷。

過(guò)去一年，行業(yè)衡量模型的標(biāo)準(zhǔn)正在遷移。以前比的是誰(shuí)完成任務(wù)更好，誰(shuí)的 benchmark 分高誰(shuí)就牛。

現(xiàn)在比的是「能獨(dú)立干多久」，誰(shuí)能持續(xù)工作、不跑偏、不忘事，誰(shuí)才是真正能用的生產(chǎn)力工具。

上下文長(zhǎng)度的可用性和長(zhǎng)程任務(wù)能力，正在成為下一階段模型競(jìng)爭(zhēng)的主線。

技術(shù)要真正普及成生產(chǎn)力，就一定是開(kāi)放的。

所有的不開(kāi)放和限制，本身其實(shí)就是對(duì)生產(chǎn)力進(jìn)步的一種束縛。

智譜在他們官宣內(nèi)容的最后提到兩句英文：

A step closer to frontier intelligence for everyone.

The future of AI is open, and it is for the people.

翻譯過(guò)來(lái)就是：

向前沿智能再近一步，為每一個(gè)人。

AI的未來(lái)是開(kāi)放的，它屬于所有人。

國(guó)產(chǎn)模型走到這一步，值得被看見(jiàn)。

················· 唐韌出品 ·················

用AI思維發(fā)現(xiàn)下一個(gè)機(jī)會(huì)

安可時(shí)刻

如果國(guó)產(chǎn)模型能解決被限卡的瓶頸，那速度和質(zhì)量又會(huì)上去一個(gè)臺(tái)階。

其實(shí)對(duì)于大多數(shù)任務(wù)來(lái)說(shuō)，現(xiàn)在國(guó)產(chǎn)模型已經(jīng)表現(xiàn)不錯(cuò)了。從我的日常 coding 場(chǎng)景來(lái)看，GLM-5.2 基本也能滿足大多數(shù)需求。

國(guó)外模型是很強(qiáng)，但我們也要給國(guó)產(chǎn)模型一些時(shí)間讓他們成長(zhǎng)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

一句話生圖要過(guò)時(shí)了？開(kāi)源圖像生成Agent進(jìn)化出「工具編排」

機(jī)器之心Pro 2026-07-01 14:04:29
0 跟貼 0
40張GPU硬剛1536顆CPU！70歲「古董」代碼狂飆數(shù)十倍

新智元 2026-07-01 14:22:07
0 跟貼 0

中國(guó)用戶(hù)被針對(duì)！Anthropic承認(rèn)私藏“木馬”Claude信任崩塌，網(wǎng)友直呼太可怕

智東西 2026-07-01 17:30:56
0 跟貼 0

OceanBase湖庫(kù)一體，重新定義AI數(shù)據(jù)庫(kù)

量子位 2026-07-01 16:58:32
0 跟貼 0
核彈發(fā)射需要多少段代碼？有多“復(fù)雜”？ # 軍事科普

裝備解析室 2026-06-29 10:43:49
0 跟貼 0

Sonnet 5終于來(lái)了，然而Opus 4.8現(xiàn)在有點(diǎn)尷尬

鈦媒體APP 2026-07-01 12:18:12
0 跟貼 0

印度裔抱團(tuán)、代碼被鎖死、公司停擺，張江事件的致命教訓(xùn)！

A活著 2026-07-01 17:03:00
11 跟貼 11
坎貝爾承認(rèn)：中國(guó)是最成功渡過(guò)難關(guān)的國(guó)家

澎湃新聞 2026-06-30 20:22:33
11238 跟貼 11238

Transformer的八個(gè)爹媽?zhuān)缃穸荚谀模?/a>

機(jī)器之心Pro 2026-06-29 10:27:31
19 跟貼 19
AI當(dāng)老板，快給10家公司干破產(chǎn)了

量子位 2026-06-29 16:27:33
9 跟貼 9
Claude Fable 5省錢(qián)秘訣來(lái)了：調(diào)成Low檔比Opus更便宜

量子位 2026-06-11 16:23:55
3 跟貼 3
哈蘭德奉獻(xiàn)絕殺創(chuàng)紀(jì)錄主帥稱(chēng)其"當(dāng)今足壇最偉大射手"

紅星新聞 2026-07-01 07:48:30
1603 跟貼 1603
開(kāi)了一次就“頭暈”？看到機(jī)器上的英文單詞，他覺(jué)得自己被罵了

北青網(wǎng)-北京青年報(bào) 2026-06-28 14:48:24
1827 跟貼 1827
上海一百萬(wàn)豪車(chē)停在地庫(kù) 竟被"螞蟻搬家式”拆光賣(mài)了

大風(fēng)新聞 2026-07-01 15:38:10
706 跟貼 706
奧特曼預(yù)言與現(xiàn)實(shí)相差幾何？12個(gè)頂級(jí)模型“創(chuàng)業(yè)”一年，僅3個(gè)存活

鈦媒體APP 2026-04-03 17:11:08
1 跟貼 1
Anthropic被爆藏隱秘代碼，中國(guó)用戶(hù)會(huì)被特殊標(biāo)記？

機(jī)器之心Pro 2026-07-01 18:29:07
0 跟貼 0
告別硬件出海上一個(gè)十年，前安克CMO做了款A(yù)I時(shí)代的Memory產(chǎn)品｜硬氪專(zhuān)訪

36氪 2026-07-01 10:03:55
0 跟貼 0
當(dāng)?shù)厝A人講述法國(guó)高溫：中國(guó)空調(diào)一機(jī)難求，有人為搶購(gòu)空調(diào)打起來(lái)，安裝已排到9月

瀟湘晨報(bào) 2026-06-29 21:36:19
7466 跟貼 7466
飛書(shū)讓表格變成「AI同事」加入群聊，不打開(kāi)表就能用表

機(jī)器之心Pro 2026-07-01 13:37:18
0 跟貼 0
鎖在互聯(lián)網(wǎng)里的中國(guó)大模型

鈦媒體APP 2026-06-12 16:58:21
3 跟貼 3
從瘋狂翻表到群里直接@AI：飛書(shū)來(lái)了個(gè)新同事，把臟活累活全包了

愛(ài)范兒 2026-07-01 15:39:25
0 跟貼 0
金融AI武道大會(huì)開(kāi)賽！四道業(yè)務(wù)真題，出題人：猜不到最優(yōu)解

量子位 2026-07-01 15:43:32
0 跟貼 0
黃仁勛的物理AI ChatGPT時(shí)刻，正被這家中國(guó)公司的“流式多模態(tài)”接棒

智東西 2026-07-01 18:22:19
0 跟貼 0
海爾、美的、格力回應(yīng)歐洲空調(diào)需求激增

中國(guó)能源網(wǎng) 2026-06-30 09:44:04
188 跟貼 188
#藤森慶子贏得秘魯總統(tǒng)選舉 #秘魯總統(tǒng)選舉計(jì)票結(jié)果公布秘魯全國(guó)選舉程序辦公室29日公布的全部計(jì)票結(jié)

中國(guó)網(wǎng)資訊 2026-06-30 10:50:13
1 跟貼 1
哎哎哎，非得逼我走程序

牛牛看影視 2026-06-30 10:37:39
1 跟貼 1
金屬大黃蜂拼裝！314零件可動(dòng)！高端禮品超酷#模型拼裝 #大黃蜂模型

制造科技 2026-06-30 21:37:21
0 跟貼 0
巴基斯坦宣稱(chēng)擊落4架陣風(fēng)，印度一份招標(biāo)文件讓這個(gè)“戰(zhàn)果”露餡

王同學(xué)來(lái)了 2026-06-30 12:37:35
0 跟貼 0
定制家居龍頭：“為保大船不覆，只能忍痛請(qǐng)部分人下船”

南方都市報(bào) 2026-07-01 08:19:34
39 跟貼 39
今年我國(guó)首個(gè)臺(tái)風(fēng)來(lái)了

界面新聞 2026-07-01 16:45:31
139 跟貼 139
微軟計(jì)劃裁員數(shù)千人涉及銷(xiāo)售、咨詢(xún)、游戲部門(mén)

澎湃新聞 2026-07-01 15:24:27
48 跟貼 48
直線漲停！“牛市旗手”，突然拉升

證券時(shí)報(bào) 2026-07-01 11:13:34
146 跟貼 146
99萬(wàn)的陪伴機(jī)器人，優(yōu)必選不只是想單純賣(mài)硬件

鈦媒體APP 2026-07-01 18:16:21
0 跟貼 0
清華系團(tuán)隊(duì)給大模型織了一張“智能算力電網(wǎng)”

量子位 2026-05-29 10:44:47
0 跟貼 0
108零件拼機(jī)械魔鬼魚(yú)！胸鰭巡航+呼吸燈太酷了吧！#ROKR機(jī)械模型

制造科技 2026-06-29 13:54:19
0 跟貼 0
AI自己寫(xiě)代碼，訓(xùn)出1B端側(cè)「小鋼炮」-1

機(jī)器之心Pro 2026-05-26 14:32:09
0 跟貼 0
本來(lái)自毀程序都啟動(dòng)了，沒(méi)想到舔毛代碼優(yōu)先級(jí)更高

于姐姐娜娜 2026-06-29 14:53:28
0 跟貼 0
俄下令臨時(shí)關(guān)閉連通芬蘭等三國(guó)的多個(gè)鐵路口岸

環(huán)球網(wǎng)資訊 2026-07-01 05:59:25
409 跟貼 409
今天0時(shí)起，佛山站正式通車(chē)！佛山人可以直達(dá)京廣高鐵沿線城市了

南方都市報(bào) 2026-07-01 13:04:12
35 跟貼 35
具身智能Skill時(shí)刻！英偉達(dá)開(kāi)源機(jī)器人技能庫(kù)，Jim Fan：范式變了

量子位 2026-07-01 17:32:08
0 跟貼 0

坑完布克后，又要坑字母哥？NBA第一數(shù)據(jù)刷子，熱火千萬(wàn)不要上當(dāng)

唐韌

用產(chǎn)品思維解決難題

1499文章數(shù) 2043關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產(chǎn)

游戲

藝術(shù)

時(shí)尚

軍事航空

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

爆料一個(gè)新模型，平替 Opus 4.8 的國(guó)產(chǎn)之光來(lái)了

Claude Code被曝“植入木馬”識(shí)別中國(guó)用戶(hù)

副行長(zhǎng)借朋友名義貸款470萬(wàn) 400萬(wàn)自用70萬(wàn)給朋友用

副行長(zhǎng)借朋友名義貸款470萬(wàn) 400萬(wàn)自用70萬(wàn)給朋友用

賣(mài)球衣救子的門(mén)將，把德國(guó)撲出了世界杯

張凌赫：我連心疼你都隔著時(shí)差

新氧貸款：宣傳年化15%，實(shí)際頂格24%

半程收官 上汽集團(tuán)銷(xiāo)量突破200萬(wàn)輛

態(tài)度原創(chuàng)

洋房盛大交付，中海丨南海·叁號(hào)院獻(xiàn)映世界海岸的人居答案

2026最新解讀！KK對(duì)戰(zhàn)平臺(tái)官方盤(pán)點(diǎn)：仙劍奇?zhèn)b傳1完整劇情解析與遺憾彌補(bǔ) (1)

這5件2026屆畢業(yè)油畫(huà)作品，被中國(guó)美術(shù)學(xué)院美術(shù)館收藏

Meiinpsn的穿衣風(fēng)格，清新又叛逆

美伊代表前往多哈 談判方式出現(xiàn)"重大倒退"

半程收官上汽集團(tuán)銷(xiāo)量突破200萬(wàn)輛

美伊代表前往多哈談判方式出現(xiàn)"重大倒退"