![]()
「把GLM5.2往死里測(cè)」
Anthropic增加綠卡認(rèn)證后,最開(kāi)心是智譜,直接原地化身戰(zhàn)狼,高呼「前沿智能屬于所有人」,提前把專(zhuān)注Coding的GLM5.2發(fā)了。
除了刷一波國(guó)產(chǎn)品牌好感度外,還精準(zhǔn)狙擊了同樣在最近發(fā)布的Kimi 2.7 code。
只能說(shuō)Kimi 2.7 code還是發(fā)早了,不然高低能跟GLM5.2一起當(dāng)國(guó)產(chǎn)雙子星
不過(guò)話(huà)又說(shuō)回來(lái),雖然Anthropic是個(gè)畜生,但智譜能有今天的萬(wàn)億市值。Anthropic是最大功臣。
首先是Claude不當(dāng)人,Claude Code剛火沒(méi)多久就開(kāi)始瘋狂封號(hào),我用了Claude Code兩天就給我干沒(méi)了。
但廣大人民群眾又有用上先進(jìn)Claude Code的客觀(guān)需求,于是Claude Code+國(guó)產(chǎn)模型的特色用法應(yīng)用而生。
那一波里面發(fā)力最狠的是智譜市場(chǎng)。因?yàn)槲宜⒌降牟┲魅谕扑]Claude Code+智譜GLM Coding Plan。
智譜還專(zhuān)門(mén)整了一句話(huà)(npx @z_ai/coding-helper)直接配置。兩邊一起發(fā)力,爽吃Claude Code退出中國(guó)的大部分流量。
甚至到現(xiàn)在,智譜官方支持的Coding Agent工具里,排名第一的還是Claude Code。大伙公認(rèn)能發(fā)揮GLM 5.2能力的也是Claude Code。
你的文字還愛(ài)他
![]()
反觀(guān)Minimax/Kimi與階躍,雖然理論上可以用類(lèi)似的配置,但幾乎沒(méi)聲量。而且大伙配置完就很難有動(dòng)力去換新的。
不過(guò)我認(rèn)為在智譜Coding Plan瘋狂限購(gòu)的今天,Kimi仍有開(kāi)蹭Claude Code的空間。
另一個(gè)神來(lái)之筆是,智譜在推出GLM-5 時(shí)開(kāi)創(chuàng)性地發(fā)明了在Openrouter用匿名模型打榜的全新?tīng)I(yíng)銷(xiāo)方式。
首先是在OpenRouter上線(xiàn)了名為「Pony Alpha」的模型,完全免費(fèi)可用,性能牛逼,還整了一堆中推博主去猜是誰(shuí)。
大伙就配合說(shuō),哎呀,到底是DeepSeek-V4?還是Grok 4.2呢?
最后由智譜親自揭曉謎底,營(yíng)造一種「我操竟然是GLM-5,而且編程能力接近Claude Opus 4.5」的戲劇效果。
我都看到有人說(shuō)這是「中國(guó)AI的兩彈一星時(shí)刻」了。
在智譜以后,還有小米搞的「Hunter Alpha」模型、螞蟻搞的「大象」模型,炒作套路和智譜沒(méi)區(qū)別,都是先說(shuō)「臥槽有新模型,國(guó)外網(wǎng)友都說(shuō)好用」。DeepSeek-V4要發(fā)了?
等熱度高到一定程度,小米和螞蟻再出來(lái)說(shuō),別猜了,就是我。
這個(gè)套路還有繼續(xù)迭代,Kimi、Minimax、階躍,有一個(gè)算一個(gè),一發(fā)新模型就喜歡在OpenRouter上整免費(fèi)調(diào)用量,刷OpenRouter登頂?shù)募魏拦适隆?/strong>
中國(guó)大模型直接贏麻了。
類(lèi)似的炒作方式用一次還可以,但老搞匿名模型吸引大伙注意力是一種非常壞的行為。下次整點(diǎn)新活吧。
我還記得上市之前,智譜有7成收入來(lái)自為企業(yè)做本地部署大模型系統(tǒng),所以大伙都知道它是To B、To G大模型,當(dāng)時(shí)市場(chǎng)明顯更看好有C端收入的Minimax。(當(dāng)然現(xiàn)在Minimax的C端故事也講不下去了,我們之后再來(lái)復(fù)盤(pán)Minimax)
上一篇寫(xiě)Kimi提到過(guò)「楊圣和模型版本共存亡,版本重回模型層了,Kimi也如同滿(mǎn)月一樣照耀AI行業(yè)」
其實(shí)智譜也一樣。唐杰年初發(fā)內(nèi)部信說(shuō)要全面回歸基礎(chǔ)模型研究,并以Coding作為突破口。接著我們就看到,過(guò)去半年,編程牛逼了,于是智譜也牛逼了。
而在走多模態(tài)和C端產(chǎn)品的Minimax在模型能力上是顯著弱于這兩家的。
反觀(guān)智譜的多模態(tài)和產(chǎn)品雖然一坨,什么AutoGLM、AutoClaw、智譜清言、智譜清影、寫(xiě)作蛙,全是路邊,甚至我到最近才知道智譜有自己的編程客戶(hù)端Z Code。
但只要能卡到國(guó)內(nèi)編程模型第一的身位,產(chǎn)品愛(ài)咋折騰咋折騰。
不知道是不是智譜給國(guó)內(nèi)用戶(hù)的信心太足了,有些人不知道是串還是啥,都開(kāi)始發(fā)「智譜把OpenAI 和 Claude打到?jīng)]法IPO」,「Claude、OpenAI 迎來(lái)了智譜斬殺線(xiàn)」。
![]()
還有人問(wèn)智譜是啥公司,底下直接回他,「Anthropic母公司。」怪不得Anthropic這么牛逼,原來(lái)是「母憑子貴」。
![]()
還有什么「載入史冊(cè)!智譜突然發(fā)布核彈GLM-5.2引爆AI圈,Anthropic慌忙下架Fable 5暫避鋒芒!」看完我直接癱軟在地。
我看來(lái)Anthropic是有點(diǎn)怕智譜的。
扯了那么多淡,智譜GLM-5.2到底啥水平,雖然在里拿下過(guò)第一,但那是AI操縱跑的程序,它被人用的真實(shí)編程水平到底如何呢?
我和工程師凱一再次一起往死里測(cè)了下。
由于我不愛(ài)打分,主打直觀(guān)對(duì)比,所以同樣的任務(wù)選擇和K2.7 Code相比較。
K2.7 Code模型使用的測(cè)試環(huán)境(Harness)是 Kimi Code Cli,GLM-5.2 使用的測(cè)試環(huán)境(Harness)是 Opencode,均不安裝任何 Skill,完全讓模型 + Harness 自己發(fā)揮。
第一個(gè)任務(wù),我先找了篇介紹鵝腿阿姨時(shí)間的公眾號(hào)文章給它,讓他閱讀一下當(dāng)前目錄下的 PDF文件,根據(jù)事件并且發(fā)動(dòng)想象力制作一個(gè)可交互游戲,禁止做成純文字交互游戲。
首先,K2.7 Code讓我扮演阿姨賣(mài)鴨腿,GLM-5.2讓我扮演清北學(xué)子揭露阿姨邪惡面目,已經(jīng)高下立判了。
![]()
Kimi 做的游戲是讓我控制一個(gè)阿姨在頁(yè)面上走來(lái)走去,躲避監(jiān)管并且盡可能多地賣(mài)給他們鴨腿,中規(guī)中矩。
![]()
GLM則做了一個(gè)阿姨在天上發(fā)鴨腿和毒鴨腿,我在下面接的游戲。游戲邏輯有嚴(yán)重 BUG,我得吃 15 個(gè)毒鴨腿才能過(guò)關(guān)。
但吃一個(gè)鴨腿就掉一條命,而我只有三條命,雖然 GLM 讓我伸張正義,但 GLM 給我的生命力只能讓我殉道。
正義遲到了。
另外,沖刺或是用鍵盤(pán)控制走路也做不到,一用鍵盤(pán)人物就會(huì)有重影,顯然鍵盤(pán)和鼠標(biāo)在左右腦互搏。
我還想考考兩個(gè)模型對(duì)風(fēng)格的理解能力,于是讓他倆給游戲做成像素風(fēng),并且添加一些玩法。
這一環(huán)自由發(fā)揮后就逐漸有問(wèn)題了,正好直接開(kāi)始考驗(yàn)他倆修Bug 的水平。
這是Kimi一輪修復(fù)的結(jié)果,美術(shù)有魂斗羅的感覺(jué),可惜游戲做的一坨,完全不知所云:
![]()
而GLM修復(fù)完直接給我干外太空去了,而且還加入了技能選擇環(huán)節(jié),但屏幕不斷亂晃的問(wèn)題仍然沒(méi)有解決:
![]()
只能說(shuō)在有更多指令后,GLM和Kimi逐漸拉開(kāi)了差距。
那我們接著給指令:根據(jù)這個(gè)故事,改成黑暗之魂 like 的游戲。除此之外沒(méi)給任何提示,就讓模型自己思考對(duì)黑暗之魂的理解。
![]()
Kimi做的讓人難以看懂,也不知該如何評(píng)價(jià):
![]()
GLM 做的湊合能看了,魂該有的要素比 Kimi 多,還有對(duì)話(huà)劇情。不過(guò)游戲 Bug 也多。
綜合來(lái)講還是GLM 更勝一籌。
![]()
html或多或少有點(diǎn)炒作了,我讓他們用正兒八經(jīng)的像素游戲制作工具嘗試一下。
指揮模型用Godot 4(做像素游戲的常見(jiàn)引擎)做技術(shù)展示加上Python 生圖,結(jié)果發(fā)現(xiàn)做出來(lái)的東西都運(yùn)行不了。
看來(lái)兩家模型都沒(méi)有使用游戲引擎的知識(shí),即使能用Python生圖,也沒(méi)法放進(jìn)引擎里。
![]()
我又讓他們?nèi)プ鰪堁┓蹇炫堋?/p>
首先Kimi就沒(méi)理解我在說(shuō)什么,做了個(gè)躲避作業(yè)怪,跟我說(shuō)的收集雪糕的主題完全不同。
而且游戲也完全沒(méi)法玩,跑 5 秒就會(huì)卡住,可能又犯了讓人難以知道玩法的老毛病。
![]()
GLM 的視覺(jué)更好一點(diǎn),同時(shí)還實(shí)現(xiàn)了跳遠(yuǎn)和蹲下躲避等元素。
![]()
我們還找了 Codex 教練進(jìn)來(lái)打樣。只能說(shuō)Codex還是真神,因?yàn)楦鐐兊拙€(xiàn)最低的。
Kimi和GLM都怕版權(quán)問(wèn)題沒(méi)找巧樂(lè)茲和張雪峰圖片,即使我強(qiáng)烈要求,他們也不去。但Codex真把神請(qǐng)回來(lái)了,同時(shí)游戲還原度也是最高的。
![]()
最后忘不了我們的愛(ài)冕環(huán)節(jié)。
我讓他們仨去調(diào)研一下市面上的視頻Agent產(chǎn)品,其中重點(diǎn)關(guān)注LibTV,盡自己所能做一款類(lèi)似LibTV的視頻Agent。
實(shí)現(xiàn)下還是GLM完勝,甚至比Codex還要好。
當(dāng)然他們?nèi)齻€(gè)都沒(méi)有實(shí)現(xiàn)完整功能,都只畫(huà)了個(gè) UI,得接入API才能實(shí)現(xiàn)生圖功能。
先看Kimi做的,不懂哥們?cè)诟陕铮翢o(wú)學(xué)習(xí)和參考。真用你肯定完蛋了。
![]()
Codex 做的也有一股老人味兒。好處是理解了LibTV的本質(zhì)是一句話(huà)生成短劇。
![]()
最后看了GLM做的我直接跪下了。有劇本框、有分鏡版,還分了五宮格,甚至連新版本的Agent模式都搞來(lái)了,調(diào)研能力碾壓大部分產(chǎn)品經(jīng)理。
仔細(xì)看,左上角還發(fā)明了一個(gè)叫LibNano V3的生圖模型,非常符合人設(shè)。
![]()
如果當(dāng)時(shí)有GLM,整個(gè)TapNow完全就順手的事兒。
只能說(shuō)LibTV+GLM5.2可能要統(tǒng)治世界了。
當(dāng)然,如果你不能像冕一樣統(tǒng)治世界,那也可以來(lái)統(tǒng)治我們的網(wǎng)吧黑客松,多吃幾桶泡面葬AI給你辦加冕典禮。
(本文封面由ChatGPT 生成,純?nèi)斯?xiě)作)
??
歡迎訂閱我們的Substack
funeralai.substack.com
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.