无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

<span id="lpeuf"></span>

<li id="lpeuf"><dfn id="lpeuf"></dfn></li>

<tr id="lpeuf"><strike id="lpeuf"></strike></tr>

<li id="lpeuf"><legend id="lpeuf"><tr id="lpeuf"></tr></legend></li>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

頂流里最快！智譜，你是在「噴」代碼吧

2026-05-22 11:01:28　來源: 量子位

北京舉報

0

分享至

金磊發自凹非寺
量子位 | 公眾號 QbitAI

AI啊，你這速度簡直是在噴射啊！

仔細看，千萬別眨眼：

視頻地址：
https://mp.weixin.qq.com/s/Wn1-SzjpEkQLTyZnJKDRwg

這么多的代碼，直接就是“啪的一下”噴出來的感覺。

之前AI寫代碼像CPU渲圖一樣，是一點一點打出來；但這個AI寫代碼，更像GPU：

這么快生成的代碼，能好用嗎？

答案是可以的：

這就是智譜剛剛新出的高速版API——GLM-5.1-highspeed。

按照官方的說法，這個旗艦版模型的API，是目前頂流模型里最快的，已經達到了400 tokens/s！

而且這個GLM-5.1啊，雖然已經出了一個多月了，但現在還是開源模型里Coding最強的那一個：

那么接下來，老規矩，一波實測走起~

一手實測GLM-5.1-highspeed

AI寫代碼像開了倍速

我們先來做一個比開頭更加復雜的例子，Prompt是這樣的：

做一個網頁，畫面中心是一個會呼吸的星云；用戶點擊播放后，粒子會隨著模擬音頻節奏擴散、聚合、變色；旁邊還要有幾個可調參數，比如速度、密度、拖尾、光暈強度。

視頻地址：
https://mp.weixin.qq.com/s/Wn1-SzjpEkQLTyZnJKDRwg

同樣的，如此多行的代碼，AI在思考了十幾秒后，依舊是一口氣給噴出來的。

這類任務的難點在于，它要同時處理前端結構、Canvas 動畫、狀態管理、視覺參數、交互邏輯，還要讓效果看起來不至于太low。

從結果上來看，確實也是達到了Prompt的要求：

像跟設計師坐在同一塊畫布前

第二個測試更有意思。

我們在上一個代碼基礎上，繼續提出更多要求：

“這個波紋再快一點。”

“光暈顏色偏暖一些。”

“粒子散開時別那么硬，柔一點。”

“背景不要全黑，稍微有一點深藍層次。”

視頻地址：
https://mp.weixin.qq.com/s/Wn1-SzjpEkQLTyZnJKDRwg

首先，我們的這些指令都是比較模糊的，并非像“把第42行的speed從0.6改成1.2”這么精確，所以模型需要先精準地理解我們的意圖。

其次，由于GLM-5.1-highspeed的速度夠快，我們做項目的體感都不一樣了——

更像是和AI坐一起，一塊盯著畫布調參。

這也是高速API容易被低估的地方，和AI一起共事做項目，現在更接近實時的感覺了。

讓模型當游戲導演

第三個測試，我們把場景再往前推一步。

如果模型足夠快，它能不能在游戲里實時改變世界？

比如做一個小型2D游戲：

玩家控制一個角色在3D地圖里移動，場景中有障礙、敵人、道具、天氣、光照和隨機事件。有對話框可以輸入文字，場景會根據輸入的文字實時改變。

然后我們不給模型固定腳本，而是不斷發出類似導演指令：

“下雪”、“下雨”、“爆炸”……

視頻地址：
https://mp.weixin.qq.com/s/Wn1-SzjpEkQLTyZnJKDRwg

這類測試比寫網頁更刁鉆。

因為模型要理解游戲狀態、代碼結構、交互邏輯，還要判斷什么改動會影響體驗。

而高速API讓此前因延遲而難以成立的產品形態變得可行，例如模型在游戲中實時改變游戲世界狀態。

當然，這里還有很多工程問題沒解決，比如穩定性、安全邊界、狀態一致性、成本和并發。但至少從速度維度看，400 tokens/s級別的API已經讓這類想象不再只停留在 PPT 里。

10秒處理萬字內容

第四個實測，我們回到內容行業。

我們用AI讀取一份萬字長文的內容素材，讓它一口氣執行下面的內容：

提煉3句最吸睛的海報主標題；
生成6條15字內短視頻口播文案；
輸出三套產品宣傳語（適合官網首頁）；
生成可直接發公眾號的文案（800字）；
最后生成JSON格式匯總所有內容。

視頻地址：
https://mp.weixin.qq.com/s/Wn1-SzjpEkQLTyZnJKDRwg

只花了10秒鐘！

而且效果也是依舊穩穩地拿捏到位了：

在AI的速度上來之后，讓人類更快地進入到了判斷的環節；由此，人和AI的協作更接近來回打磨了。而非一次性下單。

Agent進入快時代

如果只看400 tokens/s這個數字，我們可能很容易把它理解成模型變小了，所以跑得快。

但實際上，GLM-5.1-highspeed更值得關注的點在于，它主打旗艦模型高速版，而不是一個單純追求低延遲的小模型。

這背后靠的是系統工程。

智譜GLM團隊與TileRT團隊聯合打造GLM-5.1-highspeed，在推理引擎、調度系統和底層基礎設施三個層面做了優化：

推理引擎針對GLM-5.1架構特點重寫核心推理路徑，調度系統通過動態批處理、請求合并、KV緩存調度等方式降低高并發場景尾延遲，基礎設施層面則圍繞推理集群部署、網絡鏈路和負載均衡做協同優化。

簡單理解，大模型推理不是GPU算一下就完事。

真實線上系統里，請求怎么排隊，怎么合并，KV 緩存怎么調度，多卡之間怎么通信，網絡鏈路怎么負載均衡，都會影響最終延遲。

TileRT的思路更進一步。

它把推理調度單元從傳統operator/kernel進一步下沉到tile級別，通過編譯期靜態編排、常駐GPU的persistent Engine Kernel、減少host調度和跨算子同步等方式，壓縮推理過程里的調度、搬運與同步開銷。

用一句更通俗的話，可以這樣理解：

過去像一群工人每搬一塊磚都要等工頭發一次指令；現在提前把路線、分工、節奏排好，讓工人持續在工地里流水線協作。

大模型推理速度的提升，很多時候不只來自更強的芯片，也來自對系統里每一個空轉環節的壓榨。

高速API的競爭，本質上是模型能力、推理引擎、調度系統和基礎設施的綜合戰。

當然，速度不能被神化。

一個API真要進入生產環境，還要看模型質量、穩定性、成本、上下文能力、工具調用可靠性、并發能力，以及復雜任務里的錯誤率。

尤其是400 tokens/s這樣的速度數字，也需要在更多任務、更多時段、更多并發條件下持續驗證。

但至少從這次測試可以看到一個明確趨勢：

國產大模型API的競爭，正在從能不能答得好，進一步走向能不能又快又穩地干活。

GLM-5.1-highspeed的意義，也正在這里。

它讓我們看到，當旗艦模型能力和高速推理系統疊在一起，AI Agent的體驗會出現一個很直觀的變化：等待變少，反饋變密，任務推進更連續。

Coding時代，速度是爽點。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

全球首次單機降服萬億巨模DeepSeek-V4！RL后訓練框架Orbit開源！

機器之心Pro 2026-05-28 11:48:03
18 跟貼 18
消耗1830億token，Meta用AI把數學教材翻譯成了一個超大Lean庫

機器之心Pro 2026-05-29 13:43:30
3 跟貼 3

DiffusionOPD：復旦聯合通義萬相提出擴散模型在線策略蒸餾新范式

機器之心Pro 2026-05-29 16:23:04
1 跟貼 1

狗子：不好觸發底層代碼了

娛圈小宇宙 2026-05-29 20:29:47
13 跟貼 13
20美元內兩個被忽視的必備工具

報錯免疫體 2026-05-31 01:06:09
0 跟貼 0

F-22戰斗機啟動引擎，一股青煙噴涌而出

裝甲鏟史官 2026-01-25 12:20:23
0 跟貼 0

美軍越野車涉水測試，引擎完全淹沒照樣行駛

裝甲鏟史官 2026-04-29 11:51:27
858 跟貼 858
女子吃了隔夜見手青連撞兩輛車，回家后還對著空氣輔導作業

南陽日報 2026-05-30 17:19:03
352 跟貼 352

孩子去“光頭強家”，對著床上被子一頭栽下去，沒想到是模型！

笑出豬叫的趣聞閣 2026-05-26 17:08:43
1 跟貼 1
美國B52戰略轟炸機起飛畫面：八個引擎同時開加力，冒出黑煙滾滾

大國之盾 2026-05-29 13:12:12
0 跟貼 0
當胡彥斌1個月寫出APP，AI時代已經撲面而來

華爾街見聞官方 2026-05-31 11:15:12
0 跟貼 0
面試官：說一下 Agent 的常見范式

新浪財經 2026-05-31 10:41:28
0 跟貼 0
藏在《星際航行者》代碼里的秘密：第六次重啟，神秘條件觸發

字節漫游指南 2026-05-31 03:38:30
0 跟貼 0
C-130引擎模型！可變槳！可調速！收藏級還原太酷了#航模

制造科技 2026-05-29 08:05:14
0 跟貼 0
院長等3人學術造假南開大學通報

界面新聞 2026-05-30 19:49:22
5786 跟貼 5786
AI自己寫代碼，訓出1B端側「小鋼炮」-1

機器之心Pro 2026-05-26 14:32:09
0 跟貼 0
美11名頂尖科學家接連出事！解密400份UFO檔案，被外星人帶走了？

紀中百大事 2026-05-31 09:41:49
1 跟貼 1
你花了四年學編程，卻要用一輩子補寫作

一隅安穩 2026-05-31 01:29:48
0 跟貼 0
大眾輪胎開裂投訴超5千條！投訴平臺將車主輪胎送檢：開裂不影響安全及壽命

快科技 2026-05-31 09:13:10
0 跟貼 0
把對象當代碼測，感情遲早崩

晚風也遺憾 2026-05-31 00:47:37
0 跟貼 0
龍蝦軍團有了最強「視力」！一眼看圖直接寫代碼-1

機器之心Pro 2026-04-02 16:56:32
0 跟貼 0
AReaL v1.0開源，智能體強化學習「一鍵接入」

機器之心Pro 2026-03-05 14:46:18
0 跟貼 0
本田高管：IndyCar為粉絲造V12？成本與定位都不允許

賽場速報局 2026-05-31 02:16:17
0 跟貼 0
10英尺鐵圈怪獸：Dynasphere單輪汽車的瘋狂設計

林間小溫柔 2026-05-31 01:16:59
0 跟貼 0
454大引擎加身，這輛1968年GMC C1500有點不一般

林間小溫柔 2026-05-31 01:27:23
0 跟貼 0
男人不自量力，上演速度與激情，看后面孩子就知道速度

搞怪一族的歡樂窩 2026-05-31 09:49:40
1 跟貼 1
"香會"現場！他們排隊與中方代表打招呼

看看新聞Knews 2026-05-31 01:05:40
36 跟貼 36
媒體：香會變調美國在臺海問題上收聲

環球網資訊 2026-05-30 20:40:20
48 跟貼 48
智譜逆勢暴漲13.54% 上市已累計漲幅接近13倍

每日經濟新聞 2026-05-28 23:20:15
0 跟貼 0
建德簽了一位“頂流”！

我們大杭州 2026-05-31 11:09:42
0 跟貼 0
智譜落地ZCube，讓同樣的GPU多干15%的活

機器之心Pro 2026-05-21 11:33:06
0 跟貼 0
打工人，將負鼠表情包捧成頂流 |【經緯低調分享】

經緯創投 2026-05-31 11:47:10
0 跟貼 0
內娛最慘頂流非蔡徐坤莫屬了

時尚韋小寶一 2026-05-28 19:46:10
0 跟貼 0
奧特曼預言與現實相差幾何？12個頂級模型“創業”一年，僅3個存活

鈦媒體APP 2026-04-03 17:11:08
0 跟貼 0
人類感知系統架構圖佛學與神經科學的驚人撞車

湯湯是小生活家 2026-05-30 06:02:03
0 跟貼 0
鮮奶雪糕包裝印“不加一滴水”配料表首位竟是水廠家：系舊包裝，已改名“一滴水”

上游新聞 2026-05-29 18:03:05
1866 跟貼 1866
湖北省召開全省領導干部會議

新京報 2026-05-30 13:13:05
10 跟貼 10
字節的“掌上明珠”，讓好萊塢徹底不淡定了

金錯刀 2026-05-31 10:45:06
0 跟貼 0
人民直擊｜三問張家口風電項目1.9億“天價”補償后續

人民資訊 2026-05-31 09:15:09
453 跟貼 453
AI原生時代，讓世界適應Agent而非教AI做人 | 港大黃超@AIGC2026

量子位 2026-05-31 11:56:06
0 跟貼 0

陪玩陪睡都是毛毛雨！王思聰前女友曝“丑聞”，王家徹底坐不住了

陪玩陪睡都是毛毛雨！王思聰前女友曝“丑聞”，王家徹底坐不住了

一曲一場談

2026-04-09 13:56:12

4-2橫掃張本智和！19歲國乒天才連斬5大世界名將，一戰封神

4-2橫掃張本智和！19歲國乒天才連斬5大世界名將，一戰封神

小琴動漫

2026-05-30 14:30:26

被判立即向俄央行賠償約2000億歐元，歐洲清算銀行上訴

被判立即向俄央行賠償約2000億歐元，歐洲清算銀行上訴

界面新聞

2026-05-30 17:30:48

地鐵偶遇頂級素顏，這才是真正的天生麗質！

地鐵偶遇頂級素顏，這才是真正的天生麗質！

白宸侃片

2026-05-29 17:13:22

“還沒當婆婆，就開始嫉妒兒媳了！”家長因半個雞蛋破防，被群嘲

“還沒當婆婆，就開始嫉妒兒媳了！”家長因半個雞蛋破防，被群嘲

妍妍教育日記

2026-05-29 08:30:09

降價2萬！上汽大眾官宣：全新SUV，價格下調

降價2萬！上汽大眾官宣：全新SUV，價格下調

科技堡壘

2026-05-31 09:34:47

終于有專家看不下去了：電車越來越重，又不交稅，路撐不住了！

終于有專家看不下去了：電車越來越重，又不交稅，路撐不住了！

互聯網.亂侃秀

2026-05-31 11:16:19

趙建：數據塌了？

西京研究院

2026-05-30 17:13:21

外籍游客在浙江一景區水源地洗澡？涉事景區辟謠：照片非景區，閉園已超一年

外籍游客在浙江一景區水源地洗澡？涉事景區辟謠：照片非景區，閉園已超一年

上游新聞

2026-05-30 22:14:05

“本降專”第一人？演員林沐然從中戲轉入大專，網友發現了華點

“本降專”第一人？演員林沐然從中戲轉入大專，網友發現了華點

聽心堂

2026-05-30 10:31:54

蔣友青：我不認識蔣萬安，平時完全沒來往！他們之間發生了什么？

蔣友青：我不認識蔣萬安，平時完全沒來往！他們之間發生了什么？

凡人侃史

2026-05-12 14:37:12

國家統計局：5月份，制造業采購經理指數（PMI）為50.0%

國家統計局：5月份，制造業采購經理指數（PMI）為50.0%

每日經濟新聞

2026-05-31 09:36:47

韓國談抗美援朝：超400萬人犧牲，中國并非援助，而是戰爭主力!

韓國談抗美援朝：超400萬人犧牲，中國并非援助，而是戰爭主力!

興趣知識

2026-05-31 00:56:50

美女飛行員突破“12G”的瓜

吃瓜體

2026-05-25 16:16:43

周朝國都西岐，商朝的國都朝歌，現如今這兩大名城位于什么位置？

周朝國都西岐，商朝的國都朝歌，現如今這兩大名城位于什么位置？

銘記歷史呀

2026-05-31 00:52:02

演員劉紅梅去世，終年61歲！

半島晨報

2026-05-30 11:14:47

塔帥：馬杜埃凱那球完全能判點；恭喜巴黎，他們是支超級強隊

塔帥：馬杜埃凱那球完全能判點；恭喜巴黎，他們是支超級強隊

懂球帝

2026-05-31 04:29:20

最高院：提供 “口交” “肛交”等進入式性服務，是否屬賣淫行為？

最高院：提供 “口交” “肛交”等進入式性服務，是否屬賣淫行為？

周軍律師聊案子

2026-04-21 09:50:16

肺癌來臨，手部先知，若手部出現3個變化，別大意，盡早檢查

肺癌來臨，手部先知，若手部出現3個變化，別大意，盡早檢查

熊貓醫學社

2026-05-31 11:30:03

正當防衛被判死刑，槍決前6分鐘被最高法緊急叫停，董偉案始末

正當防衛被判死刑，槍決前6分鐘被最高法緊急叫停，董偉案始末

易玄

2026-05-25 01:45:09

追蹤人工智能動態

12712文章數 176474關注度

往期回顧全部

科技要聞

戴爾諾基亞又回來了！AI重估老牌科技公司

頭條要聞

羅馬尼亞遭襲梅德韋杰夫：歐盟已進入與俄羅斯的戰爭

頭條要聞

羅馬尼亞遭襲梅德韋杰夫：歐盟已進入與俄羅斯的戰爭

體育要聞

阿森納用最悲壯的方式，成就了巴黎王朝

娛樂要聞

賈玲最新動作！侯明昊給虞書欣抬轎！

財經要聞

醫學首席轉崗搞科技，A股科技股遭遇巨震

汽車要聞

900V+3.2秒破百領克10+&領克10上市16.99萬元起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

家居

健康

旅游

軍事航空

數碼要聞

AMD Radeon RX 9070 GRE顯卡全球市場起價偷跑：549美元

家居要聞

云棲舒展如流云

蜂鳥餐椅線面交錯
古老而持久石影扶手椅
生與命相依舊公寓改造

嘗試干細胞療法如何避免踩坑？

旅游要聞

英媒：“極致中國化”助推入境旅游熱潮

軍事要聞

美防長參加"香會" 就美中關系最新表態

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<tr id="oykq3"><option id="oykq3"><object id="oykq3"></object></option></tr>

<pre id="oykq3"><noframes id="oykq3">