網易首頁 > 網易號 > 正文 申請入駐

智譜AI,徹底爆了!開源模型GLM-4.5,能力全面SOTA

0
分享至

昨日,智譜發布了新一代旗艦模型GLM-4.5,引發了全球AI圈的關注。作為中國大模型領域的“國家隊”代表,他們之前還被OpenAI視為主要競爭對手。

本次發布的GLM-4.5模型,據說在推理、代碼、智能體綜合能力方面,達到開源模型SOTA水平;在真實場景Agentic Coding對比評測中,實測結果國內最佳。并且GLM-4.5在Hugging Face與ModelScope平臺同步開源,模型權重遵循MIT License。

01

綜合性能SOTA,殺入全球大模型第一梯隊


GLM-4.5融合更多復雜推理、代碼和智能體等多種通用能力并取得技術突破,首次在單個模型中實現將推理、編碼和智能體能力原生融合,以滿足智能體應用的復雜需求。

根據最具有代表性的12個評測,即MMLU Pro、AIME24、MATH 500、SciCode、GPQA、HLE、LiveCodeBench、SWE-Bench、Terminal-bench、TAU-Bench、BFCL v3和BrowseComp。綜合平均分,GLM-4.5取得了全球模型第三、國產模型第一,開源模型第一。

GLM-4.5參數量為DeepSeek-R1的1/2、Kimi-K2的1/3,但同樣在多項標準基準測試中表現得更加出色,這得益于GLM模型的更高參數效率。在衡量模型代碼能力的SWE-Bench Verified 榜單上,GLM-4.5系列位于性能/參數比帕累托前沿,這表明在相同規模下,GLM-4.5系列實現了最佳性能。

在性能優化之外,GLM-4.5系列也在成本和效率上實現突破,由此帶來遠低于主流模型定價:API調用價格低至輸入0.8元/百萬tokens,輸出2元/百萬tokens。

同時,高速版本實測生成速度超過100 tokens/秒,支持低延遲、高并發的實際部署需求,兼顧成本效益與交互體驗。

據官方介紹,GLM-4.5系列能夠勝任全棧開發任務,編寫較為復雜的應用、游戲、交互網頁。

在實際應用當中,GLM-4.5模型能力和體驗究竟如何呢?下面就跟隨K哥一起上手實測。

02

用GLM-4.5手搓一個智能體后,

我卸載了所有AI編程工具

正好這兩天在參加WAIC2025(世界人工智能大會),我想做個逛展智能體,來幫助我從100場論壇、800個展臺當中挑選出我最感興趣的,并且制定逛展計劃,這個任務就交給GLM-4.5了。我們使用模型的原生能力,來開發這個功能和交互都相對復雜的Agent。

先打開網站:Z.ai

完整注冊后,在左上角選擇模型GLM-4.5。

在輸入框下方看到:AI PPT、全棧開發、寫代碼、幫我寫、搜信息等,選擇「全棧開發」。

在讓AI幫你開發之前,需要整理好需求,我們要開發的智能體要能夠基于WAIC2025的信息,按照用戶的要求進行檢索、制定逛展計劃,界面交互簡潔友好。

還要解決數據來源的問題,我把“WAIC2025媒體指南”電子版上傳到Z.ai。

然后把梳理好的需求,整理成提示詞,如下:

開發一個“WAIC2025逛展智能體”,功能點如下:

1、根據用戶的要求檢索展會信息...

2、基于用戶輸入,調用大模型GLM-4.5能力,理解用戶需求,根據“WAIC2025的信息”制定規劃逛展計劃...

3、提醒功能:根據制定的計劃,在論壇或活動開始前1小時彈窗提醒...

4、界面設計...

將提示詞輸入后,開發工作就開始了。界面左側是編碼過程,右側是程序預覽界面。

整個編碼任務被拆分成4個部分:分析圖片數據和構建會展信息庫、設計界面布局組件、實現會展信息檢索、實現逛展計劃、優化界面與交互。

首先執行的是:分析圖片數據和構建會展信息庫,模型能夠根據圖片內容構建會展信息數據庫。

接下來,實現信息檢索、制定計劃的功能,這部分需求描述比較明確,所以實現起來比較快。

功能實現完畢,最后一步就是對界面布局交互的進一步優化,現在已經可以在右邊看到界面效果了。

最后是項目總結,到這一步項目就算是執行結束了,整個過程都是基于GLM-4.5模型的原生能力生成的,真正實現了張張嘴就能編程。

下面就來看看逛展智能體的運行效果吧,點擊左上方的小眼睛圖標,就可以打開程序鏈接。

界面是我喜歡的賽博朋克風格,檢索功能體驗也十分流暢。

再體驗下制定計劃功能,輸入關鍵字、選擇日期,就可以生成一份專屬逛展計劃。

Z.ai還支持代碼工程打包下載、代碼發布,發布后就可以在線使用。

貼上這個智能體的鏈接,歡迎大家體驗:

https://f0vbx6ngdgk1-deploy.space.z.ai

我之前嘗試過Cursor、Codex等AI編程工具,體驗完GLM-4.5的原生編程能力,我不會再考慮其它工具了,它能夠完成我的大部分智能體開發需求,而且不需要你懂編程,只要描述清楚需求,剩下的交給它就行了。

03

GLM-4.5為什么這么強?源自技術創新

你一定好奇,為什么GLM-4.5能力這么強,下面我們看下模型的架構與技術實現。

GLM-4.5采用混合專家(MoE)架構,包括GLM-4.5:總參數量3550億,激活參數為320億;GLM-4.5-Air:總參數量1060億,激活參數為120億。

GLM-4.5和GLM-4.5-Air均支持混合推理模式,提供兩種模式:用于復雜推理和工具使用的思考模式,以及用于即時響應的非思考模式。模型都是在15萬億token的通用數據上進行了預訓練,然后在代碼、推理、智能體等領域的8萬億token數據上進行了針對性訓練,最后通過強化學習進一步增強了模型的推理、代碼與智能體能力。

GLM-4.5真正實現了高速、低成本。不僅API調用價格便宜,還支持低延遲、高并發的實際部署需求,兼顧成本效益與交互體驗。

無論你是資深程序員還是編程小白,都能通過GLM-4.5快速構建應用,讓技術服務于創意,讓創意推動技術進步;“人人都是開發者”正在成為現實。

最后,給大家送個福利,智譜正推出“50塊就能包月爽用GLM-4.5,調用量無上限”的活動,名額有限,不妨試試。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
美海軍上將:美國正進行二戰結束以來最大規模潛艇建造,“馬薩諸塞”號新型攻擊核潛艇上月已正式入列

美海軍上將:美國正進行二戰結束以來最大規模潛艇建造,“馬薩諸塞”號新型攻擊核潛艇上月已正式入列

極目新聞
2026-04-23 10:57:06
最新!深圳短時停車免費直接延長!5月起正式執行普通車能省幾千

最新!深圳短時停車免費直接延長!5月起正式執行普通車能省幾千

輝哥說動漫
2026-04-24 09:05:59
曝中國槍迷赴英看阿森納比賽被捕!坐了9年牢 獄警拿1-5來羞辱他

曝中國槍迷赴英看阿森納比賽被捕!坐了9年牢 獄警拿1-5來羞辱他

風過鄉
2026-04-23 17:16:10
《妻子的浪漫旅行》45歲金莎宣布備孕,3年前已保存凍卵,太拼了

《妻子的浪漫旅行》45歲金莎宣布備孕,3年前已保存凍卵,太拼了

娛君墜星河
2026-04-24 10:20:37
我資助的女同桌當大官,來公司視察她當眾問我:你還欠我頓飯

我資助的女同桌當大官,來公司視察她當眾問我:你還欠我頓飯

小陸搞笑日常
2026-04-23 17:30:58
皇馬看到爭冠希望!6戰全勝+征服諾坎普,巴薩兩大核心傷缺

皇馬看到爭冠希望!6戰全勝+征服諾坎普,巴薩兩大核心傷缺

奧拜爾
2026-04-24 10:16:26
直播現場怒罵CEO五分鐘!提詞器都沒這段,高管臉都綠了

直播現場怒罵CEO五分鐘!提詞器都沒這段,高管臉都綠了

不寫散文詩
2026-04-23 19:08:22
張敬軒被抵制原因被扒!“反骨”言論僅冰山一角,謝霆鋒也被牽連

張敬軒被抵制原因被扒!“反骨”言論僅冰山一角,謝霆鋒也被牽連

以茶帶書
2026-04-23 14:11:56
伊朗中央銀行:霍爾木茲海峽通行費已入賬

伊朗中央銀行:霍爾木茲海峽通行費已入賬

每日經濟新聞
2026-04-24 08:27:08
芯片松綁4個月,中國一塊也沒買,中國不急美國急,形勢反轉了

芯片松綁4個月,中國一塊也沒買,中國不急美國急,形勢反轉了

王新喜
2026-04-23 20:37:56
演唱會突然取消!主辦方:女歌手買不到高鐵票和恐飛

演唱會突然取消!主辦方:女歌手買不到高鐵票和恐飛

南方都市報
2026-04-24 10:57:15
內存漲價了,安卓終于想起要管流氓 APP 了

內存漲價了,安卓終于想起要管流氓 APP 了

互聯網放大鏡
2026-04-23 13:34:06
2場三分17中5!火箭G3投籃是關鍵!申京發聲,這是說給謝潑德聽的

2場三分17中5!火箭G3投籃是關鍵!申京發聲,這是說給謝潑德聽的

熊哥愛籃球
2026-04-24 12:58:56
世錦賽首場爆冷!丁俊暉收獲大利好,外媒支招,淘汰趙心童有戲!

世錦賽首場爆冷!丁俊暉收獲大利好,外媒支招,淘汰趙心童有戲!

曹說體育
2026-04-24 11:01:19
90年代下崗潮楊成武將軍直言:讓下崗工人自生自滅,我心里不同意

90年代下崗潮楊成武將軍直言:讓下崗工人自生自滅,我心里不同意

明月清風閣
2026-04-23 11:40:14
“全美最受歡迎的漢堡”要來北京了!劉嘉玲、奧巴馬都曾被“圈粉”!網友催開業…

“全美最受歡迎的漢堡”要來北京了!劉嘉玲、奧巴馬都曾被“圈粉”!網友催開業…

北京商報
2026-04-21 21:54:51
我在中東教漢語,娶了三個本地女孩,雖然年入百萬,卻并不幸福

我在中東教漢語,娶了三個本地女孩,雖然年入百萬,卻并不幸福

千秋文化
2026-04-20 19:55:30
我在日本生活了15年,娶過三任妻子,日本女人大多數都很物質

我在日本生活了15年,娶過三任妻子,日本女人大多數都很物質

千秋文化
2026-04-22 20:21:49
爆大冷!西部豪強轟然倒下:全場狂歡慶祝,戈貝爾鎖死約基奇

爆大冷!西部豪強轟然倒下:全場狂歡慶祝,戈貝爾鎖死約基奇

體壇小李
2026-04-24 12:37:36
火箭后悔嗎?多森姆25+9創7新高成板凳之王 斯通又錯過頂級后場

火箭后悔嗎?多森姆25+9創7新高成板凳之王 斯通又錯過頂級后場

顏小白的籃球夢
2026-04-24 12:26:46
2026-04-24 13:08:49
技術領導力 incentive-icons
技術領導力
Mr.K,出過書,做過CTO
91文章數 594關注度
往期回顧 全部

科技要聞

剛剛,DeepSeek-V4 預覽版發布 百萬上下文

頭條要聞

特朗普:不會對伊朗動用核武器 已從軍事上拿下了伊朗

頭條要聞

特朗普:不會對伊朗動用核武器 已從軍事上拿下了伊朗

體育要聞

里程碑之戰拖后腿,哈登18分8失誤

娛樂要聞

王思聰被綠!戀愛期間女友被金主包養

財經要聞

19家企業要"鋁代銅",格力偏不

汽車要聞

全景iDrive 續航近800km 新款寶馬7系/i7亮相

態度原創

藝術
健康
旅游
數碼
本地

藝術要聞

16幅 佐恩高清油畫 | 瑞典著名畫家

干細胞如何讓燒燙傷皮膚"再生"?

旅游要聞

達州大竹:農文旅融合添活力 “農事親子樂園”火爆出圈

數碼要聞

專訪巴可王紅波:顯示行業競爭下半場,深耕八大垂直行業與構建共贏生態

本地新聞

云游中國|逛世界風箏都 留學生探秘中國傳統文化

無障礙瀏覽 進入關懷版