![]()
編輯|+0、杜偉
僅僅一個月后,阿里又帶著最強旗艦?zāi)P蜌⒒貋砹耍?/p>
昨天一早,阿里給了全球開發(fā)者一個大大的驚喜,悄悄上線了 Qwen3.7 Preview,包括 Qwen3.7 Max Preview 與 Qwen3.7 Plus Preview 兩個版本。
![]()
第三方權(quán)威評測機構(gòu) Arena 放出了這兩個模型的榜單成績,其中 Qwen3.7 Max Preview 與 Qwen3.7 Plus Preview 分別拿下了文本領(lǐng)域、視覺領(lǐng)域的國產(chǎn)模型第一。
![]()
左為 Qwen3.7 Max Preview,右為 Qwen3.7 Plus Preview
Qwen3.7 預(yù)覽版的性能已經(jīng)如此不俗,讓大家對正式版的表現(xiàn)充滿了期待。
今天上午,在 2026 阿里云峰會上,阿里全新一代千問旗艦?zāi)P?Qwen3.7-Max 登場了!
![]()
阿里巴巴集團通義大模型事業(yè)部負責人「周靖人」
果然沒有令人失望,Qwen3.7-Max 一出手就是王炸。
在 Arena 公布的最新一期全球大模型盲測總榜中,Qwen3.7-Max 總成績位列國產(chǎn)模型第一:傲視一眾國產(chǎn)大模型,包括 Kimi-K2.6、DeepSeek-v4 Pro、GLM-5.1,性能直逼 GPT、Claude、Gemini 等全球最強模型
![]()
除了亮眼的總榜成績,Qwen3.7-Max 特別針對當下被眾多廠商押注并布局的 Agent 進行了系統(tǒng)性優(yōu)化,憑借 Agentic、推理、通用等能力的持續(xù)突破,進一步拉高了其作為下一代通用智能體底座的性能上限。
![]()
編程智能體方面,Qwen3.7-Max 在 SWE-Pro、SWE-Multilingual 等多個權(quán)威測評中均取得 SOTA 表現(xiàn),其中在 Terminal Bench 2.0-Terminus 上取得最高 69.7 分,超過了 DeepSeek-v4-pro-Max、Claude-Opus 4.6 等一眾模型。
通用智能體方面,Qwen3.7-Max 提升明顯,在 MCP-Atlas、MCP-Mark、Skillbench 等現(xiàn)實能力評測中表現(xiàn)優(yōu)異,超越了 GLM-5.1、Kimi-K2.6 等,創(chuàng)下國產(chǎn)新高,并在 Kernel Bench L3 上展示了強大的 GPU 內(nèi)核優(yōu)化能力。
而在推理方面, Qwen3.7-Max 表現(xiàn)同樣出色,在 GPQA Diamond、HLE、HMMT 2026 Feb、IMOAnswerBench 等核心推理測評中均超越了 Claude-Opus 4.6 及所有國產(chǎn)模型。
通用能力與多語言方面,Qwen3.7-Max 在指令遵循評測 IFBench 中得分突破新高達到 79.1 分,在多語言理解和翻譯的 WMT24++、MAXIFE 評測中保持領(lǐng)先。
智能體基座能力的全方位躍升,讓 Qwen3.7-Max 有了挑戰(zhàn)真實運行環(huán)境中超長程編程任務(wù)的底氣。在發(fā)布會上,阿里展示了一個 AI 自主迭代的工程創(chuàng)舉:
Qwen3.7-Max 被放在了一個全新硬件平臺(平頭哥訓(xùn)推一體 AI 芯片真武 M890)上,工作空間里只有任務(wù)描述、SGLang Triton 參考實現(xiàn)和評測腳本,沒有任何其他提示或干預(yù)。結(jié)果,模型連續(xù)編程 35 個小時,自主完成了一個生產(chǎn)級注意力內(nèi)核算子的優(yōu)化。并且,經(jīng)過模型優(yōu)化的推理內(nèi)核比 SGLang Triton 官方參考實現(xiàn)取得了 10 倍的加速。效率如此之高的 AI 平替誰不喜歡呢。
模型「化身」一位資深工程師,進行了 432 次內(nèi)核評估、1158 次工具調(diào)用,從編寫、編譯、性能分析到迭代改進,全程都由自己完成。
![]()
在接下來的實測環(huán)節(jié),Qwen3.7-Max 在處理復(fù)雜智能體任務(wù)中的速度和準確度都讓人眼前一亮。
一手實測
從零代碼開發(fā)到復(fù)雜工具調(diào)度
如果你沒有任何編程基礎(chǔ),想要自己做一個電腦上的小工具(比如一個極簡的桌面番茄鐘),在以前,你需要從零開始學(xué)寫代碼、學(xué)配環(huán)境、學(xué)怎么修 Bug,最后還要學(xué)怎么把代碼打包成雙擊就能運行的 .exe 軟件。
但現(xiàn)在,在 Qwen3.7-Max 模型強大的原生 Agent 推理能力驅(qū)動下,搭配上 Claude Code 這樣的執(zhí)行工具,你只需要下達簡短指令「幫我做一個桌面番茄鐘應(yīng)用」,它就能在背后為你擺平一切。
面對模糊的需求,Qwen3.7-Max 展現(xiàn)了極強的產(chǎn)品架構(gòu)能力。它沒有直接開始堆砌代碼,而是謀定而后動。在確認了技術(shù)棧(Python + PyQt)和功能范圍后,模型迅速輸出了一份結(jié)構(gòu)化的 Markdown 架構(gòu)計劃,并指揮工具開始執(zhí)行。
![]()
缺少工具?沒關(guān)系,大模型會調(diào)度系統(tǒng)自動安裝,全程不需要你操心。在運行中,由于電腦路徑不匹配引發(fā)了連續(xù)的紅字報錯,當 Claude Code 將報錯信息抓取回來后,Qwen3.7-Max 瞬間鎖定了錯誤根源,并展現(xiàn)出驚艷的自我糾錯能力。它迅速推理出了好幾種替代命令方案進行動態(tài)試錯。短短幾秒內(nèi),它就排除了系統(tǒng)環(huán)境的干擾,把精美的番茄鐘穩(wěn)穩(wěn)地彈到了你的桌面上。
![]()
有不滿意的地方,比如想換個莫蘭迪色系,只要一句話,模型就能精準理解審美需求并修改代碼,分分鐘解決。
![]()
如果你想把這個好用的番茄鐘發(fā)給朋友,只需要下達終極交付指令:「幫我打包成 exe」。Qwen3.7-Max 再次發(fā)揮 Agent 本能,識別出環(huán)境缺失后,生成對應(yīng)指令讓工具自動安裝了打包依賴。經(jīng)過它在后臺的一頓絲滑調(diào)度,原本復(fù)雜晦澀的代碼,變成了一個干干凈凈的 .exe 文件,安靜地躺在你的文件夾里,雙擊就能用。
![]()
如果你覺得讓 AI 寫個桌面軟件只是大模型在代碼「舒適區(qū)」里的基操,那不妨看看它在真實的互聯(lián)網(wǎng)環(huán)境、CLI 以及 Skill 調(diào)用中,是如何展現(xiàn)真正的 Agent 實力的。
我們先調(diào)用近期很火的 CLI 工具,首先讓 Agent 幫我下載了 opencli,讓它具備了直接觸達并檢索全網(wǎng)信息的能力。
![]()
下達指令「使用 opencli 工具,幫我查查小紅書上北京必吃的粵菜,附圖片」后,Qwen3.7-Max 迅速從零開始「閱讀」工具文檔,自主摸索出了正確的調(diào)用語法。在抓取過程中,程序遭遇了網(wǎng)絡(luò)超時崩潰,它也自主推理出了修改底層配置的繞路方案來延長等待時間。
![]()
![]()
你不需要看懂它在后臺排除了多少次 Bug,只需幾分鐘,它就已經(jīng)把滿屏的美食圖片穩(wěn)穩(wěn)地下載到了你的本地文件夾里。收集完素材后,當然還可以讓 Agent 順手把調(diào)研結(jié)果快速轉(zhuǎn)為 PPT 和在線文檔,完成工作流閉環(huán)。
![]()
![]()
![]()
Agent 的另一項核心能力,在于能針對特定場景靈活調(diào)用 Skill。
面對一段充滿「首先其次最后」、「跨越時空的贊歌」等套路化詞匯的游記,只需簡短地輸入「去 AI 味」,Qwen3.7-Max 準確識別了文字修改的核心訴求,并主動調(diào)度了系統(tǒng)內(nèi)的 Skill。
![]()
在完成重寫后,模型輸出了一份結(jié)構(gòu)化的 Markdown 復(fù)盤表格。它條理清晰地列出了自己去除了哪些「填充短語」和「宣傳性語言」,并從「直接性」、「真實性」等維度對修改結(jié)果進行了量化打分。
![]()
從零基礎(chǔ)的桌面軟件開發(fā),到陌生終端工具的自主摸索,再到高階文本的技能調(diào)度與反思,Qwen3.7-Max 在這三個場景中,展現(xiàn)的不只是單純的文本生成能力,還有高度成熟的 Agent 獨立執(zhí)行力。
三個月三連更
阿里按下 AI「加速度」
這一連串令人矚目的榜單成績與實戰(zhàn)效果,是千問大模型近期狂飆的一個縮影。
千問旗艦?zāi)P偷牡芷谝呀?jīng)卷到「月更」:3 月 20 日,Qwen3.5-Max-Preview 發(fā)布;4 月 20 日, Qwen3.6-Max-Preview 發(fā)布。到今天,Qwen3.7-Max 又來了。對于用戶來說,正在經(jīng)歷「幸福的煩惱」。
![]()
圖源:@LotusDecoder
能保證一個月推出一代旗艦?zāi)P停康慕^非只是模型團隊的「肝」。阿里自今年 3 月成立 ATH(Alibaba Token Hub)組織以來,逐漸形成的芯片、云、模型、應(yīng)用全棧能力,才最大程度上促成了如今的局面。
其中,平頭哥的定制芯片提供了極致的訓(xùn)練與推理效率,阿里云的彈性算力讓大規(guī)模預(yù)訓(xùn)練和部署無縫銜接,模型層的快速迭代又能直接反哺上層應(yīng)用。這樣的垂直整合壓縮了溝通成本和工程損耗,讓千問的研發(fā)節(jié)奏可以像互聯(lián)網(wǎng)產(chǎn)品一樣快速滾動。
可以說,千問旗艦?zāi)P偷募铀俣龋醋园⒗锶珬?AI 體系的爆發(fā)。這種體系化的壁壘優(yōu)勢,要比單個模型的一次刷榜高分更難復(fù)制。
千問在走高頻迭代路線的同時,也沒有放棄對開源社區(qū)的深耕。不夸張地說,千問已經(jīng)成為國產(chǎn)乃至全球開源模型的標桿,幾乎每次新發(fā)布都會引起極大的關(guān)注。
上個月開源的 Qwen3.6-27B 和 Qwen3.6-35B-A3B 更是成為「以小勝大」的代表作,登頂了 HuggingFace 全球開源榜單,在主要編程基準上全面超越了上代更大體量的 Qwen3.5-397B-A17B,也大幅領(lǐng)先同等規(guī)模的稠密模型。
![]()
這些中小規(guī)模的千問模型,憑借極低的部署成本,提供了超越同尺寸甚至跨級挑戰(zhàn)的性能,更好地滿足了本地部署和定制化的剛需,讓全球開發(fā)者不自覺地將它們作為默認底座。正如一位用戶所說,「阿里正帶著千問飛速前進。開源這條賽道卷瘋了,但最終是所有人的勝利。」
![]()
開源社區(qū)的口碑形成了強大的引力場,讓開發(fā)者「用腳投票」,在 API 調(diào)用上愿意為千問模型付費。
上個月,Qwen3.6-Plus 奪得了全球知名大模型 API 調(diào)用平臺 OpenRouter 日榜和周榜的雙料冠軍,并首創(chuàng)了單日單模型調(diào)用量突破 1.4 萬億 Token 的全球紀錄。千問模型在全球開發(fā)者心目中的地位可見一斑。
![]()
在收獲全球開發(fā)者心智的同時,千問也悄悄占據(jù)了全球 Token 經(jīng)濟的流量入口。如今,Token 正在迅速成為了解決問題的通用輸入,而阿里通過千問牢牢抓住了這個發(fā)展節(jié)點。
智能體軟件的地基
正在被鋪設(shè)
月更旗艦,看似「秀肌肉」,實際上是在為 Agent 時代搶占先機。
不難發(fā)現(xiàn),千問近半年來的模型均指向了同一個主題 —— Agent,其中 Qwen3.5 打造原生多模態(tài)智能體,Qwen3.6-Plus 走向現(xiàn)實世界智能體,Qwen3.7-Max 開辟智能體新前沿。每一次新發(fā)布都伴隨著模型自主規(guī)劃、工具調(diào)用與長程任務(wù)執(zhí)行能力的提升。
此次 Qwen3.7-Max 被寄予厚望。阿里想將它打造成為下一代全能智能體底座,因而不滿于其僅僅充當被調(diào)用的大腦,也希望通過下沉到硬件層,進行系統(tǒng)級編程與優(yōu)化。Qwen3.7-Max 在平頭哥新 AI 芯片上成功運行 35 個小時超長程智能體任務(wù),是這一轉(zhuǎn)變的有力例證。
不僅如此,Qwen3.7-Max 還涌現(xiàn)出了跨智能體框架的泛化能力。無需專門訓(xùn)練,就能絲滑支持 Claude Code、OpenClaw、Hermes Agent 等框架。這像極了當年操作系統(tǒng)的崛起邏輯,包括 PC 時代的 Windows、移動時代的 Android,通過統(tǒng)一的標準與接口,讓開發(fā)者在其上繁衍豐富的生態(tài)。
千問正在努力搭建 Agent 時代的「標準接口」,讓自身成為不同智能體框架的首選底座。這種面向未來的布局,更具有戰(zhàn)略眼光。
![]()
另外,Agent 時代拼的終歸還是模型能力能否站得住腳。阿里深知并一直踐行著這一點,并通過開源提升在全球開發(fā)者社區(qū)中的影響力。當越來越多開發(fā)者習慣于使用千問搭建智能體并運行任務(wù)時,阿里在下一代 Agentic 軟件生態(tài)的建設(shè)中就能掌握更多話語權(quán)。
當下,Anthropic 與 OpenAI 通過「產(chǎn)品驅(qū)動」(Claude Code、Codex)路線贏得用戶和企業(yè),并在商業(yè)市場謀求萬億美元上市。而作為國產(chǎn)大模型代表大廠之一的阿里,選擇了一條更難、更宏大的路徑,從技術(shù)到生態(tài)再到話語權(quán),「全都要」。
在這場關(guān)鍵的卡位戰(zhàn)中,阿里千問的野心遠比我們想象中的更大,它志在成為開發(fā)者構(gòu)建智能體系統(tǒng)時最不可或缺的底層基礎(chǔ)設(shè)施。
文中視頻鏈接:https://mp.weixin.qq.com/s/EvDiB0vpYh5-Ztx6OAfngg
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.