无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

520,遇見國產(chǎn)「新模王」Qwen3.7-Max!

0
分享至



編輯|+0、杜偉

僅僅一個月后,阿里又帶著最強旗艦?zāi)P蜌⒒貋砹耍?/p>

昨天一早,阿里給了全球開發(fā)者一個大大的驚喜,悄悄上線了 Qwen3.7 Preview,包括 Qwen3.7 Max Preview 與 Qwen3.7 Plus Preview 兩個版本。



第三方權(quán)威評測機構(gòu) Arena 放出了這兩個模型的榜單成績,其中 Qwen3.7 Max Preview 與 Qwen3.7 Plus Preview 分別拿下了文本領(lǐng)域、視覺領(lǐng)域的國產(chǎn)模型第一。



左為 Qwen3.7 Max Preview,右為 Qwen3.7 Plus Preview

Qwen3.7 預(yù)覽版的性能已經(jīng)如此不俗,讓大家對正式版的表現(xiàn)充滿了期待。

今天上午,在 2026 阿里云峰會上,阿里全新一代千問旗艦?zāi)P?Qwen3.7-Max 登場了!



阿里巴巴集團通義大模型事業(yè)部負責人「周靖人」

果然沒有令人失望,Qwen3.7-Max 一出手就是王炸。

在 Arena 公布的最新一期全球大模型盲測總榜中,Qwen3.7-Max 總成績位列國產(chǎn)模型第一:傲視一眾國產(chǎn)大模型,包括 Kimi-K2.6、DeepSeek-v4 Pro、GLM-5.1,性能直逼 GPT、Claude、Gemini 等全球最強模型



除了亮眼的總榜成績,Qwen3.7-Max 特別針對當下被眾多廠商押注并布局的 Agent 進行了系統(tǒng)性優(yōu)化,憑借 Agentic、推理、通用等能力的持續(xù)突破,進一步拉高了其作為下一代通用智能體底座的性能上限。



編程智能體方面,Qwen3.7-Max 在 SWE-Pro、SWE-Multilingual 等多個權(quán)威測評中均取得 SOTA 表現(xiàn),其中在 Terminal Bench 2.0-Terminus 上取得最高 69.7 分,超過了 DeepSeek-v4-pro-Max、Claude-Opus 4.6 等一眾模型。

通用智能體方面,Qwen3.7-Max 提升明顯,在 MCP-Atlas、MCP-Mark、Skillbench 等現(xiàn)實能力評測中表現(xiàn)優(yōu)異,超越了 GLM-5.1、Kimi-K2.6 等,創(chuàng)下國產(chǎn)新高,并在 Kernel Bench L3 上展示了強大的 GPU 內(nèi)核優(yōu)化能力。

而在推理方面, Qwen3.7-Max 表現(xiàn)同樣出色,在 GPQA Diamond、HLE、HMMT 2026 Feb、IMOAnswerBench 等核心推理測評中均超越了 Claude-Opus 4.6 及所有國產(chǎn)模型。

通用能力與多語言方面,Qwen3.7-Max 在指令遵循評測 IFBench 中得分突破新高達到 79.1 分,在多語言理解和翻譯的 WMT24++、MAXIFE 評測中保持領(lǐng)先。

智能體基座能力的全方位躍升,讓 Qwen3.7-Max 有了挑戰(zhàn)真實運行環(huán)境中超長程編程任務(wù)的底氣。在發(fā)布會上,阿里展示了一個 AI 自主迭代的工程創(chuàng)舉:

Qwen3.7-Max 被放在了一個全新硬件平臺(平頭哥訓(xùn)推一體 AI 芯片真武 M890)上,工作空間里只有任務(wù)描述、SGLang Triton 參考實現(xiàn)和評測腳本,沒有任何其他提示或干預(yù)。結(jié)果,模型連續(xù)編程 35 個小時,自主完成了一個生產(chǎn)級注意力內(nèi)核算子的優(yōu)化。并且,經(jīng)過模型優(yōu)化的推理內(nèi)核比 SGLang Triton 官方參考實現(xiàn)取得了 10 倍的加速。效率如此之高的 AI 平替誰不喜歡呢。

模型「化身」一位資深工程師,進行了 432 次內(nèi)核評估、1158 次工具調(diào)用,從編寫、編譯、性能分析到迭代改進,全程都由自己完成。



在接下來的實測環(huán)節(jié),Qwen3.7-Max 在處理復(fù)雜智能體任務(wù)中的速度和準確度都讓人眼前一亮。

一手實測

從零代碼開發(fā)到復(fù)雜工具調(diào)度

如果你沒有任何編程基礎(chǔ),想要自己做一個電腦上的小工具(比如一個極簡的桌面番茄鐘),在以前,你需要從零開始學(xué)寫代碼、學(xué)配環(huán)境、學(xué)怎么修 Bug,最后還要學(xué)怎么把代碼打包成雙擊就能運行的 .exe 軟件。

但現(xiàn)在,在 Qwen3.7-Max 模型強大的原生 Agent 推理能力驅(qū)動下,搭配上 Claude Code 這樣的執(zhí)行工具,你只需要下達簡短指令「幫我做一個桌面番茄鐘應(yīng)用」,它就能在背后為你擺平一切。

面對模糊的需求,Qwen3.7-Max 展現(xiàn)了極強的產(chǎn)品架構(gòu)能力。它沒有直接開始堆砌代碼,而是謀定而后動。在確認了技術(shù)棧(Python + PyQt)和功能范圍后,模型迅速輸出了一份結(jié)構(gòu)化的 Markdown 架構(gòu)計劃,并指揮工具開始執(zhí)行。



缺少工具?沒關(guān)系,大模型會調(diào)度系統(tǒng)自動安裝,全程不需要你操心。在運行中,由于電腦路徑不匹配引發(fā)了連續(xù)的紅字報錯,當 Claude Code 將報錯信息抓取回來后,Qwen3.7-Max 瞬間鎖定了錯誤根源,并展現(xiàn)出驚艷的自我糾錯能力。它迅速推理出了好幾種替代命令方案進行動態(tài)試錯。短短幾秒內(nèi),它就排除了系統(tǒng)環(huán)境的干擾,把精美的番茄鐘穩(wěn)穩(wěn)地彈到了你的桌面上。



有不滿意的地方,比如想換個莫蘭迪色系,只要一句話,模型就能精準理解審美需求并修改代碼,分分鐘解決。



如果你想把這個好用的番茄鐘發(fā)給朋友,只需要下達終極交付指令:「幫我打包成 exe」。Qwen3.7-Max 再次發(fā)揮 Agent 本能,識別出環(huán)境缺失后,生成對應(yīng)指令讓工具自動安裝了打包依賴。經(jīng)過它在后臺的一頓絲滑調(diào)度,原本復(fù)雜晦澀的代碼,變成了一個干干凈凈的 .exe 文件,安靜地躺在你的文件夾里,雙擊就能用。



如果你覺得讓 AI 寫個桌面軟件只是大模型在代碼「舒適區(qū)」里的基操,那不妨看看它在真實的互聯(lián)網(wǎng)環(huán)境、CLI 以及 Skill 調(diào)用中,是如何展現(xiàn)真正的 Agent 實力的。

我們先調(diào)用近期很火的 CLI 工具,首先讓 Agent 幫我下載了 opencli,讓它具備了直接觸達并檢索全網(wǎng)信息的能力。



下達指令「使用 opencli 工具,幫我查查小紅書上北京必吃的粵菜,附圖片」后,Qwen3.7-Max 迅速從零開始「閱讀」工具文檔,自主摸索出了正確的調(diào)用語法。在抓取過程中,程序遭遇了網(wǎng)絡(luò)超時崩潰,它也自主推理出了修改底層配置的繞路方案來延長等待時間。





你不需要看懂它在后臺排除了多少次 Bug,只需幾分鐘,它就已經(jīng)把滿屏的美食圖片穩(wěn)穩(wěn)地下載到了你的本地文件夾里。收集完素材后,當然還可以讓 Agent 順手把調(diào)研結(jié)果快速轉(zhuǎn)為 PPT 和在線文檔,完成工作流閉環(huán)。







Agent 的另一項核心能力,在于能針對特定場景靈活調(diào)用 Skill。

面對一段充滿「首先其次最后」、「跨越時空的贊歌」等套路化詞匯的游記,只需簡短地輸入「去 AI 味」,Qwen3.7-Max 準確識別了文字修改的核心訴求,并主動調(diào)度了系統(tǒng)內(nèi)的 Skill。



在完成重寫后,模型輸出了一份結(jié)構(gòu)化的 Markdown 復(fù)盤表格。它條理清晰地列出了自己去除了哪些「填充短語」和「宣傳性語言」,并從「直接性」、「真實性」等維度對修改結(jié)果進行了量化打分。



從零基礎(chǔ)的桌面軟件開發(fā),到陌生終端工具的自主摸索,再到高階文本的技能調(diào)度與反思,Qwen3.7-Max 在這三個場景中,展現(xiàn)的不只是單純的文本生成能力,還有高度成熟的 Agent 獨立執(zhí)行力。

三個月三連更

阿里按下 AI「加速度」

這一連串令人矚目的榜單成績與實戰(zhàn)效果,是千問大模型近期狂飆的一個縮影。

千問旗艦?zāi)P偷牡芷谝呀?jīng)卷到「月更」:3 月 20 日,Qwen3.5-Max-Preview 發(fā)布;4 月 20 日, Qwen3.6-Max-Preview 發(fā)布。到今天,Qwen3.7-Max 又來了。對于用戶來說,正在經(jīng)歷「幸福的煩惱」。



圖源:@LotusDecoder

能保證一個月推出一代旗艦?zāi)P停康慕^非只是模型團隊的「肝」。阿里自今年 3 月成立 ATH(Alibaba Token Hub)組織以來,逐漸形成的芯片、云、模型、應(yīng)用全棧能力,才最大程度上促成了如今的局面。

其中,平頭哥的定制芯片提供了極致的訓(xùn)練與推理效率,阿里云的彈性算力讓大規(guī)模預(yù)訓(xùn)練和部署無縫銜接,模型層的快速迭代又能直接反哺上層應(yīng)用。這樣的垂直整合壓縮了溝通成本和工程損耗,讓千問的研發(fā)節(jié)奏可以像互聯(lián)網(wǎng)產(chǎn)品一樣快速滾動。

可以說,千問旗艦?zāi)P偷募铀俣龋醋园⒗锶珬?AI 體系的爆發(fā)。這種體系化的壁壘優(yōu)勢,要比單個模型的一次刷榜高分更難復(fù)制。

千問在走高頻迭代路線的同時,也沒有放棄對開源社區(qū)的深耕。不夸張地說,千問已經(jīng)成為國產(chǎn)乃至全球開源模型的標桿,幾乎每次新發(fā)布都會引起極大的關(guān)注。

上個月開源的 Qwen3.6-27B 和 Qwen3.6-35B-A3B 更是成為「以小勝大」的代表作,登頂了 HuggingFace 全球開源榜單,在主要編程基準上全面超越了上代更大體量的 Qwen3.5-397B-A17B,也大幅領(lǐng)先同等規(guī)模的稠密模型。



這些中小規(guī)模的千問模型,憑借極低的部署成本,提供了超越同尺寸甚至跨級挑戰(zhàn)的性能,更好地滿足了本地部署和定制化的剛需,讓全球開發(fā)者不自覺地將它們作為默認底座。正如一位用戶所說,「阿里正帶著千問飛速前進。開源這條賽道卷瘋了,但最終是所有人的勝利。」



開源社區(qū)的口碑形成了強大的引力場,讓開發(fā)者「用腳投票」,在 API 調(diào)用上愿意為千問模型付費。

上個月,Qwen3.6-Plus 奪得了全球知名大模型 API 調(diào)用平臺 OpenRouter 日榜和周榜的雙料冠軍,并首創(chuàng)了單日單模型調(diào)用量突破 1.4 萬億 Token 的全球紀錄。千問模型在全球開發(fā)者心目中的地位可見一斑。



在收獲全球開發(fā)者心智的同時,千問也悄悄占據(jù)了全球 Token 經(jīng)濟的流量入口。如今,Token 正在迅速成為了解決問題的通用輸入,而阿里通過千問牢牢抓住了這個發(fā)展節(jié)點。

智能體軟件的地基

正在被鋪設(shè)

月更旗艦,看似「秀肌肉」,實際上是在為 Agent 時代搶占先機。

不難發(fā)現(xiàn),千問近半年來的模型均指向了同一個主題 —— Agent,其中 Qwen3.5 打造原生多模態(tài)智能體,Qwen3.6-Plus 走向現(xiàn)實世界智能體,Qwen3.7-Max 開辟智能體新前沿。每一次新發(fā)布都伴隨著模型自主規(guī)劃、工具調(diào)用與長程任務(wù)執(zhí)行能力的提升。

此次 Qwen3.7-Max 被寄予厚望。阿里想將它打造成為下一代全能智能體底座,因而不滿于其僅僅充當被調(diào)用的大腦,也希望通過下沉到硬件層,進行系統(tǒng)級編程與優(yōu)化。Qwen3.7-Max 在平頭哥新 AI 芯片上成功運行 35 個小時超長程智能體任務(wù),是這一轉(zhuǎn)變的有力例證。

不僅如此,Qwen3.7-Max 還涌現(xiàn)出了跨智能體框架的泛化能力。無需專門訓(xùn)練,就能絲滑支持 Claude Code、OpenClaw、Hermes Agent 等框架。這像極了當年操作系統(tǒng)的崛起邏輯,包括 PC 時代的 Windows、移動時代的 Android,通過統(tǒng)一的標準與接口,讓開發(fā)者在其上繁衍豐富的生態(tài)。

千問正在努力搭建 Agent 時代的「標準接口」,讓自身成為不同智能體框架的首選底座。這種面向未來的布局,更具有戰(zhàn)略眼光。



另外,Agent 時代拼的終歸還是模型能力能否站得住腳。阿里深知并一直踐行著這一點,并通過開源提升在全球開發(fā)者社區(qū)中的影響力。當越來越多開發(fā)者習慣于使用千問搭建智能體并運行任務(wù)時,阿里在下一代 Agentic 軟件生態(tài)的建設(shè)中就能掌握更多話語權(quán)。

當下,Anthropic 與 OpenAI 通過「產(chǎn)品驅(qū)動」(Claude Code、Codex)路線贏得用戶和企業(yè),并在商業(yè)市場謀求萬億美元上市。而作為國產(chǎn)大模型代表大廠之一的阿里,選擇了一條更難、更宏大的路徑,從技術(shù)到生態(tài)再到話語權(quán),「全都要」。

在這場關(guān)鍵的卡位戰(zhàn)中,阿里千問的野心遠比我們想象中的更大,它志在成為開發(fā)者構(gòu)建智能體系統(tǒng)時最不可或缺的底層基礎(chǔ)設(shè)施。

文中視頻鏈接:https://mp.weixin.qq.com/s/EvDiB0vpYh5-Ztx6OAfngg

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
上海發(fā)生日本人被刺傷事件,日本提出交涉

上海發(fā)生日本人被刺傷事件,日本提出交涉

鳳眼論
2026-05-20 16:17:28
國宴上桌,高層調(diào)研:一家民企密集被“看見”,什么信號?

國宴上桌,高層調(diào)研:一家民企密集被“看見”,什么信號?

智谷趨勢
2026-05-20 17:04:05
臺海突發(fā)海空對峙!

臺海突發(fā)海空對峙!

安安說
2026-05-21 10:26:13
人民大會堂女服務(wù)萬里挑一!她們是啥編制?選拔標準有多嚴?

人民大會堂女服務(wù)萬里挑一!她們是啥編制?選拔標準有多嚴?

復(fù)轉(zhuǎn)這些年
2026-05-20 19:44:43
520鹿晗一個人在吉林度過,面相變了,眼袋浮腫,走路彎腰駝背

520鹿晗一個人在吉林度過,面相變了,眼袋浮腫,走路彎腰駝背

小娛樂悠悠
2026-05-21 09:28:51
繼蘿卜崗后,又出來“祖墳”崗?網(wǎng)友:誰能考上,一輩子有的吹了

繼蘿卜崗后,又出來“祖墳”崗?網(wǎng)友:誰能考上,一輩子有的吹了

社會日日鮮
2026-05-21 09:22:29
超哈登歷史第一!卡斯爾兩戰(zhàn)狂送20失誤 次戰(zhàn)9失誤持平雷霆全隊

超哈登歷史第一!卡斯爾兩戰(zhàn)狂送20失誤 次戰(zhàn)9失誤持平雷霆全隊

醉臥浮生
2026-05-21 11:13:31
馬斯克,也沒擋住這股潮流

馬斯克,也沒擋住這股潮流

補壹刀
2026-05-20 21:12:55
女子華為手機漏液要求免費維修,被客服反問:你賬號粉絲量多少?

女子華為手機漏液要求免費維修,被客服反問:你賬號粉絲量多少?

互聯(lián)網(wǎng)大觀
2026-05-21 10:42:06
小夫妻遭遇車禍離世,留下120萬元遺產(chǎn)讓兩親家反目,此前這筆錢由婆婆轉(zhuǎn)給兒媳讓其代理財;房子首付是男方出的,男方父母能多分嗎?

小夫妻遭遇車禍離世,留下120萬元遺產(chǎn)讓兩親家反目,此前這筆錢由婆婆轉(zhuǎn)給兒媳讓其代理財;房子首付是男方出的,男方父母能多分嗎?

大風新聞
2026-05-20 22:19:34
協(xié)助企業(yè)將超標電動車賣給騎手,深圳5名外賣站站長及相關(guān)負責人被刑拘

協(xié)助企業(yè)將超標電動車賣給騎手,深圳5名外賣站站長及相關(guān)負責人被刑拘

澎湃新聞
2026-05-21 10:20:29
追覓CEO俞浩就loser言論致歉:我腦子抽掉了,不該說不喜歡追覓就是loser,很抱歉傷到了一些人,希望大家給我們改正的機會

追覓CEO俞浩就loser言論致歉:我腦子抽掉了,不該說不喜歡追覓就是loser,很抱歉傷到了一些人,希望大家給我們改正的機會

洪觀新聞
2026-05-21 11:45:57
爭議!國際足聯(lián)重大錯誤:U17世界杯抽簽分檔公布 竟然漏掉中國隊

爭議!國際足聯(lián)重大錯誤:U17世界杯抽簽分檔公布 竟然漏掉中國隊

念洲
2026-05-21 08:02:07
職業(yè)運動員究竟有多厲害?網(wǎng)友:在天賦面前,努力一文不值!

職業(yè)運動員究竟有多厲害?網(wǎng)友:在天賦面前,努力一文不值!

另子維愛讀史
2026-05-21 08:03:05
特朗普亮臺海底牌,中美戰(zhàn)略大交易前提已具備,普京緊急來華

特朗普亮臺海底牌,中美戰(zhàn)略大交易前提已具備,普京緊急來華

邱震海
2026-05-18 21:00:03
這得吃牌!哈滕防守時拉扯卡斯爾頭發(fā),裁判沒有表示

這得吃牌!哈滕防守時拉扯卡斯爾頭發(fā),裁判沒有表示

懂球帝
2026-05-21 10:43:37
震驚!上海高校課堂狂吼“殺殺殺”大四學(xué)生,老師請吃麥當勞和解

震驚!上海高校課堂狂吼“殺殺殺”大四學(xué)生,老師請吃麥當勞和解

火山詩話
2026-05-21 06:15:09
40天拉下5位院長!殺瘋了的耿同學(xué)到了最危險時候!誰來保護他?

40天拉下5位院長!殺瘋了的耿同學(xué)到了最危險時候!誰來保護他?

大江看潮
2026-05-20 06:46:22
人民日報評價《給阿嬤的情書》,言辭犀利,狠狠打了馮小剛的臉

人民日報評價《給阿嬤的情書》,言辭犀利,狠狠打了馮小剛的臉

一娛三分地
2026-05-20 14:18:50
30年首冠!43歲威廉王子現(xiàn)場見證維拉歐聯(lián)捧杯 激動抹淚+振臂高呼

30年首冠!43歲威廉王子現(xiàn)場見證維拉歐聯(lián)捧杯 激動抹淚+振臂高呼

我愛英超
2026-05-21 07:51:04
2026-05-21 13:20:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
13048文章數(shù) 142651關(guān)注度
往期回顧 全部

科技要聞

好到離譜也不夠!英偉達交出816億美元營收

頭條要聞

杭州女嬰在月嫂喂奶后嗆死 網(wǎng)友用孩子肖像造謠并惡評

頭條要聞

杭州女嬰在月嫂喂奶后嗆死 網(wǎng)友用孩子肖像造謠并惡評

體育要聞

常住人口7000的小鎮(zhèn),擁有了一支德甲球隊

娛樂要聞

同行吐槽汪涵野心重 爆雷37萬人受損

財經(jīng)要聞

英偉達業(yè)績超預(yù)!指引再新高仍不夠亮眼

汽車要聞

26.98萬起步 看小鵬GX如何詮釋一車多能以及滿配的科技與豪華

態(tài)度原創(chuàng)

家居
房產(chǎn)
本地
旅游
公開課

家居要聞

風格碰撞 個性與藝術(shù)

房產(chǎn)要聞

順德澐璟樓王『澐冠』啟幕|一場高階共鳴的靜奢美學(xué)之約

本地新聞

用云錦的方式,打開江蘇南京

旅游要聞

中老鐵路賦能文旅 外國博主邂逅云南別樣風情

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版