无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

智能體編程新突破!千問3.7旗艦?zāi)P腿铝料?/h1>
0
分享至

5月20日,阿里巴巴發(fā)布全新一代千問旗艦?zāi)P蚎wen3.7-Max,在三方機構(gòu)Arena全球大模型盲測總榜中,Qwen3.7-Max超過Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,與GPT、Claude、Gemini最強模型接近,位列國產(chǎn)模型第一。千問3.7面向當(dāng)下智能體(Agent)全新設(shè)計,實現(xiàn)了編程、推理等核心能力的持續(xù)突破,甚至可全自主完成35小時的超長程智能體復(fù)雜任務(wù):在一個全新的芯片平臺上,Qwen3.7-Max通過自主編程和超1000次工具調(diào)用,實現(xiàn)了一個關(guān)鍵內(nèi)核的自我進化,推理速度較原版本提升10倍。

圖說:Qwen3.7-Max發(fā)布,位列國產(chǎn)模型第一

阿里大模型研發(fā)顯著加速,近3個月內(nèi),千問旗艦大模型已穩(wěn)定迭代了3.5、3.6、3.7三個版本,不斷抬高國產(chǎn)模型的性能上限,Qwen3.7-Max在數(shù)項權(quán)威評測中位居前列:在編程智能體方面,Qwen3.7-Max 在 SWE-Pro、SWE-Multilingual等測評中均取得領(lǐng)先表現(xiàn),在Terminal Bench 2.0-Terminus得分69.7,超過了DeepSeek-v4-pro-Max、Claude-Opus4.6等一眾模型;在通用智能體方面,Qwen3.7-Max提升顯著,在MCP-Atlas、MCP-Mark、Skillbench等現(xiàn)實能力測試中表現(xiàn)優(yōu)異,超越GLM5.1、Kimi-K2.6等,創(chuàng)下國產(chǎn)新高,并在 Kernel Bench L3上展示了強大的 GPU 內(nèi)核優(yōu)化能力;推理能力上, Qwen3.7-Max 在GPQA Diamond、HLE、HMMT 2026 Feb、IMOAnswerBench等推理核心測評中均超越了Claude-Opus4.6及所有國產(chǎn)模型;在通用能力與多語言方面,Qwen3.7-Max 在指令遵循 IFBench 評測中得分79.1分突破新高,在多語言理解和翻譯的WMT24++、MAXIFE評測中領(lǐng)先。

當(dāng)下,編程能力已成為衡量LLM大語言模型的核心指標,Qwen3.7-Max較上代模型實現(xiàn)了大幅提升,從前端原型開發(fā)到復(fù)雜的多文件工程均能駕馭。在評估AI解決真實世界的實戰(zhàn)編程任務(wù)SWE-bench系列測評、面向真實科學(xué)問題的編程測評SciCode中,Qwen3.7-Max較Qwen3.6-Plus大幅提升,并超越了Claude Opus 4.6-Max、Kimi-K2.6、DeepSeek-v4-Pro-Max等模型。千問3.7是出色的編程智能體,可自主編寫代碼創(chuàng)造工具,精準執(zhí)行任務(wù),完成復(fù)雜編程的自我糾錯迭代,就像個資深工程師,跑完從需求分析到測試迭代的全流程,自主產(chǎn)出可用的工業(yè)級成果。

不斷提升的編程能力,也為智能體完成更復(fù)雜、更長周期的任務(wù)打下堅實基礎(chǔ)。千問3.7本身具有極強的Agent能力,并涌現(xiàn)出跨多種智能體框架的泛化能力,在 Claude Code、OpenClaw、Qwen Code 等框架下都能穩(wěn)定發(fā)揮,有望成為各類智能體系統(tǒng)的可靠底座。通過MCP集成和多智能體協(xié)作,Qwen3.7-Max在企業(yè)級辦公場景實現(xiàn)工作流自動化,在辦公自動化基準 SpreadSheetBench-v1上斬獲87分,處于頂尖水平,是可靠的辦公與生產(chǎn)力助手。以往需專業(yè)團隊耗時一至兩周的復(fù)雜項目,現(xiàn)由 Qwen3.7-Max 驅(qū)動的智能體可在數(shù)小時內(nèi)完成端到端交付閉環(huán)。

實戰(zhàn)任務(wù)測試中,Qwen3.7-Max還展示了當(dāng)下智能體所能達到的長程任務(wù)極限。對大模型而言,推理速度與推理框架息息相關(guān),AI Infra工程師最重要的工作之一就是進行推理框架中的算子優(yōu)化,這需要極強的經(jīng)驗、知識、算法能力以及反復(fù)調(diào)試、糾錯迭代。如今,千問3.7也嘗試自主解決這一難題。在一個模型訓(xùn)練時從未接觸過的全新硬件平臺——平頭哥真武M890芯片上,千問3.7自主完成了一個復(fù)雜的推理內(nèi)核優(yōu)化任務(wù)。在沒有任何性能分析數(shù)據(jù)、硬件文檔或新架構(gòu)的示例內(nèi)核情況下,千問3.7僅從一個包含任務(wù)描述、SGLang Triton 參考實現(xiàn)和評測腳本的空白工作空間出發(fā),從“零”開始持續(xù)編程 35 小時,獨立進行了 432 次內(nèi)核評估、1158 次工具調(diào)用,完全自主地完成了編寫、編譯、性能分析與迭代改進的全流程。

圖說:Qwen3.7-Max可獨立執(zhí)行35小時的長程復(fù)雜任務(wù)

最終,在平頭哥新AI芯片上,經(jīng)千問優(yōu)化后的推理內(nèi)核比 SGLang Triton 官方參考實現(xiàn)取得了 10 倍的加速。測試軌跡還顯示,模型在獨立運行超過 30 小時后仍發(fā)現(xiàn)了有效優(yōu)化點,甚至主動發(fā)起了一次關(guān)鍵的架構(gòu)重設(shè)計——這充分體現(xiàn)千問在復(fù)雜任務(wù)中長周期自主迭代的能力,為未來模型與智能體的自我演進打開了全新的想象空間。

在2026阿里云峰會現(xiàn)場,阿里云宣布面向Agentic時代全面升級,重磅發(fā)布全新的“芯-云-模型-推理”技術(shù)體系。據(jù)了解,Qwen3.7-Max模型API即將上線阿里云百煉,同時,千問3.7系列還將推出Qwen3.7-Plus等不同版本模型,擁有極強的多模態(tài)推理、視覺理解能力,實現(xiàn)從編程智能體到視覺智能體的全覆蓋,為下一代AI提供全能智能體新基座。

(完)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
朱芳雨親自要人!廣東隊可能“1換1”報價新疆,交易鋒線老將?

朱芳雨親自要人!廣東隊可能“1換1”報價新疆,交易鋒線老將?

緋雨兒
2026-06-12 13:42:27
完結(jié)全文《沉默的長孫女》盛芷涵

完結(jié)全文《沉默的長孫女》盛芷涵

嵐風(fēng)生活見
2026-04-18 22:02:34
奧巴馬是美國歷史上最壞的總統(tǒng),沒有之一

奧巴馬是美國歷史上最壞的總統(tǒng),沒有之一

阿豐聊娛
2026-06-12 08:25:29
國內(nèi)將逐漸停止“CT檢查”?做完身體就垮了?醫(yī)生告訴您真相

國內(nèi)將逐漸停止“CT檢查”?做完身體就垮了?醫(yī)生告訴您真相

芹姐說生活
2026-06-12 23:10:36
8000多家在華日企對中國施壓,要求取消對日反制!

8000多家在華日企對中國施壓,要求取消對日反制!

阿龍聊軍事
2026-06-12 22:17:24
任敏的白絲太有感覺了

任敏的白絲太有感覺了

小椰的奶奶
2026-06-13 00:36:09
貴州女子剛生產(chǎn)完,丈夫沖到產(chǎn)房將其腦袋砍下:她死有余辜

貴州女子剛生產(chǎn)完,丈夫沖到產(chǎn)房將其腦袋砍下:她死有余辜

莫地方
2026-06-04 01:45:03
導(dǎo)彈打偏怪中國?30億就想掀翻中國千億產(chǎn)業(yè)?美國這鍋中國不背!

導(dǎo)彈打偏怪中國?30億就想掀翻中國千億產(chǎn)業(yè)?美國這鍋中國不背!

李砍柴
2026-06-11 17:31:14
北京93歲老人終身未娶、無兒無女,去世前將千萬財產(chǎn)贈與照顧其12年的鄰居,法院判了

北京93歲老人終身未娶、無兒無女,去世前將千萬財產(chǎn)贈與照顧其12年的鄰居,法院判了

大風(fēng)新聞
2026-02-24 23:13:12
瑞士銀行家狂擲1100萬歐元買下意大利小鎮(zhèn)寓,推開窗就是絕美海景!

瑞士銀行家狂擲1100萬歐元買下意大利小鎮(zhèn)寓,推開窗就是絕美海景!

意大利華人網(wǎng)0039
2026-06-13 00:19:58
“孩子很遺憾,媽媽只能這樣維護你的體面”頭七:楊女士一躍而下

“孩子很遺憾,媽媽只能這樣維護你的體面”頭七:楊女士一躍而下

深夜探案館
2026-06-09 01:40:50
世體:C羅表示以良好的身體狀態(tài)出征2026年世界杯

世體:C羅表示以良好的身體狀態(tài)出征2026年世界杯

懂球帝
2026-06-12 21:25:08
排面拉滿!皇馬正式官宣:穆里尼奧回歸!3筆引援敲定,留5大變招

排面拉滿!皇馬正式官宣:穆里尼奧回歸!3筆引援敲定,留5大變招

等等talk
2026-06-12 04:30:34
2-1!韓國隊取世界杯首勝,國足迎來好消息,王鈺棟留洋或穩(wěn)了

2-1!韓國隊取世界杯首勝,國足迎來好消息,王鈺棟留洋或穩(wěn)了

老秦說體育
2026-06-12 14:14:38
董路說:我最缺錢的時候,是武磊掏出80000塊錢,資助足球小將…

董路說:我最缺錢的時候,是武磊掏出80000塊錢,資助足球小將…

童叔不飆車
2026-06-11 11:12:20
兒子長相與妻子領(lǐng)導(dǎo)神似,丈夫偷偷做親子鑒定,結(jié)果出來后愣住了

兒子長相與妻子領(lǐng)導(dǎo)神似,丈夫偷偷做親子鑒定,結(jié)果出來后愣住了

婉婉碎碎念
2024-10-14 16:07:36
“好豪邁的洛麗塔”,165cm未成年女兒穿搭火了,家長尷尬不敢認

“好豪邁的洛麗塔”,165cm未成年女兒穿搭火了,家長尷尬不敢認

妍妍教育日記
2026-05-12 18:46:53
上海夫妻“離婚大戰(zhàn)”牽扯出來的大瓜,把我看得目瞪口呆

上海夫妻“離婚大戰(zhàn)”牽扯出來的大瓜,把我看得目瞪口呆

品讀時刻
2026-06-12 09:04:53
男子30年前被扣押2859克黃金,最新進展:蓋州市公安局已返還財產(chǎn),雙方和解

男子30年前被扣押2859克黃金,最新進展:蓋州市公安局已返還財產(chǎn),雙方和解

揚子晚報
2026-06-12 12:29:18
阿媒:阿根廷隊醫(yī)療團隊已經(jīng)與塔利亞菲科會面,商討治療方案

阿媒:阿根廷隊醫(yī)療團隊已經(jīng)與塔利亞菲科會面,商討治療方案

懂球帝
2026-06-12 13:48:20
2026-06-13 01:16:49

光子星球 incentive-icons
光子星球
細微之處,看見未來!
1540文章數(shù) 2148關(guān)注度
往期回顧 全部

科技要聞

剛剛,人類歷史上首位萬億美元富豪誕生!

頭條要聞

美加墨世界杯第二場比賽就現(xiàn)空座 英媒:尷尬

頭條要聞

美加墨世界杯第二場比賽就現(xiàn)空座 英媒:尷尬

體育要聞

歐洲恐韓?肉德維德?

娛樂要聞

一天4個瓜,肖戰(zhàn)熱巴最意外

財經(jīng)要聞

萬億美元順差背后,透露這些信號

汽車要聞

標配激光雷達/雙動力可選 昊鉑S600限時售17.99萬起

態(tài)度原創(chuàng)

手機
時尚
家居
藝術(shù)
本地

手機要聞

vivo X Fold6再預(yù)熱:天璣9500超能版+OriginOS 6 Fold

夏天別總穿一身白或一身黑!試試一半彩色、一半基礎(chǔ)色,高級亮眼

家居要聞

空間微調(diào) 移形換境

藝術(shù)要聞

砸了640億,再賠160億!沙特“The Line”項目徹底涼了?

本地新聞

AK劉彰邂逅河北南大港濕地

無障礙瀏覽 進入關(guān)懷版