无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

拒絕蒸餾!微軟發布自研MAI-Thinking-1追平Claude Opus 4.6:完全從零訓練,不沾任何第三方模型輸出

0
分享至


整理 | 華衛

“我們現在已經基本追平了幾個月前的最先進水平。”在 Build 大會前夕,微軟 AI 執行副總裁兼 CEO Mustafa Suleyman 在采訪中表示。

昨日,微軟在 Build 大會上發布了一系列自研的 AI 模型。這標志著微軟在模型研發上的一次重要推進,去年該公司才推出了首批自研模型,在此之前微軟還主要依賴 OpenAI 的模型。甚至有一些觀察人士,將本次大會稱為微軟的“AI 獨立日”。

同時,Suleyman 也登臺說明了公司在 AI 發展上的思考。他強調,微軟的 AI 工作始終致力于支持人類員工和用戶,而非取代他們,微軟希望打造的是一種被稱為“人本主義超級智能(humanist superintelligence)”的體系。

整體來看,這次 Build 大會的核心信號非常明確:微軟正在從“AI 應用整合者”,轉向“全棧 AI 基礎設施與模型提供者”。

完全從零開始訓練,

微軟推出首個高級推理模型

微軟新模型家族的核心是 MAI-Thinking-1,這是微軟首個高級推理模型。

據介紹,MAI-Thinking-1 是一款“中等規模模型”,擁有 350 億活躍參數和 128K 上下文窗口,總參數規模約 1 萬億,在效率與性能之間取得平衡,同時強調低 token 成本。微軟開發者市場負責人兼 GitHub 首席運營官 Kyle Daigle 在主題演講前的媒體溝通會上表示,“MAI-Thinking-1 的設計目標,是擅長處理復雜的多步驟指令、長上下文推理以及代碼生成。”

在過去一年中,推理模型這一類別主要由 OpenAI 的 o 系列、Google 的 Gemini 推理版本,以及 Anthropic 的 Claude 擴展思考模式所主導,另有開源權重陣營的 DeepSeek R1 在 2025 年初一度撼動了這一格局。

MAI-Thinking-1 是微軟在這一賽道的新入局產品。在關鍵的軟件工程基準測試中,它可以對標行業領先模型;在 SWE Bench Pro 編程基準上,其表現與 Claude Opus 4.6 持平。同時,該模型展現出先進的數學推理能力;MAI-Thinking-1 在 AIME 2025 中達到 97.0%,在 AIME 2026 中達到 94.5%。在微軟進行的盲測人工對比評估中,用戶對它的偏好甚至超過了 Anthropic 的 Claude Sonnet 4.6。


目前,微軟尚未披露具體的訓練方法,例如是否采用了“可驗證獎勵強化學習”(類似 OpenAI o1 的技術路徑)、過程獎勵建模或其他方案。但他們明確了一點“否定信息”:模型的訓練數據中不包含任何其他已訓練 AI 系統的概率分布或輸出序列。

微軟強調,MAI-Thinking-1 完全從零開始訓練,使用的是企業級、干凈且具備合規商業授權的數據,并且在預訓練階段排除了 AI 生成內容,也沒有使用來自第三方模型的蒸餾數據,這迫使“模型真正學會任務本身”。

而這一“獨立訓練”的主張,或成為 MAI-Thinking-1 面向企業客戶的差異化賣點。對于那些需要“干凈知識產權來源”的企業來說,這一點甚至比模型能力本身更關鍵。對初創公司或非監管場景的開發者而言,這種差異可能顯得抽象。但對部署在醫療、金融、國防或任何需要合規采購與數據治理的場景中的 AI 來說,這很可能會變成采購流程中的一個“必選勾選項”。

MAI 模型家族:

一個多模態生態系統

微軟還發布了另外六款 MAI 系列模型,覆蓋圖像生成、語音轉寫、語音合成和編程等方向。

其中,MAI-Code-1-Flash 是一款推理效率極高的智能體編程模型,專為并深度集成于 GitHub Copilot、Visual Studio Code 以及微軟整體技術棧而打造。其參數規模為 50 億(5B),性能可對標 Haiku,但成本更低。

MAI-Image-2.5(包括其超高效的 Flash 版本)同時支持世界級的文生圖與圖像編輯能力,其 Arena 評分已超過 Nano Banana Pro。MAI Transcribe-1.5 是當前全球最強的語音轉錄模型之一,達到 SOTA(最先進水平)準確率。它的速度是同類模型的 5 倍,并內置支持 43 種語言的領域專有術語。MAI-Voice-2 提供覆蓋 15 種語言的高質量、自然語音生成能力,并支持通過短語音樣本進行聲音適配,同時具備完善的濫用防護機制。其更高性價比版本 MAI-Voice-2-Flash 也即將推出。

未來,這些模型都將統一接入 Foundry 以及一個新的專用環境 MAI Playground。除了在 Azure AI Foundry 上分發并針對微軟一方產品(1P)優化之外,這些模型還將面向開發者廣泛開放,并支持在更多平臺上使用。首次,開發者將可以對模型權重進行自定義調優。

值得一提的是,所有這些模型都建立在同一個基礎之上:從零開始“向上爬升”(hill-climbing),不依賴任何蒸餾方法,共享一致的數據規范、訓練基礎設施和評估體系。

“升級版 OpenClaw”來了:

首日用就能被信任?

2026 年初,OpenClaw 席卷 AI 圈。現在,微軟推出了 Scout,這是一款基于 OpenClaw 框架構建的 AI 智能體,可以全天候自主運行,在 Microsoft 365 應用之間獨立完成任務。據介紹,Scout 可以連接 Teams、Outlook、OneDrive 和 SharePoint 等應用,并訪問聊天、郵件、日歷和聯系人數據。用戶可通過 Teams 調用它,它還可以與用戶的瀏覽器交互,并通過模型上下文協議(MCP)連接外部應用。該工具可在云端、桌面端和網頁端運行。

“該智能體會在后臺持續運行,理解你的各類應用和系統中工作的運作方式,并在不需要每次提示的情況下主動采取行動。”微軟企業副總裁 Omar Shahine 在一篇博客中表示,這類智能體會以用戶的身份執行操作,并擁有受治理的 Entra 身份。作為微軟資深員工,Shahine 近期還宣布將領導一個新團隊,把基于 OpenClaw 的個人助手引入 Microsoft 365 應用。

Shahine 表示,Scout 可以減少辦公人員面對的重復性任務,例如與同事協調和安排會議時間,或根據即將到來的工作安排自動在日歷中預留時間。“它還可以發現風險,例如決策停滯,從而讓你在問題演變成阻礙之前及時處理。”

值得注意的是,由于明顯存在安全漏洞,OpenClaw 一度受到審查,但微軟承諾 Scout 具備“企業級安全與控制能力,從第一天起就可以在組織中被信任使用”。微軟還表示,將向開源 OpenClaw 項目進行上游貢獻。

目前,Scout 以“實驗性版本”的形式向其 Frontier 項目客戶開放,并需要通過 Intune 策略配置以及“主動選擇確認(opt-in attestation)”。定價方面,微軟暫未公布更多細節,尚不清楚 Scout 是否會包含在 Microsoft 365 Copilot 訂閱中,還是作為單獨產品收費。

盡管微軟大力推進 AI,其仍在努力說服企業客戶相信 Microsoft 365 Copilot 的附加費用是值得的。該產品面向大型企業定價為每位用戶每月 30 美元。今年 1 月,微軟表示約有 3% 的 Microsoft 365 客戶為該附加訂閱付費,總計約 1500 萬付費用戶。上月,微軟宣布該數字已增長至 2000 萬。Scout 是微軟在 Microsoft 365 中推出的一系列智能體工具中的最新一項,這些工具還包括 Agent Mode(用戶可在 Word、Excel 等應用中與 Microsoft 365 Copilot 交互生成內容)以及 Copilot Cowork(微軟版的 Anthropic Claude Cowork 智能體,可獨立完成任務)。

https://microsoft.ai/news/microsoft-build-2026-mai-keynote-transcript/

https://www.semafor.com/article/06/02/2026/microsofts-ai-chief-on-the-greatest-game-of-catchup-ever-played

聲明:本文為 AI 前線整理,不代表平臺觀點,未經許可禁止轉載。

會議推薦

企業級 Agent 落地,繞不開 4 個真實的工程問題!如何在 Agent 安全性和可用性之間找到平衡點?Agent 需要什么樣的記憶系統才能真正理解上下文?如何通過算法壓榨實現智力增量與成本控制的極致平衡?多 Agent 協作,如何做到可觀測、可治理、可控制?6.26-27 AICon 上海站,國內頭部公司的 Agent 實踐,一次說透。

今日薦文

你也「在看」嗎?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
Shams:沙梅特4年2400萬美元重返尼克斯

Shams:沙梅特4年2400萬美元重返尼克斯

懂球帝
2026-06-30 05:18:27
老板娘問我她身材好不好?我該怎么回答?

老板娘問我她身材好不好?我該怎么回答?

太急張三瘋
2026-06-30 11:28:57
世界杯驚天大瓜!3-3 離譜平局徹底翻車,馬赫雷斯一番話直接自爆

世界杯驚天大瓜!3-3 離譜平局徹底翻車,馬赫雷斯一番話直接自爆

奶蓋熊本熊
2026-06-30 04:07:10
名嘴葉惠賢:開創境外綜藝先河,隨女兒在澳洲養老,79歲晨跑種菜

名嘴葉惠賢:開創境外綜藝先河,隨女兒在澳洲養老,79歲晨跑種菜

白面書誏
2026-06-29 16:36:06
天津凌晨突發!抓了!

天津凌晨突發!抓了!

天津族
2026-06-30 08:58:03
老外搶瘋了!中國分體空調席卷歐洲市場!這只是冰山一角……

老外搶瘋了!中國分體空調席卷歐洲市場!這只是冰山一角……

時尚的弄潮
2026-06-30 01:35:51
聯盟大結局!詹庫在勇士聯手,濃眉加盟組三巨頭

聯盟大結局!詹庫在勇士聯手,濃眉加盟組三巨頭

湖人侃球師
2026-06-30 13:11:51
戰友二婚我隨禮88888,他回我一盒假煙,我心寒丟進垃圾桶,次日民警敲門:那盒煙你抽了嗎?

戰友二婚我隨禮88888,他回我一盒假煙,我心寒丟進垃圾桶,次日民警敲門:那盒煙你抽了嗎?

背包旅行
2026-06-29 12:18:19
中國44年來首次試射洲際導彈,全球反應堪比好萊塢大片

中國44年來首次試射洲際導彈,全球反應堪比好萊塢大片

烽火三月佳人三千
2026-06-25 14:21:42
中國共產黨成立105周年 對話越南駐華大使

中國共產黨成立105周年 對話越南駐華大使

中國日報網
2026-06-30 13:40:10
鐵三女神褲衩開叉 10 厘米!五年被罵上熱搜,裁判卻說是合規的?

鐵三女神褲衩開叉 10 厘米!五年被罵上熱搜,裁判卻說是合規的?

十點體壇
2026-06-09 21:58:11
哈佛10年追蹤:俯臥撐比血壓更準!每周2-3次力竭,給全身換系統

哈佛10年追蹤:俯臥撐比血壓更準!每周2-3次力竭,給全身換系統

健身狂人
2026-06-13 20:30:47
張雪峰女兒張姩菡:否認自己不用讀大學,也不可以躺平

張雪峰女兒張姩菡:否認自己不用讀大學,也不可以躺平

金牌娛樂
2026-06-30 09:36:46
項立剛評馮小剛:飯局跳舞事件后我就不看他電影了,太惡心了

項立剛評馮小剛:飯局跳舞事件后我就不看他電影了,太惡心了

映射生活的身影
2026-06-29 16:37:52
日本心慌了,韓國著急了,如今的中國烏魯木齊,先進制造悄然成勢

日本心慌了,韓國著急了,如今的中國烏魯木齊,先進制造悄然成勢

科技故事聚焦
2026-06-30 09:14:02
董卿:母親因癌離世3個多月,余生我會托起父親的晚年

董卿:母親因癌離世3個多月,余生我會托起父親的晚年

苗苗情感說
2026-06-29 18:11:07
刑偵大案口述紀實:塵封28年,南醫大女學生命案終告偵破!

刑偵大案口述紀實:塵封28年,南醫大女學生命案終告偵破!

橘仔看世界
2026-06-23 09:09:12
中國出手,菲親華派絕地翻盤!憋了17天,菲防長送中方一句狠話

中國出手,菲親華派絕地翻盤!憋了17天,菲防長送中方一句狠話

墨子翟的日記y
2026-06-30 13:34:22
日媒:日本決定暫不把“算數”科目名稱改為“數學”

日媒:日本決定暫不把“算數”科目名稱改為“數學”

隨波蕩漾的漂流瓶
2026-06-29 20:28:56
今晚開始!央一央八愛奇藝等4部王炸劇來襲!眾星云集,先追哪部

今晚開始!央一央八愛奇藝等4部王炸劇來襲!眾星云集,先追哪部

小椰的奶奶
2026-06-30 01:19:29
2026-06-30 14:15:03
AI前線 incentive-icons
AI前線
面向AI愛好者、開發者和科學家,提供AI領域技術資訊。
1586文章數 160關注度
往期回顧 全部

科技要聞

DeepSeek V4正式版要來 高峰期API價格翻倍

頭條要聞

荷蘭隊連續3屆倒在點球大戰 此前9次點球大戰只贏兩場

頭條要聞

荷蘭隊連續3屆倒在點球大戰 此前9次點球大戰只贏兩場

體育要聞

德國足球,臉都不要了

娛樂要聞

韓紅稱要退出公益,多位名人挽留

財經要聞

韓國萬億"芯"基建:存儲能否成AI時代油田

汽車要聞

誰懂啊家人們!爹味和班味一點都沒,這臺底盤最硬國產大獵裝太上頭!

態度原創

旅游
親子
房產
藝術
公開課

旅游要聞

自貢富順:白日繁華鋪錦繡 夜色燈火暖人心

親子要聞

玩具故事-哪位同學拼對了呀

房產要聞

56.8億!三亞突然開始瘋狂賣地!

藝術要聞

喬治·莫蘭迪簡潔的靜物畫,色彩看著太舒服了!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版