![]()
文:王智遠 | ID:Z201440
有朋友問我,怎么看英偉達和微軟一起做ARM架構的AI PC。
我說,這是個好問題,芯片參數這東西,翻兩頁新聞全知道;真正有意思的是,有人在拆一個存在了40年的聯盟。
PC行業有個老詞,叫Wintel;Windows加Intel,一個出操作系統,一個出CPU。鎖死了全世界幾十億臺電腦的底層架構。
40年了,你買一臺Windows電腦,CPU不是英特爾就是AMD,都是x86架構,沒第三個選項。
這個聯盟,被捅了兩刀。
第一刀,2020年蘋果發M1;把英特爾踢出Mac,自己造CPU自己配系統,效果很好,代價是蘋果只管自己的地盤。macOS跟Windows毛關系都沒有。
第二刀,2024年高通做驍龍X Elite。做Windows on ARM筆記本;我翻了一下Canalys的數據。2024年Q3,驍龍X總共出貨72萬臺。市場份額0.8%。
沒起來的核心原因就一個:軟件生態。
微軟連ARM版Windows 11的官方安裝包都拖著不肯發。大量應用要轉譯,反作弊軟件、企業驅動也沒搞定。高通有芯片,沒生態,一個人撬不動Wintel的鎖。
6月1日,黃仁勛在臺北Computex發了RTX Spark。
英偉達、微軟、ARM三家在同一時間發了同一條消息:「A new era of PC」。
跟高通那次完全不一樣,高通過來做驍龍X的時候,微軟態度是「支持」,發了幾臺Surface,推了個Copilot+ PC的概念,然后,Windows對ARM的適配繼續拖。
這次微軟是主動的,Build 2026大會上,納德拉把Windows重新定義成本地AI Agent的運行平臺,發了Aion 1.0本地模型、Windows Local AI運行時、Project Solara。
微軟第一次把端側AI當正經事來干,是壓了籌碼。
你再回頭看,就清楚了,蘋果那刀砍在自己的院子里,高通那把鎖撬了半天沒撬動,這次呢?造芯片的和造鎖的坐一桌了。鎖都換了。
換的那把鎖,叫RTX Spark。黃仁勛在Computex上給它一個詞:超級芯片(Superchip),不是營銷話術。你把架構看一遍就知道,他沒吹。
過去兩年,PC行業一直在喊AI PC。怎么喊的?拿一顆x86處理器,旁邊貼一個NPU,也就是神經網絡處理單元。跑點輕量AI任務。
微軟給Copilot+ PC定的門檻是NPU算力40 TOPS。
40 TOPS能干嘛?
語音轉文字。做一些圖像識別,支撐Windows Copilot做點基礎的文本補全;想在本地跑一個百億參數的大語言模型?不夠。差一個數量級都不止。
RTX Spark的思路完全不一樣。
這顆芯片,700億個晶體管,臺積電3nm;它把20核的Grace CPU和一顆Blackwell架構GPU封在同一塊芯片上,中間用NVLink-C2C連,帶寬600GB/s。
GPU那邊6144個CUDA核心,AI算力1 petaflop FP4。大概是之前那些NPU的25倍。
翻譯一下,GPU性能大概相當于一塊筆記本版的RTX 5070。以前這個級別的GPU是獨立顯卡,插在主板上。現在它跟CPU長到一起了。
內存也改了。
傳統筆記本,CPU一份內存,GPU一份內存,各跑各的;RTX Spark用統一內存架構,最高128GB,CPU和GPU共享。
你在本地加載一個大模型,不用在CPU和GPU之間來回搬數據,直接在同一塊內存里跑。
這個架構不陌生,蘋果M系列走的就是這條路,統一內存、CPU和GPU封在一起、芯片級集成。
RTX Spark做的事,是在Windows陣營里第一次復刻了這個思路;同時把GPU規模拉到了蘋果給不了的級別。
它有個前身,DGX Spark,英偉達年初發布的桌面AI工作站,定價3999美元。同一顆芯片的桌面版。RTX Spark是它的筆記本化。
OEM已經排好了,微軟Surface Laptop Ultra打頭陣,戴爾、惠普、聯想、華碩、MSI全部跟進。今年秋天上市,RTX Spark是把AI引擎放到了中間,整臺電腦圍著它轉。
芯片是好芯片。問題是,誰要它?郭明錤在RTX Spark發布前一天發了一條分析。他拿的是供應鏈數據。
搭載這顆芯片的設備,未來兩年出貨量大概1000萬臺;1000萬臺,聽著不少。你放到全球PC市場里算一下。一年賣2.5億臺。1000萬分兩年,一年500萬。占比2%。
郭明錤給了個定性:小眾市場。瞄準對端側AI算力有需求的重度用戶。
這個判斷背后藏著一個更扎心的事實。他說,目前PC上的AI應用,核心全在云端。
你打開瀏覽器用ChatGPT,用Claude,用Gemini。算力跑在別人服務器上;你通過API調大模型的token,算力也在云端,你的電腦在這個過程中干的活,就是一個瀏覽器。
什么芯片跑瀏覽器,有差別嗎?沒有。
郭明錤舉了兩個例子:
2026年PC行業最熱的事之一是MacBook Neo。蘋果出了一款低價MacBook,賣瘋了。出貨量預估從500萬臺調到1000萬臺。
消費者買的是什么?低價、設計、生態。跟端側AI算力半毛錢關系都沒有。
第二個是便宜的小主機,Mac mini這類產品,因為能7×24小時掛著跑AI Agent,很多開發者關注。聽著像端側AI的場景對吧?
實際上,這些Agent的推理算力幾乎全部來自云端,小主機干的事是保持在線、調度任務,真正的計算不在本地。
所以我說,這事指向一個根本問題:端側AI目前沒有殺手級應用。不是硬件不夠。
RTX Spark的算力,在本地跑百億參數的模型綽綽有余。問題是,跑它干嘛?用戶想不出一個非要在本地跑不可的理由。
微軟不是沒看到這件事。
Build 2026上發的那一堆東西,本質上都在回答同一個問題:操作系統怎么讓端側AI變得有用。
Aion 1.0是一個140億參數的本地小模型,支持工具調用,直接內置在Windows里;以后Windows上的AI Agent不用每次都去云端取指令,一部分推理和決策可以在你電腦上直接完成。
方向是對的。就是剛起步。
端側AI真正能干、云端干不了的事,其實很清楚,隱私數據不出本機,跨應用的數據調度不經過第三方服務器。低延遲的實時響應。
這些能力需要操作系統層面的深度整合,不是裝一個App能解決的。
那現在是什么局面?很清晰:芯片已經準備好了,操作系統剛邁出第一步,用戶需求還停留在「用瀏覽器上ChatGPT」的階段。
三樣東西跑在三條不同的時間線上,芯片最快,生態最慢。
英偉達又不傻。份額沒多大,干這事圖什么?
黃仁勛在Computex的媒體問答上說了一句:英偉達已經不是一家GPU公司了,是一家基礎設施公司,放在PC語境里,意味不一樣。
英偉達做RTX Spark,不是來搶英特爾那點CPU份額的。PC市場一年3000多億美元,聽著很大;英偉達光數據中心業務,上個季度就做了752億美元。PC那點錢,犯不著讓它專門打一仗。
它要另一件東西,我查了一下。今年3月GTC大會上,英偉達紀念CUDA二十周年,公布了一個數字:600萬開發者。
這600萬人用CUDA寫代碼,跑在英偉達的GPU上。覆蓋AI訓練、推理、科學計算、圖形渲染、視頻生產。整個AI產業的軟件棧,底層是CUDA。
CUDA的護城河是遷移成本。
大學教CUDA,論文發CUDA基準測試,創業公司招CUDA工程師;一個團隊一旦在CUDA上積累了代碼、工具鏈和工程經驗,換平臺?代價是組織級的。
這600萬開發者現在在哪?在數據中心里。用幾萬美元一塊的芯片。RTX Spark干的事,是把CUDA拉到筆記本上。
這些人寫的代碼,不用改、不用重新編譯,直接在一臺筆記本上跑。架構是通的。
黃仁勛在發布會上還說了一句:我們要重新發明人類最重要的工具;說的就是PC。
他同時還宣布了一件事,RTX Spark之后的第二代、第三代芯片已經在規劃中,未來英偉達每一代平臺架構,都會包含一顆Spark芯片,30多款筆記本、10多款臺式機,同時上市。
這不是試水,不過,CUDA能不能真正長到每一臺終端上,取決于一個英偉達自己控制不了的變量:價格。
全球DRAM現在處在供應緊張的周期里,內存漲價;筆記本版第一批產品的起步價不會低;想讓CUDA覆蓋的不只重度用戶,要更多代的產品,和制程、內存的成本曲線配合。
英偉達選在這個時間落子。說白了,因為它看到了一個窗口:
微軟第一次認真對待端側AI;ARM架構在Windows上第一次有了成規模的OEM支持;CUDA的開發者基數已經夠大。
你看,三件事湊到一起了,這是背后動機。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.