![]()
亞馬遜云科技(AWS)的芯片業(yè)務(wù)正處于爆發(fā)式增長階段,自研芯片Trainium的性價比已超越英偉達(dá),企業(yè)客戶對AI算力的渴求甚至達(dá)到了試圖買斷全部可用容量的程度。
這些信息來自亞馬遜CEO安迪·賈西在2025年年報中寫給股東的一封長達(dá)八頁的信。賈西的表態(tài)清晰反映出企業(yè)界對AI的全力押注,以及亞馬遜主導(dǎo)這場技術(shù)變革的雄心——在他看來,AI將像電力一樣深刻改變世界。
Info-Tech研究集團(tuán)顧問研究員斯科特·比克利指出:"綜合來看,AWS正在深入布局,全面掌控AI技術(shù)棧的每一層:底層是電力和數(shù)據(jù)中心,中間層是自研芯片,頂層是訓(xùn)練與推理能力。"
算力供不應(yīng)求,兩家大客戶試圖買斷Graviton全部產(chǎn)能
AWS在2025年新增了3.9GW的電力容量,并預(yù)計到2027年底將總電力容量翻倍。但賈西坦言:"即便如此,我們?nèi)悦媾R容量瓶頸,存在無法滿足的需求。"
他特別透露,有兩家大型客戶因AI算力需求極為迫切,希望買斷AWS自研CPU芯片Graviton在2026年的全部實例容量。他強調(diào),考慮到其他客戶的需求,AWS無法答應(yīng)此類請求。
Moor Insights & Strategy副總裁兼首席分析師馬特·金博爾表示:"兩家大客戶試圖買下AWS全年的Graviton產(chǎn)能,這已經(jīng)說明了市場現(xiàn)狀的一切。"
他認(rèn)為,這不僅僅是供應(yīng)鏈問題,更是一種"戰(zhàn)略性依賴"——企業(yè)爭搶算力,不只是為了自身需要,更是為了在競爭對手之前鎖定資源。"AWS面臨的風(fēng)險不是建設(shè)速度不夠快,而是受限的客戶可能轉(zhuǎn)向Azure或谷歌云平臺(GCP)。"
這一現(xiàn)象也說明Graviton的受歡迎程度已遠(yuǎn)超預(yù)期。金博爾指出,Graviton如今承載的不再是"輕量級芯片支撐輕量級工作負(fù)載",而是覆蓋了多種不同計算需求的復(fù)雜工作場景。他預(yù)測,隨著Azure Cobalt和谷歌云Axion處理器的成熟,類似需求同樣會出現(xiàn),屆時Arm與x86架構(gòu)之間的市場競爭將更加有趣。
比克利也認(rèn)同供應(yīng)鏈瓶頸對AI基礎(chǔ)設(shè)施建設(shè)的影響"既廣泛又深遠(yuǎn)"。即便有報道稱2026年約50%的規(guī)劃AI數(shù)據(jù)中心產(chǎn)能將無法落地,"眼下市場上的資源依然全面售罄"。
Trainium超越英偉達(dá)?性價比領(lǐng)先30%
進(jìn)入2026年,賈西用"烈火燃燒"來形容亞馬遜的芯片業(yè)務(wù)。盡管AWS與英偉達(dá)保持著緊密合作并廣泛使用其半導(dǎo)體產(chǎn)品,但賈西認(rèn)為處理器市場正在經(jīng)歷一場"新的轉(zhuǎn)變"——客戶越來越看重性價比。
亞馬遜于2024年底發(fā)布了第二代自研AI芯片Trainium2,Amazon Bedrock平臺目前已將大部分推理任務(wù)遷移至這款新一代加速器。賈西聲稱,Trainium2相比同類GPU性價比提升約30%,且"基本售罄"。
剛剛開始出貨的Trainium3,性價比較Trainium2又提升了30%至40%,目前"幾乎已被全額預(yù)訂"。更值得關(guān)注的是,距離大規(guī)模上市還有約18個月的Trainium4,其相當(dāng)一部分產(chǎn)能已提前被預(yù)留。
"我們芯片的需求旺盛到了一個程度,以至于未來很可能會向第三方整機架銷售,"賈西表示。
比克利指出,亞馬遜的目標(biāo)并非取代英偉達(dá),而是在"AWS具備經(jīng)濟性優(yōu)勢的領(lǐng)域"降低對英偉達(dá)的依賴。AWS能夠通過與Bedrock的深度集成、自研互聯(lián)架構(gòu)、更高效的Token經(jīng)濟模型,以及基于PyTorch/JAX/vLLM標(biāo)準(zhǔn)工作流構(gòu)建的軟件棧,提供差異化的性價比方案。
Trainium的核心應(yīng)用場景是大語言模型、多模態(tài)模型及擴散Transformer的訓(xùn)練與推理,參數(shù)規(guī)模覆蓋數(shù)千億至萬億級別。Anthropic和Uber等知名客戶正在實際驗證AWS的效率承諾;而Cohere和Stability AI等則更傾向于英偉達(dá)成熟的工具鏈和更強的芯片設(shè)計能力,并對AWS的服務(wù)穩(wěn)定性提出了質(zhì)疑。
金博爾還提到,AWS與Cerebras的合作同樣值得關(guān)注。Trainium擅長預(yù)填充(prefill),Cerebras CS-3擅長解碼(decode),兩者結(jié)合可在無需用戶干預(yù)的情況下實現(xiàn)最優(yōu)推理性能。"這正是企業(yè)用戶所追求的'即點即用'的簡單體驗。"
在他看來,賈西正在用Trainium復(fù)制Graviton當(dāng)年顛覆x86的路徑——在推理這一"企業(yè)AI中增長最快、對成本最敏感的工作負(fù)載"領(lǐng)域,Trainium正在取得最為顯著的進(jìn)展。
76天造出推理引擎Mantle,6名工程師完成大規(guī)模重建
賈西在信中還強調(diào),敢于推倒重來、"重新定向"的能力至關(guān)重要。以Amazon Bedrock為例,它最初快速構(gòu)建并超預(yù)期擴展,但團(tuán)隊隨后意識到,平臺所需的不是小修小補,而是一套全新的推理引擎。
為此,Bedrock團(tuán)隊借助AWS智能體編程服務(wù)Kiro,組建了一支由6名"極具實力的工程師"構(gòu)成的小組,在76天內(nèi)交付了全新推理引擎Mantle。Mantle隨即成為Bedrock的核心支柱——賈西表示,Bedrock在2026年第一季度處理的Token數(shù)量,超過了此前所有年份的總和。
比克利認(rèn)為,如此小的團(tuán)隊在如此短的時間內(nèi)完成如此大規(guī)模的重建,并同步上線有狀態(tài)對話管理、異步推理、更高默認(rèn)配額等功能,"初看之下確實令人印象深刻"。他表示:"Mantle本身就應(yīng)被視為一款重要的推理產(chǎn)品。"
金博爾則認(rèn)為Mantle的誕生背后其實是"兩個故事":一是運營層面的(Bedrock需要新架構(gòu)),二是效率層面的——6名工程師借助智能體工具,完成了40人團(tuán)隊也難以更快交付的工作,"項目周期、團(tuán)隊規(guī)模、自研還是采購的決策邏輯,都將因此發(fā)生根本性轉(zhuǎn)變"。
"Mantle不只是一次重建,它是AI輔助開發(fā)正在改變行業(yè)邊界的又一個有力佐證,"金博爾說,"不是理論層面,不是營銷話術(shù),而是真實發(fā)生在生產(chǎn)環(huán)境中的事。"
賈西最后寫道:"進(jìn)步不會是線性的。會有加速的時刻,也會有需要調(diào)整方向的時刻。我們會持續(xù)實驗,向重要的事情傾斜資源,在不奏效時果斷收手。"
Q&A
Q1:AWS的Graviton芯片為什么會出現(xiàn)被客戶試圖買斷的情況?
A:根據(jù)亞馬遜CEO賈西的股東信,兩家大型客戶希望買斷AWS自研CPU芯片Graviton在2026年的全部實例產(chǎn)能,原因是AI算力需求極為旺盛。分析師指出,這不只是供應(yīng)鏈緊張的問題,更是一種"戰(zhàn)略性依賴"——企業(yè)爭相鎖定資源,是為了防止競爭對手搶先占據(jù)算力優(yōu)勢。AWS已明確表示無法接受此類獨占請求,但這一現(xiàn)象充分說明Graviton已從輕量級芯片演變?yōu)槌休d復(fù)雜多樣計算需求的核心平臺。
Q2:Trainium2和Trainium3相比英偉達(dá)GPU性價比究竟高多少?
A:根據(jù)賈西的說法,Trainium2相比同類英偉達(dá)GPU性價比提升約30%,目前已基本售罄。剛開始出貨的Trainium3在此基礎(chǔ)上再提升30%至40%,幾乎已被全額預(yù)訂。距離大規(guī)模上市還有約18個月的Trainium4也已有相當(dāng)一部分產(chǎn)能被提前預(yù)留。Trainium主要面向大語言模型、多模態(tài)模型等大規(guī)模AI訓(xùn)練與推理場景,Anthropic、Uber等頭部客戶正在實際使用中驗證其效率表現(xiàn)。
Q3:Bedrock推理引擎Mantle是怎么做出來的,6個人76天完成意味著什么?
A:AWS的Bedrock團(tuán)隊在發(fā)現(xiàn)原有推理架構(gòu)無法滿足需求后,借助AWS智能體編程服務(wù)Kiro,組建了一支6人工程師團(tuán)隊,在76天內(nèi)完成了全新推理引擎Mantle的開發(fā)。Mantle上線后迅速成為Bedrock的核心,2026年第一季度處理的Token量超過此前所有年份的總和。分析師認(rèn)為,這說明AI輔助開發(fā)正在重塑工程效率的邊界,團(tuán)隊規(guī)模、項目周期乃至自研與采購的決策邏輯都將因此發(fā)生根本性改變。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.