一、算力封裝為什么躲不開?
今年GTC大會(huì)上,黃仁勛說了句大白話:以后的數(shù)據(jù)中心不是倉庫,而是生產(chǎn)Token的工廠。AI時(shí)代,算力就像電,得從“發(fā)電廠”生產(chǎn)出來,再送到千家萬戶。
![]()
過去移動(dòng)互聯(lián)網(wǎng)那套行不通了。那時(shí)的服務(wù)器像小倉庫,存數(shù)據(jù)、處理點(diǎn)贊評(píng)論就行。可現(xiàn)在跑大模型、搞智能體,需要的是海量并行計(jì)算,零散的算力普通人根本用不上。算力封裝就是把機(jī)房里的算力拆成你我能按需購買的小份商品——相當(dāng)于電網(wǎng)、插座和電表。
2026年這幾件事很說明問題:OpenAI融了1220億美元蓋算力工廠,阿里新模型按Token收費(fèi),工信部發(fā)算力券幫中小企業(yè)買算力。算力正在變成自來水,封裝就是讓它流進(jìn)千家萬戶的唯一辦法。
二、未來市場(chǎng)不會(huì)一家獨(dú)大
一提算力大家先想到英偉達(dá),它靠CUDA生態(tài)綁定了幾百萬開發(fā)者。但挑戰(zhàn)者已經(jīng)上來了。
AMD的MI400系列連OpenAI都說好,靠著開源和性價(jià)比搶下百分之十幾的市場(chǎng)。谷歌TPU自己搞專用芯片,成本壓到跟英偉達(dá)差不多,2027年預(yù)計(jì)出貨500萬顆。Cerebras專攻推理芯片,給OpenAI的Codex模型供貨;Groq則被英偉達(dá)花約200億美元達(dá)成技術(shù)授權(quán)合作。
AMD、OpenAI、谷歌、微軟、Meta已經(jīng)抱團(tuán),誰也不愿永遠(yuǎn)給英偉達(dá)交稅。加上定制芯片預(yù)計(jì)2030年占三分之一市場(chǎng),未來算力格局將是GPU、TPU、專用推理芯片各領(lǐng)風(fēng)騷,幾家大廠各定各的封裝標(biāo)準(zhǔn),用戶按需選擇。英偉達(dá)還是大頭,但再想獨(dú)占95%的份額,難了。
三、國(guó)內(nèi)動(dòng)手很快,優(yōu)勢(shì)和短板在哪?
外部供應(yīng)鏈?zhǔn)站o,國(guó)內(nèi)反而跑起來了。“東數(shù)西算”繼續(xù)砸錢,“算電協(xié)同”寫進(jìn)政府工作報(bào)告。深圳、廣州出文件支持國(guó)產(chǎn)芯片,工信部發(fā)算力券幫國(guó)產(chǎn)封裝產(chǎn)品找用戶。
2025年,國(guó)產(chǎn)AI加速卡在國(guó)內(nèi)賣了165萬張,占41%份額,英偉達(dá)從95%跌到55%。華為最猛,一年出貨80多萬片,拿下近20%市場(chǎng)。有機(jī)構(gòu)預(yù)測(cè)2026年英偉達(dá)在華可能只剩8%,華為沖到50%。
優(yōu)勢(shì)很實(shí)在:市場(chǎng)大——電商、智駕、安防每個(gè)場(chǎng)景都是練兵場(chǎng);政策狠——給錢給電給訂單;技術(shù)有巧勁——Chiplet不用最先進(jìn)制程也能堆性能,華為Atlas350號(hào)稱達(dá)到H20的三倍。
短板也扎心:生態(tài)差。CUDA養(yǎng)了二十年,幾百萬開發(fā)者已經(jīng)習(xí)慣。Hugging Face上200萬個(gè)模型,國(guó)產(chǎn)GPU能流暢跑的只有幾十到幾百個(gè)。換國(guó)產(chǎn)芯片不是改幾行代碼,是整個(gè)團(tuán)隊(duì)重新學(xué),成本太高。國(guó)產(chǎn)芯片陷在死循環(huán):用的人少→反饋少→迭代慢→更沒人用。絕對(duì)算力和制程跟英偉達(dá)、AMD還有五到十年差距,主要卡在高端制程工藝和先進(jìn)封裝上。
轉(zhuǎn)機(jī)在出現(xiàn):AI重心從訓(xùn)練轉(zhuǎn)向推理,更看重整體效率而不是單顆芯片多快。靠系統(tǒng)優(yōu)化、軟硬協(xié)同,和國(guó)產(chǎn)大模型深度綁定聯(lián)合調(diào)優(yōu),這條路雖然累,但能一點(diǎn)點(diǎn)把生態(tài)啃下來。
四、應(yīng)用場(chǎng)景已經(jīng)跑起來了
個(gè)人和小微開發(fā)者:以前跑AI畫圖得買上萬塊顯卡,現(xiàn)在花幾十塊買Token包,或者插個(gè)華碩UGen300(U盤大小的AI加速器),電腦秒變AI工作站。
中小企業(yè):開網(wǎng)店做AI客服,不用搭機(jī)房,買電商專用算力套餐,配合算力券,一個(gè)月幾百塊。
AI創(chuàng)業(yè)公司:租專屬算力集群,按小時(shí)甚至按分鐘計(jì)費(fèi),省下的錢專心搞算法。
大型制造企業(yè):走“雙工廠”模式,物理工廠造東西,AI工廠跑數(shù)字孿生、優(yōu)化產(chǎn)線。比如汽車廠用AI模擬碰撞測(cè)試,不用反復(fù)造真車,成本降一大截。
科研和城市治理:新藥研發(fā)、交通調(diào)度買公共算力包,西部便宜算力通過“東數(shù)西算”賣給東部,資源盤活了。
五、算力變成商品后,買賣場(chǎng)景長(zhǎng)什么樣?
算力封裝成標(biāo)準(zhǔn)產(chǎn)品,代理市場(chǎng)啟動(dòng)是必然。未來會(huì)同時(shí)出現(xiàn)三種買賣場(chǎng)景。
第一種:全國(guó)性算力交易所。像買賣電力一樣公開掛牌、競(jìng)價(jià)交易,還能買算力期貨鎖定成本。國(guó)家發(fā)布統(tǒng)一“算力價(jià)格指數(shù)”,讓價(jià)格透明。國(guó)內(nèi)已在推“算力銀行”和“算力超市”,兩三年內(nèi)見正式產(chǎn)品。
第二種:算力超市。普通人像充話費(fèi)一樣買算力,按“卡時(shí)”、按Token數(shù)量付費(fèi)。算力分等級(jí):緊急推理可能1塊錢1000 Token,批處理任務(wù)只要1毛錢。還賣解決方案——醫(yī)療影像套餐、自動(dòng)駕駛套餐,開箱即用。配套的算力租賃、算力保險(xiǎn)也有,小公司不用一次砸大錢。
第三種:企業(yè)級(jí)大單市場(chǎng)。過去8卡不夠用、幾百卡用不起,現(xiàn)在有“40卡”這樣的超節(jié)點(diǎn)產(chǎn)品,性能是傳統(tǒng)方案的2.6倍,門檻低很多。廠商提供從網(wǎng)絡(luò)到部署的全套服務(wù),企業(yè)“搭積木”就行。
總結(jié)一下:未來的算力買賣,國(guó)家交易所管大宗批發(fā),算力超市管靈活零售,企業(yè)大單管定制化方案。普通人買Token包就能跑AI,中小企業(yè)買套餐就能轉(zhuǎn)型,大公司直接租一整個(gè)算力單元。
算力封裝從不是技術(shù)噱頭,而是AI產(chǎn)業(yè)落地的核心一步,它拆掉了算力的高門檻,讓AI從大廠專屬,變成全民可用的生產(chǎn)工具。
接下來,行業(yè)標(biāo)準(zhǔn)會(huì)逐步成型,封裝產(chǎn)品會(huì)越來越豐富,買賣場(chǎng)景也會(huì)越來越順手。這條路注定有競(jìng)爭(zhēng)、有試錯(cuò),但算力變成自來水的方向不會(huì)回頭。誰能做出最便宜、最好用的封裝產(chǎn)品,誰就能站到舞臺(tái)中央。而我們每個(gè)人——不管是寫代碼的、開網(wǎng)店的、搞科研的,還是只想用AI畫張圖的——都會(huì)是這場(chǎng)變革的受益者。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.