无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

深度綁定OpenAI,英偉達(dá)最“大”對(duì)手來(lái)了

0
分享至

英偉達(dá)的 真正 “ 大” 對(duì)手來(lái)了。

5月14日,Cerebras以488億美元的估值,超額認(rèn)購(gòu)超過(guò)20倍登陸納斯達(dá)克。

據(jù)說(shuō)這是今年來(lái)全球最大估值規(guī)模的IPO。

要知道,就在8個(gè)月前,這家公司估值還只有81億美元。現(xiàn)在等于翻了6倍,可見現(xiàn)在的市場(chǎng)對(duì)于AI鏟子股究竟有多瘋狂。

AI推理是時(shí)代來(lái)了,但英偉達(dá)的GPU不再是唯一解。

市場(chǎng)憑什么認(rèn)為Cerebras,能夠撼動(dòng)英偉達(dá)的地位?

01

推理新王

2026年,隨著推理需求大爆發(fā),傳統(tǒng)GPU架構(gòu)在推理場(chǎng)景的物理瓶頸愈發(fā)凸顯,而Cerebras晶圓級(jí)芯片,為破解這一難題提供了顛覆性方案。

黃仁勛在GTC2026上明確提出:AI推理拐點(diǎn)已至。

據(jù)德勤數(shù)據(jù),2023年,AI算力支出還是訓(xùn)練占60%,推理占40%,但兩年后,這個(gè)比例幾乎都要翻過(guò)來(lái)了,推理預(yù)計(jì)將占企業(yè)AI預(yù)算的85%。

推理大模型還在持續(xù)放大這一趨勢(shì)。據(jù)a16z對(duì)100萬(wàn)億token數(shù)據(jù)的研究,2025年推理模型的token消耗份額從近乎歸零飆升至總算力的半數(shù)以上。每一次模型升級(jí),都在成倍放大推理的算力消耗。

GPU推理有一個(gè)結(jié)構(gòu)性弱點(diǎn)。要理解它,需先明確LLM推理的兩大核心階段:Prefill(預(yù)填充)與Decode(解碼)。

Prefill階段負(fù)責(zé)處理用戶提示詞,支持并行計(jì)算,GPU很擅長(zhǎng),因此這階段GPU效率表現(xiàn)優(yōu)異。

而Decode階段是逐一生成token,屬于串行運(yùn)算,后一個(gè)token的生成必須等待前一個(gè)完成。且每生成一個(gè)token,都需要完整讀取全部模型權(quán)重與KVCache緩存,數(shù)據(jù)搬運(yùn)成本極高、重復(fù)損耗嚴(yán)重。

以70B參數(shù)模型為例,其權(quán)重約140GB,疊加對(duì)話過(guò)程中持續(xù)膨脹、可達(dá)數(shù)十GB的KVCache,龐大的數(shù)據(jù)量進(jìn)一步加重了GPU的運(yùn)算與搬運(yùn)負(fù)擔(dān)。

也就是說(shuō),GPU推理低效的核心,并非算力不足,而是傳統(tǒng)架構(gòu)物理局限導(dǎo)致的內(nèi)存墻問(wèn)題。

這就是AI行業(yè)的核心“內(nèi)存墻”——算力增長(zhǎng)遠(yuǎn)快于內(nèi)存帶寬增長(zhǎng),計(jì)算性能被數(shù)據(jù)搬運(yùn)卡住了。

數(shù)據(jù)顯示,算力每?jī)赡晏嵘?倍,HBM帶寬僅提升1.6倍;十年維度下,算力暴漲1000倍,帶寬僅提升10倍,這相當(dāng)于買了一張超級(jí)計(jì)算卡,實(shí)際跑推理的時(shí)候98%的時(shí)間在發(fā)呆。

性能剪刀差持續(xù)擴(kuò)大,就導(dǎo)致了架構(gòu)矛盾日益凸顯。

據(jù)HuggingFace Blog分析,B200在batch等于1時(shí),tensor core空閑超過(guò)99%。

這個(gè)痛點(diǎn)也體現(xiàn)在英偉達(dá)核心營(yíng)收上。

黃仁勛公開確認(rèn),其數(shù)據(jù)中心業(yè)務(wù)65%收入來(lái)自推理場(chǎng)景,意味著英偉達(dá)最核心的營(yíng)收來(lái)源,恰恰是GPU架構(gòu)效率最低的場(chǎng)景。這也是為什么英偉達(dá)要斥資200億美元去收購(gòu)Groq的原因。側(cè)面印證傳統(tǒng)GPU無(wú)法適配高端推理需求,行業(yè)亟需專用推理架構(gòu)。

在此背景下,Cerebras跳出傳統(tǒng)GPU設(shè)計(jì)邏輯,以晶圓級(jí)計(jì)算架構(gòu)給出了破局方案。其核心產(chǎn)品WSE-3摒棄芯片切割模式,將整片300mm硅晶圓作為單一處理器,集成90萬(wàn)個(gè)AI核心、搭載44GB片上SRAM,官方帶寬達(dá)21PB/s,是B200 8TB/s帶寬的2625倍,實(shí)現(xiàn)了跨量級(jí)的性能突破。


也就是說(shuō),這是真正物理意義上的超大芯片,所以說(shuō)它是英偉達(dá)的“大”對(duì)手,確實(shí)沒(méi)毛病。

晶圓級(jí)計(jì)算75年沒(méi)人做出來(lái),不是沒(méi)人想過(guò),是工程上做不到。Cerebras解了三個(gè)難題。

第一,突破光刻工藝極限。傳統(tǒng)光刻單次曝光最大面積僅26mm×33mm,遠(yuǎn)小于晶圓尺寸。Cerebras聯(lián)合臺(tái)積電研發(fā)“劃線橋接”技術(shù),復(fù)用晶圓劃線區(qū)域延伸金屬沉積路徑,讓通信網(wǎng)絡(luò)無(wú)縫覆蓋整片晶圓,徹底消除芯片邊界與跨芯片延遲。

第二,解決大芯片缺陷雖然Cerebras把芯片做得極大,但它把每個(gè)AI核心做到了只有0.05平方毫米,約等于H100 SM核心面積的1%。單個(gè)缺陷只廢掉0.05平方毫米,而不是6平方毫米。據(jù)Cerebras官方博客,WSE-3的缺陷容忍度是GPU的100倍。額外加1%到1.5%的冗余核心做替換。

第三,攻克超大功率供電散熱難題。WSE-3功耗達(dá)23kW,需輸送超2萬(wàn)安培電流。Cerebras采用上置垂直供電、底部水冷散熱方案,將整片晶圓溫差控制在20℃以內(nèi),保障芯片高負(fù)載穩(wěn)定運(yùn)行。


據(jù)實(shí)測(cè)數(shù)據(jù),Cerebras WSE-3對(duì)最佳GPU/云方案,四個(gè)主流模型全部領(lǐng)先。Llama 3.3 70B差距最大,2140對(duì)120,18倍。Llama 4 Maverick 400B差距最小,2500對(duì)1000,超過(guò)2倍。


憑借出奇快的推理速度,Cerebras的估值一路水漲船高。根據(jù)S-1融資輪次數(shù)據(jù),公司估值八個(gè)月漲了六倍。從81億美元到230億再到488億。


并且,公司的商業(yè)前景也得到了科技巨頭的背書。OpenAI一上來(lái)就直接跟它簽了超百億美元的多年合同。還有AWS也選擇Cerebras作為Bedrock推理加速層。

整體而言,Cerebras以顛覆性的晶圓級(jí)架構(gòu),發(fā)起了對(duì)GPU行業(yè)霸主的技術(shù)挑戰(zhàn)。這套突破傳統(tǒng)束縛的技術(shù)方案,打破了長(zhǎng)期的GPU算力壟斷,想象空間廣闊,也讓公司估值從一開始就偏離了正常的比較范圍。

02

估值合理嗎?

根據(jù)S-1文件,CerebrasIPO估值對(duì)應(yīng)2025年5.1億美元營(yíng)收,約95倍收入倍數(shù)。據(jù)StockMaven數(shù)據(jù),NVIDIA大約25倍,Cerebras是NVIDIA的近4倍。

但盈利能力上Cerebras顯然還沒(méi)有證明自己,NVIDIA財(cái)報(bào)顯示其毛利率75%到80%,Cerebras只有39%。


公司2025年GAAP凈利潤(rùn)2.378億美元,里面有3.63億非現(xiàn)金會(huì)計(jì)收益(遠(yuǎn)期合約負(fù)債公允價(jià)值變動(dòng))。實(shí)際Non-GAAP虧損7570萬(wàn)美元。毛利率從42.3%滑到39.0%,還在往下走。

這也說(shuō)明了,公司的估值邏輯本身已經(jīng)超出了芯片公司的標(biāo)準(zhǔn),市場(chǎng)更像是把它當(dāng)成了一種稀缺的AI基礎(chǔ)設(shè)施來(lái)定價(jià)。

但是翻一翻賬,估值給的太高還不是最大的問(wèn)題。

根據(jù)S-1經(jīng)審計(jì)財(cái)務(wù)報(bào)告附注,2025年公司86%的收入來(lái)自兩個(gè)阿聯(lián)酋實(shí)體。MBZUAI占62%,G42占24%。美國(guó)收入反而降了34%。


OpenAI的百億美元合同目前是該公司最大的一筆潛在收入。但事情還要更加復(fù)雜,OpenAI同時(shí)扮演了四個(gè)角色:客戶、債權(quán)人,潛在股東,還有個(gè)人投資者,Altman等人做過(guò)天使投資人。

數(shù)據(jù)還顯示,246億美元訂單積壓中,只有15%在2026到2027年確認(rèn)。43%在2028到2029年。一旦交付不了產(chǎn)能,OpenAI有權(quán)終止合同并要求償還貸款。

雖然簽了百億合同,但OpenAI在同時(shí)押注多條路線,Cerebras只是其中一條。去年10月,OpenAI與AMD簽署了6GW部署協(xié)議。

實(shí)際上,每家科技巨頭都在推理上多方下注,沒(méi)有一家把Cerebras當(dāng)成主力路線孤注一擲。亞馬遜跟Cerebras合作,但也只讓它負(fù)責(zé)decode加速層。主力推理用的依然是自研Trainium3。

近幾年,推理芯片創(chuàng)業(yè)公司的歸宿也佐證了這一點(diǎn)。Groq被NVIDIA收購(gòu),Graphcore被SoftBank收購(gòu),UntetherAI被AMD收購(gòu)。而Cerebras是唯一獨(dú)立IPO的推理獨(dú)角獸。

對(duì)于科技巨頭而言,Cerebras又何嘗不是補(bǔ)丁,只是補(bǔ)丁熬到了上市。

再者,標(biāo)稱速度也有水分。Cerebras用了推測(cè)解碼技術(shù)——讓小模型先猜、大模型再驗(yàn)證,能快3倍。去掉技術(shù)加速,純硬件對(duì)推理速度的支持沒(méi)那么多。而且測(cè)試是在單用戶條件下跑的,實(shí)際多用戶并發(fā)時(shí)優(yōu)勢(shì)還會(huì)進(jìn)一步縮水。

更關(guān)鍵的是,Cerebras的44GB片上內(nèi)存只夠做"一問(wèn)一答"式的快速推理。但推理市場(chǎng)增長(zhǎng)最快的方向是AIAgent——需要長(zhǎng)對(duì)話、大上下文,內(nèi)存需求遠(yuǎn)超44GB。據(jù)Stratechery判斷:內(nèi)容在片上內(nèi)存內(nèi),Cerebras速度驚人;一旦超出,就不劃算了。

Cerebras未來(lái)能在推理市場(chǎng)拿下多大份額,取決于晶圓級(jí)架構(gòu)能否突破44GB內(nèi)存的天花板,從"一問(wèn)一答"走向更復(fù)雜的推理場(chǎng)景。

03

尾聲

總的來(lái)說(shuō),"英偉達(dá)對(duì)手"這個(gè)定位,更多來(lái)自資本市場(chǎng)的敘事需求,支撐溢價(jià)的核心假設(shè)是"稀缺AI基礎(chǔ)設(shè)施"。

Cerebras能走多遠(yuǎn),還是要看自身的稀缺性能否轉(zhuǎn)換成更大的商業(yè)價(jià)值。

拆開看,稀缺性的成立依賴于兩個(gè)前提:其一,OpenAI百億合同的交付執(zhí)行。其二,晶圓級(jí)架構(gòu)能否突破場(chǎng)景限制。

尤其是后者,如果技術(shù)迭代停滯、應(yīng)用場(chǎng)景難以拓展,那么一切的敘事都可能變成巨大的泡沫,淪為AI算力生態(tài)里的邊角備胎。

聲明:文中觀點(diǎn)均來(lái)自原作者,不代表格隆匯觀點(diǎn)及立場(chǎng)。特別提醒,投資決策需建立在獨(dú)立思考之上,本文內(nèi)容僅供參考,不作為任何實(shí)際操作建議,交易風(fēng)險(xiǎn)自擔(dān)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
住建部發(fā)話了:樓齡20年以上的老房子,這一次真輪到咱了!

住建部發(fā)話了:樓齡20年以上的老房子,這一次真輪到咱了!

蜉蝣說(shuō)
2026-06-12 11:32:10
美光、閃迪股價(jià)漲近20%

美光、閃迪股價(jià)漲近20%

界面新聞
2026-06-25 22:15:11
最差勁的美國(guó)總統(tǒng)是誰(shuí),不是特朗普、不是拜登,而是作惡多端的他

最差勁的美國(guó)總統(tǒng)是誰(shuí),不是特朗普、不是拜登,而是作惡多端的他

補(bǔ)懂事的孩紙
2026-04-30 03:58:44
剛剛,罕見地震兩連擊,間隔不到40秒,死傷慘重 | 地球知識(shí)局

剛剛,罕見地震兩連擊,間隔不到40秒,死傷慘重 | 地球知識(shí)局

地球知識(shí)局
2026-06-25 17:15:08
3-0!巴西用最殘忍的方式宣告回歸,日本隊(duì)現(xiàn)在內(nèi)心是崩潰的

3-0!巴西用最殘忍的方式宣告回歸,日本隊(duì)現(xiàn)在內(nèi)心是崩潰的

寶哥精彩賽事
2026-06-25 12:49:12
北京93歲老人終身未娶、無(wú)兒無(wú)女,去世前將千萬(wàn)財(cái)產(chǎn)贈(zèng)與照顧其12年的鄰居,法院判了

北京93歲老人終身未娶、無(wú)兒無(wú)女,去世前將千萬(wàn)財(cái)產(chǎn)贈(zèng)與照顧其12年的鄰居,法院判了

大風(fēng)新聞
2026-02-24 23:13:12
中國(guó)將迎來(lái)前所未有的死亡高峰,專家得出答案:是這些因素導(dǎo)致的

中國(guó)將迎來(lái)前所未有的死亡高峰,專家得出答案:是這些因素導(dǎo)致的

混沌錄
2026-05-28 22:53:01
母親和情夫一起10年,父親默不作聲縱容,卻在他50歲生日那天反擊

母親和情夫一起10年,父親默不作聲縱容,卻在他50歲生日那天反擊

白云故事
2025-04-24 10:35:08
我年過(guò)六十歲才恍然大悟:為什么大多數(shù)女人都對(duì)六十歲以上的男人敬而遠(yuǎn)之,甚至?xí)鲃?dòng)回避,兩個(gè)原因

我年過(guò)六十歲才恍然大悟:為什么大多數(shù)女人都對(duì)六十歲以上的男人敬而遠(yuǎn)之,甚至?xí)鲃?dòng)回避,兩個(gè)原因

心理觀察局
2026-05-04 08:51:10
對(duì)你有恩的人,不要請(qǐng)吃飯和送禮,用這三種方式報(bào)答最好:一、記住對(duì)方的好;二、當(dāng)對(duì)方需要時(shí),任何時(shí)間地點(diǎn)全力去幫;三、把自己活好

對(duì)你有恩的人,不要請(qǐng)吃飯和送禮,用這三種方式報(bào)答最好:一、記住對(duì)方的好;二、當(dāng)對(duì)方需要時(shí),任何時(shí)間地點(diǎn)全力去幫;三、把自己活好

德魯克博雅管理
2026-06-25 17:41:49
當(dāng)著全體籃協(xié)領(lǐng)導(dǎo)的面當(dāng)場(chǎng)罷賽,集體退場(chǎng),

當(dāng)著全體籃協(xié)領(lǐng)導(dǎo)的面當(dāng)場(chǎng)罷賽,集體退場(chǎng),

江啟
2026-06-25 09:47:02
裁員5萬(wàn)人,利潤(rùn)暴跌54%,連續(xù)22年霸榜的“神車”,敗給了時(shí)代

裁員5萬(wàn)人,利潤(rùn)暴跌54%,連續(xù)22年霸榜的“神車”,敗給了時(shí)代

快刀財(cái)經(jīng)
2026-06-23 08:11:44
湖北襄陽(yáng)一女子經(jīng)營(yíng)酒店10年,帶“華潤(rùn)”兩字遭索賠20萬(wàn),辯稱無(wú)主觀侵權(quán)意愿且已全面整改

湖北襄陽(yáng)一女子經(jīng)營(yíng)酒店10年,帶“華潤(rùn)”兩字遭索賠20萬(wàn),辯稱無(wú)主觀侵權(quán)意愿且已全面整改

大風(fēng)新聞
2026-06-25 13:54:04
本想靠世界杯收割全球?美國(guó)沒(méi)想到,自家后院全被中國(guó)商家包了

本想靠世界杯收割全球?美國(guó)沒(méi)想到,自家后院全被中國(guó)商家包了

體壇狗哥
2026-06-25 09:45:41
iPhone 17 Pro Max又突然降價(jià),蘋果把我整不會(huì)了

iPhone 17 Pro Max又突然降價(jià),蘋果把我整不會(huì)了

搞機(jī)小帝
2026-06-24 03:26:18
厄瓜多爾VS德國(guó):德國(guó)或?qū)⑤啌Q放水,厄瓜多爾有望拿分

厄瓜多爾VS德國(guó):德國(guó)或?qū)⑤啌Q放水,厄瓜多爾有望拿分

體育吐槽
2026-06-25 18:27:02
向太小兒子直播帶貨首秀!被懷疑有唐氏綜合癥,向太又遭質(zhì)疑!

向太小兒子直播帶貨首秀!被懷疑有唐氏綜合癥,向太又遭質(zhì)疑!

情感大頭說(shuō)說(shuō)
2026-06-24 18:32:58
戴軍:孫浩以前是保利大廈的音樂(lè)總監(jiān),去那里唱歌得給孫浩塞紅包

戴軍:孫浩以前是保利大廈的音樂(lè)總監(jiān),去那里唱歌得給孫浩塞紅包

荊楚寰宇文樞
2026-06-25 22:52:47
世界杯頭號(hào)偽強(qiáng)隊(duì)!英格蘭暴露致命短板,沒(méi)阿森納王牌真不行

世界杯頭號(hào)偽強(qiáng)隊(duì)!英格蘭暴露致命短板,沒(méi)阿森納王牌真不行

瀾歸序
2026-06-25 08:09:05
巴斯托尼轉(zhuǎn)會(huì)還沒(méi)完?皇馬穆帥想要購(gòu)買,國(guó)米已準(zhǔn)備好替補(bǔ)人選

巴斯托尼轉(zhuǎn)會(huì)還沒(méi)完?皇馬穆帥想要購(gòu)買,國(guó)米已準(zhǔn)備好替補(bǔ)人選

里芃芃體育
2026-06-26 00:30:04
2026-06-26 03:56:49
IPO那點(diǎn)事 incentive-icons
IPO那點(diǎn)事
全球視野,下注中國(guó)
3689文章數(shù) 1471關(guān)注度
往期回顧 全部

科技要聞

存儲(chǔ)成本壓力山大!蘋果罕見全球提價(jià)

頭條要聞

女孩在網(wǎng)紅景點(diǎn)拍照時(shí)墜湖身亡 前一天剛參加中考

頭條要聞

女孩在網(wǎng)紅景點(diǎn)拍照時(shí)墜湖身亡 前一天剛參加中考

體育要聞

世界杯最動(dòng)人一吻:我若離世 你就改嫁吧

娛樂(lè)要聞

這國(guó)產(chǎn)劇太裝了,居然還熱播第一?

財(cái)經(jīng)要聞

又有紙尿褲送檢后被檢測(cè)出甲酰胺!

汽車要聞

老板們的新座駕!65萬(wàn)元起,尊界V800/V680開啟預(yù)訂

態(tài)度原創(chuàng)

教育
時(shí)尚
家居
本地
數(shù)碼

教育要聞

每晚帶背真的給我學(xué)上癮了!!!不知道暑期背什么的新傳人請(qǐng)看這里!!!

女人不管多大年紀(jì),夏天都要準(zhǔn)備一兩條過(guò)膝裙,舒適又提氣質(zhì)

家居要聞

綠意盎然 自然之境

本地新聞

2026世界杯全勤太難?這份保姆級(jí)攻略請(qǐng)收好

數(shù)碼要聞

徠卡SL3-P全畫幅相機(jī)發(fā)布:售45000元 1.76億像素超高分辨率

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版