无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

全球最大芯片要上市了!先后拿下OpenAI、亞馬遜,Cerebras賭對(duì)了什么?

0
分享至


你能想象嗎?

一塊AI芯片,做到接近一臺(tái)iPad的大小。

這不是概念設(shè)計(jì),而是一家正在沖刺上市的AI芯片公司,給出的答案就在不久前,Cerebras披露了招股書,這家公司開始正式走向臺(tái)前。

從數(shù)據(jù)看,它的增長(zhǎng)幾乎是“跳躍式”的。

2022年?duì)I收只有2460萬美元,到2025年已經(jīng)達(dá)到5.10億美元,三年增長(zhǎng)超過19倍。

更關(guān)鍵的是,盈利也在同步發(fā)生變化。2024年還虧損4.82億美元,到2025年已經(jīng)轉(zhuǎn)正,實(shí)現(xiàn)2.38億美元凈利潤(rùn)。

今年以來,Cerebras更是連續(xù)拿下兩個(gè)關(guān)鍵客戶。一邊是OpenAI,簽下超過百億美元級(jí)別的算力協(xié)議;另一邊是亞馬遜,開始在云側(cè)引入其芯片做推理加速。

這意味著,它開始逐漸進(jìn)入主流算力體系。

資本市場(chǎng)的預(yù)期也在抬高。據(jù)外媒報(bào)道,Cerebras計(jì)劃募資超過30億美元,對(duì)應(yīng)估值至少350億美元。

所以問題來了,一家把芯片做到“iPad大小”的公司,到底在解決什么問題?

今天,我們就來聊聊Cerebras。


GPU,不是AI計(jì)算的答案

先來說說 Cerebras 為什么會(huì)存在。很多人可能不知道,過去40年,計(jì)算行業(yè)始終在印證一個(gè)鐵律:

新的計(jì)算需求,終將催生新的計(jì)算架構(gòu)。

PC時(shí)代是 x86,移動(dòng)時(shí)代是 ARM,圖形時(shí)代是 GPU。每當(dāng)新的計(jì)算范式出現(xiàn),行業(yè)最初總是試圖用舊架構(gòu)“湊合”,但當(dāng)技術(shù)演進(jìn)到一定階段,就會(huì)不可避免地發(fā)現(xiàn)——舊架構(gòu)已達(dá)到極限,必須重構(gòu)底層系統(tǒng)。

現(xiàn)在,這件事正在AI 身上重演。

AI 的計(jì)算方式,和過去完全不同。簡(jiǎn)單來說,過去的計(jì)算,大多是“局部、獨(dú)立”的,比如圖形渲染,每個(gè)像素可以各算各的,互不影響。

但AI 模型不一樣,它本質(zhì)上是一個(gè)高度耦合的計(jì)算網(wǎng)絡(luò)。在這個(gè)網(wǎng)絡(luò)中,數(shù)據(jù)、參數(shù)和計(jì)算過程之間需要進(jìn)行極其頻繁的信息交換。

這就導(dǎo)致了一個(gè)根本性的轉(zhuǎn)變:AI本質(zhì)上是一個(gè)“通信密集型”的計(jì)算問題,而不僅僅是一個(gè)單純的“算力”問題。

這也是GPU 開始遇到瓶頸的根本原因。

GPU 的優(yōu)勢(shì)在于并行計(jì)算,但前提是“任務(wù)彼此獨(dú)立”。而在 AI 里,每一步計(jì)算都依賴前一步結(jié)果,大量時(shí)間花在“等數(shù)據(jù)”。

這種架構(gòu)上的不匹配,在AI模型的訓(xùn)練和推理階段暴露無遺。

在訓(xùn)練階段,單卡不夠強(qiáng),只能把模型拆開,分布到上千張GPU上。但一旦拆開,就必須頻繁通信,效率迅速下降,同時(shí)系統(tǒng)復(fù)雜度和成本飆升。

簡(jiǎn)單說就是,單卡不夠,多卡低效。

到了推理階段,問題就更加直觀了。

模型在生成每一個(gè)詞(Token)時(shí),都需要完整地運(yùn)行一遍整個(gè)模型。但由于模型體積過于龐大,無法完整加載到芯片內(nèi)部的緩存中,計(jì)算單元只能不斷地從外部?jī)?nèi)存中搬運(yùn)數(shù)據(jù)。

問題在于,這個(gè)“搬數(shù)據(jù)”的過程,遠(yuǎn)比“算數(shù)據(jù)”慢。目前,高端GPU普遍采用了HBM(高帶寬內(nèi)存)技術(shù),但HBM的特點(diǎn)是“容量大而速度相對(duì)較慢”。

Cerebras創(chuàng)始人Andrew Feldman曾提供過一組直觀的數(shù)據(jù):以一個(gè)相對(duì)較小的70億參數(shù)(7B)模型為例,假設(shè)每個(gè)權(quán)重占用16位(16-bit),那么生成一個(gè)詞,就需要從內(nèi)存中搬運(yùn)約140GB的數(shù)據(jù)。

而為了生成下一個(gè)詞,系統(tǒng)必須再次搬運(yùn)這140GB的數(shù)據(jù),如此周而復(fù)始。這種計(jì)算模式對(duì)內(nèi)存帶寬的消耗是極其驚人的。

結(jié)果就是,在某些場(chǎng)景下,GPU的實(shí)際利用率甚至可能跌至5%以下。這種高成本、高延遲的破架構(gòu),怎么可能撐得起未來那些要求毫秒級(jí)響應(yīng)的實(shí)時(shí)AI應(yīng)用?

一塊接近iPad大小的芯片

對(duì)于這些問題,Cerebras給出的解法,不僅很直接,也很極端:

把芯片做到足夠大,大到可以把“算力、內(nèi)存、帶寬”都放進(jìn)同一塊硅片里。

就這樣,Cererbas打造了全球首創(chuàng)且唯一的商業(yè)化晶圓級(jí)處理器——晶圓級(jí)引擎(WSE),并聲稱其第三代AI芯片WSE-3是“史上大批量推向市場(chǎng)的最大、最快AI芯片”。

與GPU相比,WSE-3的最大特點(diǎn)就是,大。

WSE-3的面積是4.6萬平方毫米,接近一塊iPad屏幕;而H100只有814平方毫米,兩者相差整整57倍。

用Feldman自己的比喻來說:

“想象一個(gè)玻璃杯就是內(nèi)存,里面裝的可樂是數(shù)據(jù),而你的嘴巴代表算力。你能喝到可樂的速度,完全取決于吸管的粗細(xì)。英偉達(dá)GPU的根本問題,就在于這根吸管太細(xì)了。而我們的破局之道是——直接把吸管扔掉,端起杯子往嘴里倒。

這瘋狂的尺寸,直接砸出了三個(gè)顛覆性的結(jié)果:

第一,計(jì)算被暴力“集中”了。

WSE-3喪心病狂地塞進(jìn)了90萬個(gè)計(jì)算核心,是H100的52倍!更恐怖的是,這90萬個(gè)核心全在一塊硅片上,緊緊挨著,壓根不需要跨芯片通信。

第二,是內(nèi)存被“拉近”了。

傳統(tǒng)GPU依賴HBM(本質(zhì)是DRAM),容量大,但訪問慢;SRAM速度極快,但容量小。

Cerebras的做法,是直接把芯片做大到可以放下足夠多的SRAM——WSE-3集成了44GB片上SRAM,而H100只有約0.05GB,相差880倍。

這意味著,大模型的參數(shù)可以直接“貼臉”放在計(jì)算單元旁邊,再也不用來回倒騰了。

第三,也是最關(guān)鍵的,是帶寬問題被“消掉”了。

WSE-3的片上內(nèi)存帶寬達(dá)到21 PB/s,而H100大約是0.003 PB/s,相差7000倍;片上互連帶寬也高出3700倍以上。

在GPU體系里,大量時(shí)間花在“搬數(shù)據(jù)”上。而在WSE里,數(shù)據(jù)基本不需要離開芯片。

總結(jié)起來,其實(shí)Cerebras就做了一件事:讓數(shù)據(jù)不再流動(dòng),讓計(jì)算圍繞數(shù)據(jù)發(fā)生。

誰在為這個(gè)瘋狂的故事買單?

技術(shù)再牛,賣不出去也是白搭。Cerebras面臨的現(xiàn)實(shí)拷問是:誰來掏錢?

答案是,中東土豪。

2022到2025年,公司收入從2460萬美元一路增長(zhǎng)到5.1億美元,三年翻了超過20倍;凈利潤(rùn)也在2025年首次轉(zhuǎn)正,達(dá)到2.38億美元。

但這錢,幾乎全是中東老鐵砸的。

2024年,阿布扎比的G42貢獻(xiàn)了85%的營(yíng)收;2025年,阿聯(lián)酋人工智能大學(xué)(MBZUAI)和G42聯(lián)手包攬了87%的收入。

這家公司賺的錢,幾乎都來自中東。

換句話說,Cerebras的命脈,全捏在兩個(gè)中東大客戶手里。 這種走鋼絲般的營(yíng)收結(jié)構(gòu),自然成了IPO時(shí)投資人最忌憚的定時(shí)炸彈。

為了自救,Cerebras開始瘋狂拉客。真正的轉(zhuǎn)折點(diǎn),來自O(shè)penAI。

2026年1月,Cerebras拿下了史詩(shī)級(jí)大單:2026到2028年,為OpenAI提供高達(dá)750兆瓦的算力,總金額超過100億美元!

不僅如此,OpenAI還倒貼10億美元(約合人民幣68億元),幫Cerebras建數(shù)據(jù)中心。

這背后的水很深。OpenAI的掌門人Sam Altman,本身就是Cerebras的早期投資人,而且早在2017年,OpenAI就已經(jīng)盯上了Cerebras的技術(shù)。

巨頭入場(chǎng),風(fēng)向徹底變了。

2026年3月,AWS(亞馬遜云)也坐不住了,成為首家吃螃蟹的超大規(guī)模云廠商。

AWS的玩法很雞賊:在推理任務(wù)里,用自家的Trainium芯片搞定“理解輸入”,然后把“生成輸出”這種臟活累活扔給Cerebras的CS-3芯片。兩者高速互聯(lián),雙劍合璧。

據(jù)說,這套組合拳的速度,是現(xiàn)有方案的5倍以上!

/ 04 /

決戰(zhàn)英偉達(dá),護(hù)城河到底在哪?

只要在這個(gè)圈子里混,就繞不開那個(gè)終極靈魂拷問:

你憑什么干掉英偉達(dá)的護(hù)城河?

所有整個(gè)AI算力行業(yè)都相信一個(gè)故事:CUDA生態(tài),就是英偉達(dá)堅(jiān)不可摧的護(hù)城河。

黃仁勛在GTC 2026上也是這么放話的:“CUDA搞了20年,早就長(zhǎng)在每一朵云、每一臺(tái)電腦里了。我們的護(hù)城河,是整個(gè)軟件生態(tài)!”

但在挑戰(zhàn)者Feldman眼里,CUDA的神話,被嚴(yán)重夸大了。

原因是,CUDA在訓(xùn)練側(cè)確實(shí)有價(jià)值,但在推理側(cè),幾乎不存在鎖定。

現(xiàn)在的AI開發(fā),早就被PyTorch統(tǒng)領(lǐng)了,應(yīng)用層和底層硬件已經(jīng)脫鉤。只要編譯器給力,模型在不同硬件之間橫跳,根本不是難事。

“從NVIDIA切到Cerebras,再切到別人家,這件事情在推理端并不難?!?/p>

相比虛無縹緲的CUDA生態(tài),F(xiàn)eldman看得很透:英偉達(dá)真正的護(hù)城河,是它那令人絕望的市場(chǎng)份額。

比起CUDA建立的生態(tài),F(xiàn)eldman認(rèn)為英偉達(dá)真正的護(hù)城河在市場(chǎng)份額。

市場(chǎng)份額本身,就是最無解的護(hù)城河。

他舉了Intel的例子,即便連續(xù)犯錯(cuò),依然能長(zhǎng)期占據(jù)70%+的市場(chǎng)份額,AMD花了十年,也只拿到20%多。

這意味著,一旦成為默認(rèn)選項(xiàng),后來者即使更好,也需要極長(zhǎng)時(shí)間才能撬動(dòng)。

放在今天的英偉達(dá)身上,這個(gè)優(yōu)勢(shì)更明顯:所有人都在它的體系里學(xué)習(xí)AI、構(gòu)建AI,它就是采購(gòu)的起點(diǎn)?,F(xiàn)在的英偉達(dá)就是那個(gè)“默認(rèn)起點(diǎn)”,所有人都在它的體系里學(xué)AI、做AI。

但Feldman并不絕望。他預(yù)測(cè),五年后,英偉達(dá)接近100%的壟斷份額,可能會(huì)跌到50%–60%。

理由很簡(jiǎn)單:訓(xùn)練市場(chǎng)依然是英偉達(dá)的天下,但真正龐大的推理市場(chǎng)正在井噴,而這個(gè)市場(chǎng),對(duì)新架構(gòu)極其渴望!

同時(shí),F(xiàn)eldman也相信另一個(gè)暴論:

即使在未來,芯片公司的價(jià)值,也將徹底碾壓模型公司!

他的邏輯來自一個(gè)很經(jīng)典的比喻,短期市場(chǎng)是“投票機(jī)”,長(zhǎng)期是“稱重機(jī)”。

模型公司的優(yōu)勢(shì)周期很短,可能只有幾個(gè)月,領(lǐng)先與被超越在不斷切換,很難沉淀長(zhǎng)期壁壘。

而芯片不同,它的壁壘在物理層,制造、工藝、供應(yīng)鏈、工程能力,這些東西一旦建立,很難被快速?gòu)?fù)制。

過去幾十年,真正長(zhǎng)期偉大的公司,大多來自這一層。

文/林白

PS:如果你也在尋找投資AI資產(chǎn)的機(jī)會(huì),歡迎掃碼加入我們的交流群。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
這和不穿有啥區(qū)別?徐璐真空上陣,身材火辣,搶了所有女星風(fēng)頭!

這和不穿有啥區(qū)別?徐璐真空上陣,身材火辣,搶了所有女星風(fēng)頭!

川渝視覺
2026-05-27 22:29:45
燃油車“反擊”新能源車,成本催升訂單

燃油車“反擊”新能源車,成本催升訂單

大象新聞
2026-06-13 15:33:15
巴坎布喊話中國(guó)球迷:我是“快樂男孩”,世界杯請(qǐng)為民主剛果加油

巴坎布喊話中國(guó)球迷:我是“快樂男孩”,世界杯請(qǐng)為民主剛果加油

懂球帝
2026-06-14 05:13:10
37歲《吸血鬼日記》女主NBA場(chǎng)邊熱舞,破洞衫露黑bra,賽后:像觸電!

37歲《吸血鬼日記》女主NBA場(chǎng)邊熱舞,破洞衫露黑bra,賽后:像觸電!

追星雷達(dá)站
2026-06-13 01:09:38
澤連斯基宣布前線士兵月收入近5萬元,烏軍開始砸錢穩(wěn)住前線

澤連斯基宣布前線士兵月收入近5萬元,烏軍開始砸錢穩(wěn)住前線

桂系007
2026-06-12 23:33:01
哈登于凌晨3點(diǎn)因非法攜帶手槍在休斯敦被捕 此前他在水煙酒吧聚會(huì)

哈登于凌晨3點(diǎn)因非法攜帶手槍在休斯敦被捕 此前他在水煙酒吧聚會(huì)

蘭亭墨未干
2026-06-14 00:46:04
我住院未婚妻從未探望,我沉默退婚,出院當(dāng)天她瘋狂來電質(zhì)問

我住院未婚妻從未探望,我沉默退婚,出院當(dāng)天她瘋狂來電質(zhì)問

云端小院
2026-06-14 06:51:39
哈登被捕更多細(xì)節(jié)曝光:凌晨3點(diǎn)41分被捕 之前與朋友在水煙館聚會(huì)

哈登被捕更多細(xì)節(jié)曝光:凌晨3點(diǎn)41分被捕 之前與朋友在水煙館聚會(huì)

越嶺尋蹤
2026-06-14 05:42:38
突發(fā),下周可能有大利好。有色金屬,或迎來超級(jí)大周期

突發(fā),下周可能有大利好。有色金屬,或迎來超級(jí)大周期

風(fēng)風(fēng)順
2026-06-14 00:00:07
毛岸青婚后九年未育,毛主席找他談話,可后來竟不讓她住院待產(chǎn)?

毛岸青婚后九年未育,毛主席找他談話,可后來竟不讓她住院待產(chǎn)?

瑩瑩的歷史說
2026-06-12 01:21:48
37天,二胖躺在大衣哥朱之文家門口,整整37天。

37天,二胖躺在大衣哥朱之文家門口,整整37天。

阿振觀點(diǎn)
2026-06-08 12:23:52
6月該換菜譜了,菜市場(chǎng)最該買7大的黃金菜,看著有食欲,清爽不膩

6月該換菜譜了,菜市場(chǎng)最該買7大的黃金菜,看著有食欲,清爽不膩

阿龍美食記
2026-06-10 20:32:49
世界杯裁判馬寧哽咽回應(yīng)

世界杯裁判馬寧哽咽回應(yīng)

極目新聞
2026-06-13 13:55:25
戴志誠(chéng)和袁茵結(jié)婚多年后的合影,二人看起來挺有夫妻相的

戴志誠(chéng)和袁茵結(jié)婚多年后的合影,二人看起來挺有夫妻相的

喜文多見01
2026-06-01 07:30:43
0勝8負(fù)墊底球隊(duì)迎新帥!43歲亞亞·圖雷首次獨(dú)立執(zhí)教

0勝8負(fù)墊底球隊(duì)迎新帥!43歲亞亞·圖雷首次獨(dú)立執(zhí)教

林間小溫柔
2026-06-14 00:21:55
人口達(dá)到14.5億,印度生不動(dòng)了,國(guó)家還未富強(qiáng)…

人口達(dá)到14.5億,印度生不動(dòng)了,國(guó)家還未富強(qiáng)…

福建睿平
2026-06-14 07:25:41
每體:德斯特引多隊(duì)關(guān)注,巴薩擁有球員20%轉(zhuǎn)會(huì)分成

每體:德斯特引多隊(duì)關(guān)注,巴薩擁有球員20%轉(zhuǎn)會(huì)分成

懂球帝
2026-06-14 03:17:11
巴基斯坦的天塌了!美國(guó)和印度太狠了,中國(guó):真的愛莫能助

巴基斯坦的天塌了!美國(guó)和印度太狠了,中國(guó):真的愛莫能助

阿傖說事
2026-06-13 14:00:30
重頭戲 巴西1-1!安切洛蒂又背鍋又封神!大羅、卡卡看得直搖頭!

重頭戲 巴西1-1!安切洛蒂又背鍋又封神!大羅、卡卡看得直搖頭!

越嶺尋蹤
2026-06-14 08:59:03
隨著無錫1-0,宿遷3-0,泰州1-0,蘇超最新積分榜出爐

隨著無錫1-0,宿遷3-0,泰州1-0,蘇超最新積分榜出爐

側(cè)身凌空斬
2026-06-13 21:43:43
2026-06-14 09:51:00
硅基觀察Pro incentive-icons
硅基觀察Pro
人工智能新時(shí)代的商業(yè)智庫(kù)和價(jià)值燈塔
917文章數(shù) 65關(guān)注度
往期回顧 全部

科技要聞

Anthropic最強(qiáng)模型被禁,傳亞馬遜通風(fēng)報(bào)信

頭條要聞

牛彈琴:一不小心美國(guó)又創(chuàng)造歷史 英格蘭隊(duì)被"一鍋端"

頭條要聞

牛彈琴:一不小心美國(guó)又創(chuàng)造歷史 英格蘭隊(duì)被"一鍋端"

體育要聞

美國(guó)4比1巴拉圭:這統(tǒng)治力真是美國(guó)隊(duì)?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋?cè)W(wǎng)!

財(cái)經(jīng)要聞

金價(jià)跌至900元關(guān)口,大媽又來抄底了!

汽車要聞

深藍(lán)S07華為乾崑激光版增程車型上市 限時(shí)15.49萬元起

態(tài)度原創(chuàng)

手機(jī)
旅游
家居
游戲
時(shí)尚

手機(jī)要聞

告別4499元!小米18起售價(jià)將突破5000元大關(guān) 首發(fā)高通驍龍8E6

旅游要聞

探秘西班牙旅游科技之旅;酒店業(yè)大內(nèi)卷誰該負(fù)責(zé) | 一周視頻速遞

家居要聞

空間微調(diào) 移形換境

拉完了!育碧《星戰(zhàn)》本規(guī)劃6款DLC 最終僅落地2部

伊姐周六熱推:電視劇《南部檔案》;電視劇《意外調(diào)查組》......

無障礙瀏覽 進(jìn)入關(guān)懷版