无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

快Token生意浮出水面:Cerebras上市,華爾街重新給AI硬件定價

0
分享至



Cerebras上市首日直接把AI硬件市場的情緒推到了一個新位置。公司IPO定價185美元,首日開盤350美元,盤中最高觸及385美元,按盤中價格計算,市值一度沖到800億美元以上。Reuters稱,這是2026年以來規模最大的IPO之一,Cerebras也因為晶圓級AI芯片、OpenAI和亞馬遜等客戶關系,被市場放進“英偉達之外的AI基礎設施資產”里重新定價。

這個漲幅放在傳統半導體估值框架里并不好解釋。Cerebras 2025年營收約5.1億美元,從上一年的大額虧損中轉正,但它還遠沒有進入成熟芯片公司的利潤兌現階段。二級市場愿意給出高估值,交易的不是當下利潤表,而是一個新的行業判斷:AI推理市場正在從“總吞吐競爭”,進入“交互速度競爭”。過去兩年,資金買的是GPU供給、HBM瓶頸、云廠商Capex上修;現在,模型廠商和開發者開始為另一件事付費——單個用戶能多快拿到Token。

Cerebras剛好卡在這個變化里。它不一定能在訓練、大模型通用推理和生態完整度上挑戰英偉達,也未必能成為所有AI算力場景里的最優解。但如果“快Token”成為大模型公司可以單獨收費的產品層,它的晶圓級架構就從技術奇觀變成了可交易資產。OpenAI承諾購買750MW Cerebras高速AI推理算力,并且雙方約定從2026年開始分階段部署;公司招股文件也披露了與OpenAI相關的大規模算力協議和未來交付安排。

這就是Cerebras上市最值得看的地方:它不是在復制英偉達,而是在提示市場,AI基礎設施的下一輪重估,可能不再只看“誰擁有更多GPU”,還要看“誰能在具體工作負載里交付更高價值的Token”。

快Token開始有價格,AI推理市場正在拆出新的估值層

過去AI算力的定價邏輯很粗暴:訓練模型需要更多GPU,云廠商上調資本開支,HBM和先進封裝供不應求,英偉達繼續拿走產業鏈最高利潤。這個邏輯依然成立,但它已經逐漸成為一致預期。真正有預期差的地方,開始轉向推理側。

推理和訓練最大的不同,是它直接貼著用戶行為走。訓練是階段性投入,推理是持續性消耗;訓練看大規模集群效率,推理看單位請求成本、響應速度、并發體驗和產品分層能力。用戶每天和AI交互多少次,每次請求消耗多少Token,等待幾秒能否接受,都會落到模型廠商的成本曲線和收入曲線上。

這里面最容易被低估的是速度。對普通問答,快一點慢一點只是體驗差異;對代碼生成、Agent工作流、工具調用、多輪迭代,慢幾秒會變成生產力損耗。開發者不只是要一個“更聰明”的模型,也要一個“更跟手”的模型。SemiAnalysis在Cerebras IPO前發布的深度報告把這個變化說得很直接:過了某個智能閾值之后,開發者更偏好更快的Token,而不是更聰明的Token。

這句話可以解釋Cerebras的估值彈性。Cerebras押注的不是最大吞吐,而是tokens/sec/user,也就是單個用戶拿到輸出的速度。OpenAI、Anthropic等模型公司已經在把服務拆成fast、priority、standard、batch等不同檔位,本質上是在測試速度能否成為獨立SKU。如果用戶愿意為高速模式付溢價,推理硬件就會出現新的分層:一類負責低成本大吞吐,一類負責高價值低延遲。

這對資本市場很關鍵。英偉達的估值錨來自通用算力、生態壁壘和GPU供給;Cerebras的估值錨更窄,但也更鋒利。它賭的是開發者和企業客戶愿意為更快響應支付溢價,尤其是在代碼、Agent、實時協作、交互式AI應用里。它不是英偉達的鏡像資產,更像一張“快推理期權”。

所以Cerebras首日暴漲,本質是資金在交易AI推理分層的右側信號。訓練資本開支已經被充分討論,GPU緊缺也被反復定價;快Token能不能形成穩定現金流,仍然處在預期差階段。這個階段,市場最愿意給高估值的公司,往往不是利潤最厚的公司,而是率先把新定價邏輯講清楚的公司。

晶圓級芯片給了Cerebras速度,也把它鎖進一組很硬的工程約束

Cerebras能講快Token故事,不是因為營銷口徑足夠激進,而是因為它的架構確實和GPU路線不同。WSE-3沒有把晶圓切成一顆顆芯片,而是把整片晶圓做成一個巨大的AI處理器。公開資料顯示,WSE-3采用臺積電5nm工藝,擁有約4萬億晶體管、90萬個計算核心和44GB片上內存。

這套架構的核心取舍很清楚:用片上SRAM和超高片上帶寬,換取低延遲decode能力。GPU、TPU、Trainium等主流AI加速器更多依賴HBM,優勢是容量大、生態成熟、適用范圍寬。Cerebras把大量存儲和計算放在同一片硅上,盡量減少數據離開芯片、離開封裝。對低batch、小并發、高交互的推理任務來說,這種設計有機會跑出傳統HBM系統不容易達到的用戶側Token速度。

這也是它最像“跑車”的地方。GPU像一套大規模運輸系統,可以服務海量并發和復雜生態;Cerebras更像為了少數高價值請求高速直達而設計的專用路線。它不追求在每個場景里贏,而是把一個場景打穿:低延遲、高交互、速度優先的推理decode。

但資本市場不能只看速度指標。Cerebras的護城河和硬傷來自同一個設計。

第一道硬約束是SRAM容量。44GB片上SRAM放在單芯片世界里很大,但和高端GPU常見的HBM容量相比并不占優。更麻煩的是,SRAM scaling正在放緩。WSE-1到WSE-2,SRAM容量從18GB提升到40GB;WSE-2到WSE-3,只從40GB提升到44GB。邏輯晶體管還在繼續變密,SRAM卻沒有同步線性縮小。對GPU廠商來說,可以繼續疊HBM、擴先進封裝、做內存池化;對整片晶圓路線來說,平面面積已經很滿,再加SRAM就要擠壓計算面積。

第二道硬約束是片外I/O。Cerebras強在片上帶寬,弱在片外出口。只要模型能放進單片或少數幾片WSE,它的速度優勢就很明顯;模型一旦變大,上下文一旦拉長,就需要更多跨晶圓切分。流水線并行可以解決部分問題,但會帶來pipeline bubble、KV Cache壓力和階段間延遲。Agentic coding這類工作負載尤其麻煩,因為它天然需要長上下文、連續工具調用和多輪狀態保持。模型越大,越偏離Cerebras最舒服的形態。

第三道硬約束是系統成本。Cerebras不是把一顆便宜芯片插進服務器,而是交付一整套高復雜度系統。WSE-3功耗高,液冷、供電、封裝、連接器、數據中心管路都要定制。它的價值不是“更便宜的GPU替代品”,而是在某些推理速度區間,用復雜系統換極致交互速度。

這也是投資者需要分清的地方。Cerebras的技術足夠有辨識度,但它的商業化不能靠“晶圓很大”來兌現。市場最后會盯三個指標:快Token能不能持續賣出溢價,系統成本能不能被規模化部署攤薄,模型演進會不會把它的SRAM和I/O短板放大。

OpenAI訂單給了估值錨,也把客戶集中度和交付風險推到臺前

Cerebras這次能被資本快速接受,OpenAI是最大催化。按照雙方協議,OpenAI將部署750MW Cerebras高速AI推理算力,并且存在進一步擴展空間。部分第三方分析也把這項協議視為AI半導體初創公司歷史上最重要的商業合同之一,因為它把Cerebras從“技術路線押注”變成了“有大客戶、有長期訂單、有交付節奏”的AI基礎設施公司。

這筆訂單給了市場一個新錨點。硬件公司最難的是訂單能見度,尤其是像Cerebras這種非標準架構,客戶驗證周期長,部署門檻高,供應鏈和數據中心適配都更復雜。OpenAI的750MW承諾,相當于幫它跨過了最關鍵的商業化驗證門檻。市場愿意給高估值,交易的是OpenAI需求背書帶來的盈利兌現可能。

但這不是沒有代價的背書。OpenAI既是Cerebras最大的機會,也會成為它最大的風險因子。招股文件披露,OpenAI持有Cerebras相關認股權證,部分歸屬條件與市值門檻、付款門檻和算力交付掛鉤;媒體和第三方分析還提到OpenAI相關貸款、認股權證和未來收入確認之間存在復雜綁定關系。

資本語言翻譯一下:這不是一份簡單的客戶訂單,而是一份深度綁定合同。它提升了Cerebras的訂單能見度,也壓低了公司經營自主性;它讓市場看到了收入曲線,也放大了客戶集中度;它讓Cerebras獲得工作資本支持,也把交付節奏、數據中心建設、電力和冷卻能力變成了股價變量。

OpenAI發布基于Cerebras運行的模型,也強化了這條主線。GPT-5.3-Codex-Spark這種蒸餾模型,如果能在120B級別跑出極高tok/sec/user,說明Cerebras可以承接一類很有價值的開發者工作負載。對寫代碼、改代碼、連續調用工具的用戶來說,模型不一定非要最大,但響應必須足夠快。只要智能水平跨過可用門檻,速度就會變成付費理由。

問題在于,這條路的上限還沒有被證明。120B級別模型適合Cerebras,不代表1T參數、1M上下文窗口的大模型也適合。未來Agent工作負載如果繼續拉長上下文、擴大模型規模、強化多工具協作,Cerebras就要在速度、容量、成本之間繼續做取舍。它最好的商業路徑,可能不是承接所有前沿模型,而是在120B到數百B參數區間里,把高交互速度做到極致,服務愿意為效率付費的開發者和企業客戶。

這會影響它后續的估值切換。上市首日,市場買的是主題升溫和訂單想象;中期,市場要看OpenAI算力部署能不能按節奏落地;長期,市場會要求Cerebras證明,快Token不是一次性熱點,而是一條可持續的利潤曲線。如果750MW順利交付,額外擴展選項打開,公司可能從AI硬件新股切到推理基礎設施平臺;如果交付延遲、成本超支、速度溢價下降,估值會從“資產重估”切回“主題證偽”。

結語:快Token會不會成為AI硬件的新資產類別

Cerebras最準確的定位,不是“英偉達殺手”。這個說法太粗,也容易誤導投資者。英偉達控制的是通用AI算力底座,擁有CUDA生態、GPU路線、服務器集群和完整開發者網絡。Cerebras押注的是更窄的一條縫:AI推理分層之后,高交互速度能不能成為獨立付費層。

這條縫足夠窄,也足夠貴。窄,是因為它不覆蓋所有AI工作負載;貴,是因為一旦開發者、Agent和企業生產流真正依賴高速響應,速度就不只是體驗,而是生產力。資本市場喜歡的正是這種組合:市場剛開始理解,需求已經出現,大客戶已經站臺,兌現路徑還沒有完全被定價。

Cerebras的風險同樣清楚。它的硬件路線足夠鋒利,但SRAM容量、片外I/O、液冷和數據中心改造都不是小問題;它有OpenAI訂單背書,但客戶集中度和合同結構會持續壓在估值上;它可以講快Token溢價,但必須證明這個溢價能覆蓋復雜系統成本,而不是只停留在IPO敘事里。

所以,Cerebras上市真正給行業的提示不是“誰來挑戰英偉達”,而是AI算力競爭開始進入更細的分層:訓練看集群,通用推理看成本,高交互推理看速度。誰能在具體工作負載里交付更高價值的Token,誰就有機會拿到新的估值錨。

接下來,市場看Cerebras,不該只看股價漲了多少,而要看三個變量:OpenAI訂單兌現速度、快Token付費能力、以及模型演進是否繼續適配它的硬件邊界。跑通了,它會成為AI推理時代最有辨識度的基礎設施公司之一;跑不通,它也會成為這一輪AI硬件狂熱里最典型的高估值樣本。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“后悔了”!《給阿嬤的情書》原主演稱放棄機會遺憾,懇請再合作

“后悔了”!《給阿嬤的情書》原主演稱放棄機會遺憾,懇請再合作

童叔不飆車
2026-05-27 13:09:52
54:45!美國投票結果出爐,一個時代已結束,中國加速減持美債

54:45!美國投票結果出爐,一個時代已結束,中國加速減持美債

小陸搞笑日常
2026-05-27 15:50:24
普京簽署項法律,允許以“保護俄羅斯公民”為借口向他國部署軍隊

普京簽署項法律,允許以“保護俄羅斯公民”為借口向他國部署軍隊

山河路口
2026-05-26 14:52:00
詹姆斯帶隊的湖人到底算不算失敗?和科比一比差距全出來了

詹姆斯帶隊的湖人到底算不算失敗?和科比一比差距全出來了

體壇八點半的那些事兒
2026-05-28 11:34:13
外媒:中國已被得寸進尺的歐盟激怒,對歐洲“先兵后禮”十分罕見

外媒:中國已被得寸進尺的歐盟激怒,對歐洲“先兵后禮”十分罕見

一曲一場談
2026-05-27 15:35:08
14歲小七穿貝嫂的掛脖裙逛街,戴牙套笑容燦爛,進軍美妝業受阻

14歲小七穿貝嫂的掛脖裙逛街,戴牙套笑容燦爛,進軍美妝業受阻

譯言
2026-05-27 09:28:14
調整!5月28日晚間央視直播CBA總決賽有變,上海男籃外援迎大挑戰

調整!5月28日晚間央視直播CBA總決賽有變,上海男籃外援迎大挑戰

等等talk
2026-05-28 10:33:34
網吧老板當場趕人:這臺機器以后別想打這游戲了

網吧老板當場趕人:這臺機器以后別想打這游戲了

峽谷一級保護廢物
2026-05-27 10:20:52
余承東稱問界M9是地球上性能最強的SUV,理想高管回應:NB

余承東稱問界M9是地球上性能最強的SUV,理想高管回應:NB

識礁Farsight
2026-05-27 19:54:02
王鶴棣深夜喊不舒服,結果徐志勝整季的委屈被全網翻了出來!

王鶴棣深夜喊不舒服,結果徐志勝整季的委屈被全網翻了出來!

時間巡查
2026-05-27 00:13:48
民進黨發言人稱受不了國臺辦每周都批評賴清德“快被煩死了” 國臺辦:理屈才會詞窮

民進黨發言人稱受不了國臺辦每周都批評賴清德“快被煩死了” 國臺辦:理屈才會詞窮

每日經濟新聞
2026-05-27 20:46:49
華國鋒上報十三名不予釋放人員,毛主席簡短批示,令眾人默然不語

華國鋒上報十三名不予釋放人員,毛主席簡短批示,令眾人默然不語

嘮叨說歷史
2026-05-27 15:11:20
錢再多有什么用?67歲身價千萬的李幼斌現狀曝光,給所有人提了醒

錢再多有什么用?67歲身價千萬的李幼斌現狀曝光,給所有人提了醒

林輕吟
2026-05-22 07:33:52
傲慢 31歲德國老將拒握手王欣瑜惹眾怒:怒摔球拍 提前慶祝被罰分

傲慢 31歲德國老將拒握手王欣瑜惹眾怒:怒摔球拍 提前慶祝被罰分

風過鄉
2026-05-27 21:06:09
蕭華:造犯規不是假摔,將引入AI鷹眼系統幫助裁判

蕭華:造犯規不是假摔,將引入AI鷹眼系統幫助裁判

體壇周報
2026-05-28 09:47:20
塞爾維亞或迎巨變,數萬民眾涌上首都街頭,武契奇十年統治恐終結

塞爾維亞或迎巨變,數萬民眾涌上首都街頭,武契奇十年統治恐終結

近史博覽
2026-05-25 01:28:35
這和不穿有啥區別?徐璐真空上陣,身材火辣,搶了所有女星風頭!

這和不穿有啥區別?徐璐真空上陣,身材火辣,搶了所有女星風頭!

川渝視覺
2026-05-27 22:29:45
笑死!張雪師父牙哥要單挑德比斯?張雪:你是幼兒園想打大學生!

笑死!張雪師父牙哥要單挑德比斯?張雪:你是幼兒園想打大學生!

蘭妮搞笑分享
2026-05-28 00:00:47
停火協議形同虛設!美伊再度正面交鋒,中東局勢徹底變了

停火協議形同虛設!美伊再度正面交鋒,中東局勢徹底變了

近史博覽
2026-05-28 08:19:50
莫言:如果你混到沒人找你吃飯,沒人喊你聚會,連電話也沒幾個,那慶祝了,你不是人緣變差,而是真正覺醒了

莫言:如果你混到沒人找你吃飯,沒人喊你聚會,連電話也沒幾個,那慶祝了,你不是人緣變差,而是真正覺醒了

品讀時刻
2026-05-27 09:00:58
2026-05-28 12:31:00
財報信號站 incentive-icons
財報信號站
專注科技公司財報與AI戰略的信號捕捉
494文章數 31916關注度
往期回顧 全部

財經要聞

長鑫科技IPO過會,市值會到幾萬億?

頭條要聞

男子結婚22年兩兒子非親生 妻子承認出軌丈夫的堂哥

頭條要聞

男子結婚22年兩兒子非親生 妻子承認出軌丈夫的堂哥

體育要聞

這群老阿姨,是最硬核的馬刺球迷

娛樂要聞

曝大嫂冒充七七同學,林俊杰刪掉合照

科技要聞

臺積電3納米下半年漲價15% 明年或再漲10%

汽車要聞

限時補貼價9.28-10.98萬 MG 4X正式上市

態度原創

數碼
健康
旅游
本地
軍事航空

數碼要聞

LG Display世界首款240Hz RGB條紋子像素OLED面板進入量產

打外泌體會比干細胞更安全嗎

旅游要聞

人民建議丨網友支招,助力“泉城”文旅體驗提質升級

本地新聞

用剪紙的方式,打開江蘇揚州

軍事要聞

以軍稱已打死哈馬斯新任軍事領導人

無障礙瀏覽 進入關懷版