![]()
圖片來源: Cerebras Systems 官方產品照片
“AI算力變天?”
作者 | 家昌
編輯|云舒
出品|極新
紐約/舊金山,2026年5月16日 當地時間5月14日,AI芯片領域的"黑馬"企業Cerebras Systems在納斯達克掛牌交易,股票代碼CBRS。盡管上市首日盤中一度暴漲108%觸發熔斷,最終收盤漲幅回落至68%,但截至5月16日收盤,該公司股價仍較185美元的發行價大漲51%,市值達602億美元,成為2026年全球最大IPO,募資規模高達55.5億美元,打破了Uber以來美國科技行業的IPO紀錄。
這家專注于"晶圓級引擎"技術的芯片公司,憑借與OpenAI價值超200億美元的戰略合作協議,正以獨特的技術路線向英偉達長達十年的AI算力壟斷發起挑戰,引發全球科技產業對AI基礎設施變革的深度思考。
01
二十倍超額認購,定價屢創新高
Cerebras的IPO之路堪稱現象級。公司最初設定的發行價區間為115-125美元,后因市場需求火爆上調至150-160美元,最終定價185美元,超出上調后區間上限16%。據承銷商透露,本次IPO獲得了超過20倍的超額認購,吸引了包括主權財富基金、對沖基金和科技巨頭在內的全球頂級投資者參與。
"這不僅僅是一次IPO,更是市場對AI算力架構變革的投票。" 摩根士丹利科技行業分析師Michael Ng表示,"Cerebras的估值已經超越了傳統芯片公司的范疇,投資者看重的是其在AI推理領域的顛覆性潛力。"
Cerebras的上市募資規模達到55.5億美元,若承銷商行使超額配售權,總額將高達6.38億美元。這一數字遠超2025年芯片行業最大IPO——Arm的51億美元,也讓Cerebras成為繼Snowflake(2020年)之后美國科技行業最大的IPO案例。值得注意的是,Cerebras目前仍處于虧損狀態,2025年營收約為5.1億美元,凈虧損達12億美元。但投資者顯然更看重其增長潛力:自2026年1月與OpenAI達成合作以來,公司訂單量增長了370%,2026年第一季度營收同比增長215%。
02
晶圓級引擎,重新定義AI計算
Cerebras的核心競爭力在于其獨創的Wafer Scale Engine(WSE)晶圓級引擎技術,這與英偉達采用的多GPU集群方案形成鮮明對比。傳統GPU芯片僅占晶圓面積的一小部分,而Cerebras將整個12英寸晶圓制成單一芯片,面積相當于約56個傳統GPU,集成了1.2萬億個晶體管,擁有188GB的片上內存,帶寬高達24PB/s。
"這不是簡單的芯片尺寸放大,而是計算架構的革命。"Cerebras首席技術官Sean Lie解釋道,"傳統GPU集群需要通過網絡傳輸數據,而我們的WSE-3芯片將所有計算和存儲集成在單一晶圓上,消除了數據移動瓶頸,這是實現超低延遲推理的關鍵。"
![]()
圖片來源:《Cerebras WSE-3 vs Nvidia H100/H200/B200: 詳細技術對比 —— 誰才是 AI 時代真正的 “芯片之王“》
實測數據顯示,Cerebras的CS-3系統在AI推理任務上展現出壓倒性優勢:
在Llama 3.3 70B模型推理中,CS-3速度達2140 tokens/秒,而英偉達旗艦DGX B200僅為120 tokens/秒,快18倍;
在GPT-OSS-120B模型上,實現3000 tokens/秒的推理速度,是GPU方案的15倍;總體擁有成本(TCO)比DGX B200低32%,功耗降低33%。
這種性能優勢在實時應用場景中尤為關鍵。例如,在OpenAI的Codex-Spark代碼生成服務中,基于Cerebras算力的版本能夠實現"打字即響應"的體驗,延遲從GPU方案的數百毫秒降至數十毫秒,使開發者的工作效率提升40%以上。
03
OpenAI 200億美元押注,重塑算力格局
Cerebras敢于挑戰英偉達,背后離不開OpenAI的強力支持。2026年1月,雙方宣布達成一項具有里程碑意義的合作協議:OpenAI承諾在未來數年內支付超過200億美元采購Cerebras的AI算力容量(約750兆瓦),并聯合進行AI模型與硬件的協同設計。此外,OpenAI還向Cerebras提供了10億美元的營運資金貸款,以支持其算力基礎設施建設。
"這不是簡單的供應商關系,而是戰略級的技術協同。"OpenAI基礎設施副總裁Sachin Katti表示,"Cerebras為我們提供了專用的低延遲推理解決方案,意味著更快的響應速度、更自然的交互體驗,以及將實時AI擴展到更多用戶的堅實基礎。"這項合作的核心在于解決AI產業的"推理瓶頸"。隨著大模型參數突破萬億級別,推理成本已占AI總支出的60%以上,成為制約AI應用普及的關鍵因素。OpenAI的ChatGPT目前周活躍用戶超9億,推理成本巨大,而Cerebras的技術能夠將每token成本降低32%,同時將延遲降低90%以上。
具體部署將分階段進行:2026年下半年開始,Cerebras將為OpenAI提供首批150兆瓦算力,主要用于Codex系列產品;2027年擴展至400兆瓦,支持GPT-5系列的實時推理;2028年全面部署750兆瓦,覆蓋OpenAI所有核心服務。這將成為全球最大規模的高速AI推理部署,足以支持每秒處理超過10億個token的請求量。
04
差異化競爭,撕開壟斷裂縫
Cerebras的崛起恰逢AI算力市場格局劇變的關鍵節點。長期以來,英偉達憑借CUDA軟件生態和高性能GPU,占據了AI訓練市場90%、推理市場80%的份額,2026財年營收達2159億美元,是Cerebras的423倍。但Cerebras并未選擇正面競爭,而是通過差異化定位尋找突破口。
"我們不是要取代英偉達,而是要填補市場空白。"Cerebras首席執行官Andrew Feldman表示,"英偉達在訓練和通用計算領域的優勢無可替代,但在超大規模、低延遲推理場景,我們的技術路線更具優勢。"這種差異化戰略已初見成效。除OpenAI外,Cerebras還與AWS達成戰略合作,為其提供專用推理算力;與Core42(原G42)合作部署OpenAI的GPT-OSS-120B模型,為企業客戶提供每秒3000 tokens的推理服務。在金融、醫療等對實時性要求極高的行業,Cerebras的解決方案已開始替代部分GPU集群。
例如,摩根大通采用Cerebras系統處理高頻交易數據,將風險評估響應時間從2秒縮短至0.1秒,同時降低了40%的算力成本;梅奧診所利用Cerebras加速醫學影像分析,使AI輔助診斷的周轉時間從4小時降至15分鐘,提升了緊急病例的救治效率。
05
生態構建與產能爬坡
盡管市場前景廣闊,Cerebras仍面臨多重挑戰。最核心的問題在于軟件生態構建——英偉達的CUDA平臺已積累15年,擁有90%的AI開發者用戶基礎,而Cerebras的軟件開發工具鏈仍在完善中。此外,晶圓級芯片的生產良率和供應鏈穩定性也是長期考驗。
"生態系統是英偉達最堅固的護城河。"SemiAnalysis分析師Myron Xie指出,"Cerebras需要吸引更多開發者為其平臺優化模型,這需要時間和持續投入。"產能方面,Cerebras目前依賴臺積電的先進工藝,晶圓級芯片的生產難度遠超傳統GPU,良率控制是關鍵。據行業消息,Cerebras WSE-3的良率已從早期的30%提升至75%,但仍低于傳統芯片的90%以上水平。面對挑戰,Cerebras正加速構建生態系統。公司近期推出了Model Zoo計劃,提供100多個主流大模型的WSE優化版本;同時與Hugging Face合作,簡化模型遷移流程。此外,Cerebras還計劃在2027年推出WSE-4芯片,集成2.4萬億個晶體管,性能將再提升一倍。
![]()
圖片來源:Cerebras Systems 公司納斯達克上市敲鐘儀式
Cerebras的上市大漲51%,不僅是資本市場對一家芯片公司的認可,更是對AI算力新范式的集體押注。在OpenAI等巨頭的推動下,AI產業正從"追求參數規模"向"追求實時體驗"轉變,而Cerebras的晶圓級技術恰好契合了這一趨勢。"AI的下一個十年將由推理速度決定。"Andrew Feldman在上市敲鐘儀式上表示,"我們與OpenAI的合作只是開始,未來將有更多企業意識到低延遲推理的價值,這將重塑整個AI算力市場格局。"對于英偉達而言,Cerebras的崛起并非末日,而是促使其加速創新的催化劑。據悉,英偉達已在開發針對推理優化的專用芯片,預計2027年推出的GB200 NVL將重點提升單芯片推理性能。
無論最終競爭格局如何,Cerebras的上市都標志著AI芯片行業進入多元化時代,這對于整個AI產業的健康發展無疑是重大利好。隨著算力成本的降低和性能的提升,AI技術將更快地滲透到各行各業,真正實現"普惠AI"的愿景。
更多干貨分享敬請注我們的公眾號與視頻號~超多精彩對話內容等待您的解鎖!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.