OpenAI的芯片終于與大家見面了,只是亮相的場合有點讓人意外:薩姆·奧爾特曼與博通總裁兼CEO陳福陽一起捧著一塊標準的12英寸晶圓,底座上印著芯片的名字:Jalape?o。
![]()
圖源:OpenAI
Jalape?o原意是墨西哥辣椒,雷科技(ID:leitech)最初并沒有深想這個名字,直到看完一個分析視頻時才突然想到:這個詞有點耳熟。
努力回想后,我想起自己第一次聽到這個詞,是作為雷科技MWC報道團成員,在巴塞羅那MWC會場的小食攤上買了一個taco時。當時我因為那股酸爽帶勁的辣味,問攤主那是什么辣椒,得到的答案就是——Jalape?o。
Jalape?o的特點是帶勁卻又平易近人(這也是它隨著西班牙文化而風靡全球的原因),或許也代表著OpenAI這款芯片的特點:性能足夠強,且性價比十足。
好了,閑聊先暫告一段落,讓我們來審視一下這塊芯片。
Jalape?o,OpenAI向英偉達發了一張宣戰貼
說實話,OpenAI對Jalape?o的實際參數、制程等信息目前都還在“嚴防死守”,只是非常籠統地說:它是目前同規格里最強的,已經在實驗室里跑通了GPT-5.3-Codex-Spark。
這個模型可能大家接觸得不多,實際上是OpenAI專為實時編程需求訓練的小型Codex模型,對芯片的需求是“低延遲、高并發”,而非絕對性能。再結合Jalape?o所采用的ASIC架構,基本上可以猜測其性能應該落在Google的第八代TPU芯片附近。
如果我們按第八代TPU中最高性能的TPU 8t(12.6PFLOPS)來算,那么Jalape?o的理論算力或許會在13PFLOPS左右(僅猜測)。但是,如果從Jalape?o的推理用途出發,雷科技推測它的算力更有可能落在10PFLOPS附近,畢竟要兼顧效率和功耗。
![]()
圖源:Google
考慮到Jalape?o從宣布研發到流片成功僅花費9個月,這個速度和成果確實都足以讓人感到驚訝。不過,看看站在奧爾特曼身邊的陳福陽,這個“奇跡”倒也不難理解,畢竟博通本就是ASIC領域的巨頭之一,算是讓OpenAI也體驗了一回“站在巨人肩膀上”的感覺。
不過,相比起研發速度,更讓雷科技好奇的是:OpenAI真的做好量產準備了嗎?從目前已經透露出的消息來看,Jalape?o大概率會由臺積電負責生產。
眾所周知的是,臺積電現在并沒有太多空余產能,想要部署一個足以支撐OpenAI算力需求的數據中心,至少短時間內是不可能的。所以,對于一些媒體吹噓Jalape?o即將拉爆英偉達之類的言論,大家看看就好。
即使按照OpenAI的計劃,Jalape?o的部署周期也將延續到2029年,最終目標是建設一個10GW級別的算力中心。
從微軟的Azure Maia 200到Google的第八代TPU,從亞馬遜的Trainium3到阿里云的真武M890,這些產品背后,是曾經追在英偉達后面、渴求一張顯卡的云服務龍頭們。如今,它們都在自己“造芯”,現在就連英偉達“最親密的戰友”OpenAI也掏出了Jalape?o。
![]()
圖源:阿里云
眾叛親離?暫時還說不上,但舉目四望、心生茫然肯定是有的。
于是又回到了一個問題上:為什么大家都想跳出英偉達的硬件生態,搭建自己的算力生態?答案自然是成本。
具體分析,小雷在前兩天發的《Google開賣TPU,大廠想要靠AI芯片生產“低價token”》一文中已經寫過,有興趣的朋友可以去看看。
不想去看的,記住這段話就行了:英偉達挾天子(GPU+CUDA)以令諸侯,AI巨頭們“苦英偉達久矣”。
被英偉達擰巴地投資后,OpenAI不裝了
其實,OpenAI與英偉達的矛盾并非現在才顯現,如果大家還記得的話,在去年9月,市場盛傳英偉達將對OpenAI進行一筆規模巨大的戰略投資,其金額可能高達1000億美元。
大家不妨算算時間,是不是正好是9個月前?換言之,當時的Jalape?o可能已經進入實質啟動階段。從這個角度來看,OpenAI的離職高管們對奧爾特曼的評價倒也沒錯:政治手腕高超、商業利益至上,對絕對控制權有執念。
![]()
圖源:維基百科
一邊在談判一筆史上最大的投資計劃,一邊卻計劃給對方來一招“釜底抽薪”。雖然很難用“道德”去衡量這種商業行為,但在英偉達眼里,必然會有一種自己受到背叛的感覺,以至于這個千億投資計劃在談判數月后都沒有太多進展。
直到市場因為雙方合作出現危機,而對AI行業的未來感到不安時,雙方才出于對未來市場的考量,選擇敲定一筆300億美元的投資,而且英偉達只是作為三大投資商之一參股,甚至不是出錢最多的(亞馬遜投了500億美元)。
而在這筆投資敲定后,黃仁勛也公開表示:“這可能是最后一次”。顯然,彼時的英偉達有可能已經從供應鏈收到了消息,OpenAI正在開發Jalape?o,并且已經接近流片或處于流片階段。
自己投的錢或許會成為日后攻擊自己的武器,這個滋味想必是不好受的。但是英偉達與OpenAI的綁定又太深了,雙方都需要對方搭臺子把“AI”這場大戲繼續唱下去,所以雙方都處于“誰也離不開誰”的狀態。
即使OpenAI有了Jalape?o也是如此,甚至可以說:只要Claude、DeepSeek、Gemini等AI模型還存在,那么OpenAI就離不開英偉達,因為它仍然需要最強的算力卡,去搭建最強的算力矩陣,用來訓練“最強”的模型。
但除此之外,所有云服務商都會有意識地削減對英偉達算力卡的依賴,這既可以說是為了利益,也可以說是為了讓AI的未來不會被掌控在一家廠商手上。
ASIC讓閃存廠商們迎來“第二春”
從OpenAI到阿里云,都在搗鼓ASIC芯片,估計有讀者想問:ASIC到底是什么?AI行業要拋棄GPU了嗎?
簡單來說,ASIC是“專用集成電路”的簡稱,并非某種固定結構,其設計目的就是根據企業的需求完全定制一顆芯片,而這顆芯片也僅適用于某類特定場景。所以,ASIC芯片的靈活性遠不如GPU、CPU這樣的通用型芯片,當模型架構發生大幅變化后,企業也往往需要設計新的ASIC芯片,以確保效率。
這也是前面說大家其實都離不開英偉達的原因,因為只有GPU這樣的通用型芯片才能同時承載多種不同架構的模型,并且依然保持較高效率運行,而ASIC則更像是你摸透了模型的需求后,針對性打造的“專用工具”。
事實上,每一代ASIC芯片的開發費用和耗時都不低,OpenAI的9個月在半導體行業中已經算得上是奇跡了。即便如此,對于云服務商們來說也是劃算的,因為他們自己就能消化大批出貨,通過規模效應來均攤單片成本,再算上后期維護等成本,終歸是賺的。
有意思的是,在寫這篇稿子的時候,恰逢半導體股連續暴跌后的回調,也讓不少人坐了一回“心理過山車”。前幾天的暴跌其實并不難理解。連日暴漲讓美光等企業的股價已經達到前所未有的水平,與此同時,美光還宣布暫緩HBM內存的產能升級計劃,將部分產能回調到GDDR等消費級產線。
![]()
圖源:百度股票
這讓部分投資者認為HBM帶來的增長神話即將破滅,AI行業的算力硬件前景預期下跌,再疊加其他因素,最終導致半導體企業的股價集體迎來一波暴跌。
然后美光發布的財報,讓跳水的股價來了一波“原地起飛”。
事實上,如果你了解目前的AI芯片狀態,那么大概率不會懷疑存儲廠商的未來營收(僅分析,不構成投資建議)。因為不管是英偉達的算力卡,還是各個公司自己開發的ASIC芯片,只要是用于高并發、高吞吐、低延遲的推理場景,那么HBM內存幾乎是目前唯一的選擇。
這種情況會持續到突破性技術出現為止,比如Wafer-Scale架構徹底成熟、片上大SRAM設計(在芯片中內置大容量高速內存)完全跑通等。目前來看,以上技術雖然都取得了一定進展,但是距離完全成熟還有一定時間。
真要說的話,目前最有可能出現的“黑天鵝事件”,是某個AI廠商突然宣布研發出一套全新的算法,可以讓AI模型對存儲的需求大幅度降低。比如前段時間Google公開的TurboQuant,據稱可將推理內存需求降低6倍以上。雖然其論文結論尚存爭議,但如果該技術成熟,將會對HBM的需求造成直接沖擊。
除此之外,DeepSeek的MoE路由優化、MLA路線,以及針對特定內存技術開發的新型模型結構(比如大小模型混合調度),都是可預期的方向。這也是存儲企業其實不太喜歡DeepSeek的原因,因為他們真的是在“搗亂”。
不過,至少在未來的兩三年里,內存的短缺可能仍難以緩解。
反而會因為芯片廠商們都在折騰自己的ASIC芯片(單顆芯片往往需要128GB以上的HBM內存),導致HBM供需進一步緊張。
寫在最后
未來幾年,AI行業大概會變得更加“火熱”,因為目前的投資額,已經讓大家都無法承擔失敗的后果。
所以,英偉達的GPU神話大概率仍會繼續,HBM的缺貨周期還遠未結束,ASIC的戰爭其實才剛剛開始。而消費者最終看到的,可能是一邊越來越便宜的AI服務,另一邊卻是越來越貴的顯卡、內存、SSD與電子產品。
這么看來,Jalape?o這個名字是真的起得妙:它不像死神辣椒那樣一口封喉,卻足夠讓整個AI芯片市場感到火辣。
AI公司的目標是讓token變便宜。但在那之前,先被點燃的,可能是整個半導體產業鏈。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.