![]()
新智元報道
![]()
【新智元導(dǎo)讀】OpenAI首顆自研芯片Jalape?o問世,9個月白紙到流片,創(chuàng)下行業(yè)最快紀錄。設(shè)計它的,正是跑在上面的AI模型。
就在剛剛,OpenAI掏出了史上第一顆自研芯片。
名字叫Jalape?o,墨西哥辣椒,專為大模型推理設(shè)計。
![]()
9個月前,白紙一張。
9個月后,工程樣片不僅跑通了GPT-5.3-Codex-Spark,而且頻率和功耗均已達到量產(chǎn)目標。
更離譜的是,這顆芯片是OpenAI用自己的AI幫著畫的。
9個月,行業(yè)紀錄碎了
Jalape?o,墨西哥辣椒里辣度最溫和的品種之一。
OpenAI拿它給第一顆芯片命名,潛臺詞很可能是:這只是入門級,后面可能還有更辣的。
官方定位叫「Intelligence Processor」,一顆專為大模型推理設(shè)計的定制ASIC。
由OpenAI主導(dǎo)架構(gòu)設(shè)計,Broadcom負責芯片實現(xiàn)和網(wǎng)絡(luò)互聯(lián),Celestica做板卡和機架集成。
![]()
通常來說,先進半導(dǎo)體行業(yè),設(shè)計一顆高性能ASIC要18到24個月。Google TPU兩年一代,Amazon Trainium差不多也是這個的節(jié)奏。
而OpenAI只用了9個月,一舉刷新了先進半導(dǎo)體領(lǐng)最快的ASIC開發(fā)周期。
這顆芯片從第一根線開始就只為一件事優(yōu)化:LLM推理。
而且,Jalape?o不只跑OpenAI自家模型,架構(gòu)上兼容全行業(yè)的LLM。
![]()
AI幫自己畫了電路圖
比性能更值得關(guān)注的,是這顆芯片怎么被造出來的。
OpenAI自家AI模型參與了這顆芯片的設(shè)計和優(yōu)化。
也就是說——AI設(shè)計了一顆芯片,芯片反過來跑AI,跑在上面的更強AI會設(shè)計下一代更強的芯片。
AI,幫自己造了一副新身體。
AI設(shè)計芯片不新鮮。Google 2021年在Nature發(fā)論文,用強化學習做芯片布局,速度比人類快幾個數(shù)量級。
此后AlphaChip連續(xù)優(yōu)化了三代TPU布局方案。
OpenAI硬件團隊的掌門人Richard Ho,正是從這個圈子里走出來的。
![]()
Google近九年,TPU高級工程總監(jiān),參與發(fā)明了ML設(shè)計芯片架構(gòu)的方法,多個TPU項目首次流片即成功。
之后去了光子計算公司Lightmatter當高級副總裁,更早聯(lián)合創(chuàng)辦過EDA公司0-In Design Automation。學術(shù)界、芯片設(shè)計、AI硬件,整條路走了一遍。
![]()
![]()
OpenAI挖他來,大概率就是為了一件事:把「AI輔助芯片設(shè)計」嫁接到自家模型上。
芯片設(shè)計最磨人的不是「想方案」,是無數(shù)次的設(shè)計—驗證—改—再驗證循環(huán)。一顆先進芯片的驗證要跑成千上萬次,占掉整個周期的大半時間。
AI恰恰擅長干這種事——讀歷史設(shè)計數(shù)據(jù)、生成RTL代碼、輔助驗證和debug、優(yōu)化布局布線。
能實現(xiàn)9個月流片,靠的是AI替人扛掉了那「18到24個月」里最磨人的一大塊。
用最會用錘子的人,來設(shè)計新錘子。用最懂LLM運行規(guī)律的模型,來設(shè)計專門跑LLM的硬件。
![]()
你的ChatGPT賬單正在被重寫
OpenAI每年算力支出百億美元級別,這些錢最終要從你身上賺回來——20美元月費、API調(diào)用、Plus和Pro訂閱。
推理成本砍半,普通用戶最先感受到的:響應(yīng)變快。
現(xiàn)在ChatGPT高峰期排隊、轉(zhuǎn)圈、長對話變慢,本質(zhì)都是算力不夠分。
推理效率提升后,同等服務(wù)器能服務(wù)更多用戶,體驗有望改善。
其次:免費版能力放開。
現(xiàn)在很多功能鎖在Plus里——深度研究、高級數(shù)據(jù)分析、完整版語音對話。
成本降了,這些功能下放給免費用戶的可能性就大了。
而OpenAI需要的,正是讓更多人用上ChatGPT,并且能用更久。
再往遠看:20美元的月費可能還是20美元,但你拿到的東西完全不一樣。
去年這個價格買到的是GPT-4o,明年同樣的錢可能買到的是一個能跑完整工作流的agent。
月費沒變,能力可能翻幾番——推理成本下降帶來的隱性降價。
![]()
但Jalape?o瞄準的不只是今天的ChatGPT。
Richard Ho的思路是:為模型要去的方向設(shè)計硬件,而不是為它現(xiàn)在的樣子。
OpenAI內(nèi)部能看到未來6到9個月模型的演進方向,芯片按這條管線往前造。
等agent真正跑起來,算力需求和今天的一問一答完全不是一個量級。
說白了,推理成本降下來,受益的不只是Pro用戶。
學生、小企業(yè)、獨立開發(fā)者,都可能用上今天只有大客戶才跑得起的AI能力。
OpenAI要吃掉整條鏈
模型自己訓,芯片自己設(shè)計,推理自己優(yōu)化,部署自己控制。
換句話說,OpenAI要做全棧AI公司。
之前和Cerebras合作推理部署,OpenAI從中摸清了專用推理硬件的價值。現(xiàn)在自己下場做,把經(jīng)驗變成自己可控的平臺。
Apple和Google都走過這條路。
但OpenAI的全棧多了一層:
用AI加速AI基礎(chǔ)設(shè)施建設(shè),再用更好的基礎(chǔ)設(shè)施跑更強的AI。如果這個循環(huán)成立,飛輪會自己給自己加速。
首批GW級數(shù)據(jù)中心將和Microsoft等合作方從2026年底開始部署。
Jalape?o只是第一代,下一代叫什么還不知道。
但造它的,大概率不只是人了。
參考資料:
https://x.com/OpenAI/status/2069770172802773292
https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
編輯:摩西
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.