AI范兒 · 行業(yè)觀察? 3 分鐘
![]()
剛剛 OpenAI 公布了自己的第一塊芯片,叫 Jalape?o,合作方是博通。
據(jù)他們介紹,從這個芯片立項到實物到手,只花了 9 個月的時間,這真的是神速。
大家都知道,不管是訓(xùn)練一個大模型,還是每一次對大模型(比如像 ChatGPT)提問,其實背后都需要用到芯片。
而這種芯片大多時候,多半都是英偉達的 GPU。
那么,OpenAI 作為一家美國公司,并沒有芯片的限制,為什么也要花這么長時間、這么大的成本去自研芯片呢?
其實很簡單,即便是美國的企業(yè),現(xiàn)在也在排著隊買芯片,而且還買不到。
01天下苦英偉達久矣
就比如說 Anthropic,它買不到芯片,甚至只能去租馬斯克的算力。而且這個成本是巨高的,每個月的租賃成本高達 12.5 億美元。
這種問題到了咱們國內(nèi)就更加的夸張,同樣的東西到了國內(nèi),價格甚至要翻 2 到 3 倍,甚至更高。
比如現(xiàn)在最熱門的 H200 和 B300,分別漲到了 400 多萬以及近 1000 萬一臺,這真的是一個天文數(shù)字。
而運營一個大模型,這樣的機器至少得上千臺,這種代價可想而知。
所以基本上,不管是中國的還是美國的大模型廠商,都被英偉達卡住了脖子。
以至于幾乎所有這些大廠,包括 OpenAI、谷歌、Meta,也包括國內(nèi)的公司,都在自研或者在考慮自研當(dāng)中。
所以這幾年,谷歌自己搞了 TPU,亞馬遜搞了 Trainium,微軟搞了 Maia,以及這一次 OpenAI 搞的這個叫做 Jalape?o。
02備考和考試是兩回事
OpenAI 這次出手直接是沖著做推理專用芯片去的。
現(xiàn)有的 AI 芯片大多都是從訓(xùn)練模型的芯片改過來的,訓(xùn)練和推理其實是兩回事。
訓(xùn)練就像備考,用暴力計算把幾千億參數(shù)的知識塞進模型里面。這個過程可以慢一點,只要算力夠了就行。
推理就像考試,你問一個問題,模型必須在幾秒之內(nèi)給你答案,所以這個過程要非常快,而且還得省電。
Jalape?o 就是專門為"考試"而設(shè)計的,不管備考那些事。它的目標(biāo)只有一個:用最少的電,最快地回答用戶的問題。
所以 OpenAI 自己說,早期測試顯示這塊芯片的每瓦性能比目前市面上最好的水平還要好很多。
至于具體的數(shù)據(jù),他們在幾個月之內(nèi)會出技術(shù)報告。
官方披露的細節(jié)里面還有一個非常有意思的事情,就是這塊芯片的設(shè)計,其實是用到了 OpenAI 自己的 AI 來輔助加速。
用 AI 來設(shè)計跑 AI 的芯片,這真是用魔法打敗魔法。
03跟你有什么關(guān)系
這樣的芯片經(jīng)過特別的優(yōu)化,它的性價比勢必會更高。而且就如前面說的,它會更省電,所以它的總體運營成本應(yīng)該會更低。
這也會導(dǎo)致從理論上來講,未來的 ChatGPT 會更加便宜,可能也會更快。
Jalape?o 預(yù)計在今年年底開始規(guī)模化的部署,具體效果怎么樣還有待驗證。
AI 公司自研芯片,說到底是在賭一件事:我比英偉達更懂我自己的模型需要什么。
這個賭注不小。
因為芯片是個非常燒錢且極其漫長的生意,歷史上有非常多的公司在這條路上交過學(xué)費。
但如果 OpenAI 或者是其他公司賭對了,第一個感受到變化的是每天在使用這些工具的每一個用戶,包括你,也包括我。
這個"辣椒"(Jalape?o)到底夠不夠辣?讓我們拭目以待嘍。
你覺得 OpenAI 這次自研芯片,能真的撼動英偉達嗎?
覺得有用 → 點個??在看轉(zhuǎn)給朋友
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.