公眾號記得加星標(biāo)??,第一時間看推送不會錯過。
人工智能數(shù)據(jù)中心即將達(dá)到其極限。
為了滿足不斷增長的需求,像英偉達(dá)公司這樣的芯片制造商正在生產(chǎn)功能越來越強(qiáng)大的芯片,這就需要新一代數(shù)據(jù)中心,而新一代數(shù)據(jù)中心的耗電量將是上一代數(shù)據(jù)中心的數(shù)倍。
“人工智能工廠”消耗大量電力,足以維持?jǐn)?shù)百萬家庭的照明,這助長了電力消耗的激增,可能給美國電價帶來更大壓力,擴(kuò)大人工智能的碳足跡,并有可能減緩人工智能的繁榮發(fā)展。
針對數(shù)據(jù)中心的政治反彈已經(jīng)造成了摩擦,而行業(yè)領(lǐng)袖們警告說,另一個更根本的制約因素是:發(fā)電能力的極限。“很快,甚至可能就在今年晚些時候,我們生產(chǎn)的芯片數(shù)量就會超過我們實(shí)際能夠使用的數(shù)量,”特斯拉和SpaceX首席執(zhí)行官埃隆·馬斯克今年早些時候表示。然而,需求仍在持續(xù)飆升。預(yù)計(jì)將有數(shù)萬億美元流入人工智能建設(shè)領(lǐng)域,這使得能源短缺有可能成為人工智能發(fā)展的最大阻礙之一。
![]()
這場危機(jī)迫使人工智能領(lǐng)域的關(guān)鍵參與者——超大規(guī)模數(shù)據(jù)中心運(yùn)營商、芯片制造商和電力設(shè)備生產(chǎn)商——進(jìn)行重新審視。隨著規(guī)模的擴(kuò)大,他們不得不重新構(gòu)想數(shù)據(jù)中心的設(shè)計(jì)、建設(shè)和供電方式。
支持云存儲、電子商務(wù)和網(wǎng)站托管等服務(wù)的傳統(tǒng)數(shù)據(jù)中心使用被稱為中央處理器(CPU)的芯片。這些任務(wù)通常比人工智能處理所需的能耗低得多。
這種數(shù)據(jù)中心的標(biāo)準(zhǔn)服務(wù)器機(jī)架可能需要 25 到 40 千瓦的電力,足以驅(qū)動大約 20 臺交流發(fā)電機(jī)。
![]()
但人工智能數(shù)據(jù)中心也運(yùn)行在密度更高、更先進(jìn)的圖形處理單元(GPU)上。
![]()
![]()
隨著人工智能模型速度更快、功能更強(qiáng)大,機(jī)架在相同空間內(nèi)集成的芯片數(shù)量也大幅增加。
兩年前,每個機(jī)架僅配備 8 個 GPU,而現(xiàn)在已增至 72 個,耗電量約為 150kW。
而且,電力需求還在持續(xù)增長。專家表示,英偉達(dá)即將于今年晚些時候推出的新型 GPU 和機(jī)架系統(tǒng) Rubin,最終運(yùn)行所需的電力將達(dá)到約 300kW。
除了 Rubin 之外,業(yè)界還在為未來可能出現(xiàn)的芯片做好準(zhǔn)備,這些芯片將使機(jī)架的功耗接近 1MW——相當(dāng)于平均 750 個美國家庭的用電量。
“如今人工智能領(lǐng)域的游戲規(guī)則越來越是,芯片的性能越強(qiáng),其密度就會越高,”云服務(wù)提供商 CoreWeave, Inc. 的首席運(yùn)營官 Sachin Jain 表示。
據(jù)英偉達(dá)稱,目前數(shù)據(jù)中心消耗的電力中約有30%并未用于人工智能開發(fā)。這些電力大部分用于冷卻系統(tǒng)以防止服務(wù)器過熱,以及電力在龐大的園區(qū)內(nèi)長距離傳輸。鑒于運(yùn)營商越來越依賴天然氣和燃煤電廠為其項(xiàng)目供電,這加劇了數(shù)據(jù)中心能源消耗的碳排放。例如,據(jù)知情人士上月向彭博社透露,微軟公司正在考慮是否推遲或放棄其雄心勃勃的清潔能源目標(biāo),以掃清可能阻礙其在人工智能競賽中前進(jìn)的障礙。
隨著電力需求和數(shù)據(jù)中心的增長,能源損耗只會不斷增加。但Gartner分析師托尼·哈維表示,任何能效提升帶來的潛在收益也會隨之增加。
“在這個規(guī)模上,這會產(chǎn)生很大的影響,”他補(bǔ)充道。
不過總的來說,考慮到數(shù)據(jù)中心項(xiàng)目規(guī)模越來越大、數(shù)量越來越多,這些措施能在多大程度上抑制數(shù)據(jù)中心的電力需求還不清楚。
在改造自身設(shè)施的同時,人工智能企業(yè)也在投資節(jié)能型初創(chuàng)公司。據(jù)彭博行業(yè)研究報(bào)道,英偉達(dá)的服務(wù)器和芯片占人工智能超大規(guī)模數(shù)據(jù)中心支出的70%,該公司已向Emerald AI投入數(shù)百萬美元,后者開發(fā)的軟件可以幫助數(shù)據(jù)中心在用電高峰期避免電網(wǎng)負(fù)荷過重。像Alphabet旗下的谷歌這樣的超大規(guī)模數(shù)據(jù)中心運(yùn)營商也在致力于提高其人工智能模型的能源效率。
“我們一直在不斷追求從現(xiàn)有的電力容量中榨取每一分效率,”英偉達(dá)高性能計(jì)算和人工智能超大規(guī)模基礎(chǔ)設(shè)施解決方案高級總監(jiān)迪翁·哈里斯說道。
容量的指數(shù)級增長已經(jīng)催生了一些新的數(shù)據(jù)中心設(shè)計(jì)。
英偉達(dá)于 2024 年發(fā)布的 Blackwell 芯片,在能耗與前代產(chǎn)品相同的情況下,提高了處理能力,實(shí)現(xiàn)了能源效率的飛躍。
但它也產(chǎn)生了更多的熱量,傳統(tǒng)的空氣冷卻系統(tǒng)無法防止其發(fā)生故障。
![]()
持續(xù)運(yùn)行空氣冷卻循環(huán)需要大量能源,因此各公司開發(fā)了直接對芯片進(jìn)行液體冷卻的方法。
![]()
根據(jù)英偉達(dá)和電力設(shè)備制造商 Vertiv Holdings Co. 的一項(xiàng)研究,液冷技術(shù)可以將數(shù)據(jù)中心的能源效率提高 15%。該研究還發(fā)現(xiàn),液冷技術(shù)有助于減少因使用外購化石燃料能源而產(chǎn)生的 10% 的排放。
如今,以英偉達(dá)為首的人工智能行業(yè)正試圖通過簡化從電網(wǎng)到芯片的電力傳輸路徑來節(jié)約能源。
電力以交流電 (AC) 從電網(wǎng)進(jìn)入數(shù)據(jù)中心園區(qū),這是遠(yuǎn)距離輸送大量電力的最有效方式。
但為了讓芯片能夠使用它,需要將其轉(zhuǎn)換為直流電 (DC),從而提供穩(wěn)定、持續(xù)的電力流,使芯片能夠正常工作。
數(shù)據(jù)中心還會將電網(wǎng)電壓從 34,500 伏(輸電線路中危險(xiǎn)的高電壓)降至芯片所需的 12 伏。
這些轉(zhuǎn)化過程需要很多步驟,每次都會以熱的形式散失能量。
英偉達(dá)的哈里斯表示:“所有這些步驟都會帶來一些效率損失。在很多情況下,這些損失都是漸進(jìn)的,微乎其微,但當(dāng)你在一個非常大的園區(qū)內(nèi)進(jìn)行這些操作時,累積起來的損失就相當(dāng)可觀了。”
![]()
![]()
![]()
![]()
英偉達(dá)目前正在試用一種新設(shè)備,該設(shè)備將這一過程簡化為更少的步驟,從而節(jié)省能源和空間——即邊車。
這種邊車式(sidecar )擴(kuò)展柜可以將交流電轉(zhuǎn)換為直流電,從而將電源轉(zhuǎn)換設(shè)備從機(jī)架中移除。由于更強(qiáng)大的機(jī)架需要更高的電壓,邊車式擴(kuò)展柜可以為其提供 800 伏直流電,與現(xiàn)有系統(tǒng)相比,能源效率可提高 20%,據(jù)先進(jìn)制造和人工智能基礎(chǔ)設(shè)施公司 Flex Ltd. 稱。邊車式擴(kuò)展柜可以添加到現(xiàn)有數(shù)據(jù)中心,使其能夠支持更強(qiáng)大的芯片。
加上 1 兆瓦的邊車,機(jī)架功率可以達(dá)到 500 千瓦,大約是以前的十倍。
![]()
未來數(shù)據(jù)中心正在醞釀一場更為徹底的變革。業(yè)界正競相用固態(tài)變壓器(一種更智能的電子設(shè)備,能夠切換交流電和直流電,并能更好地處理更高的電壓)來取代部分機(jī)房電氣設(shè)備。據(jù)Flex公司估計(jì),與現(xiàn)有系統(tǒng)相比,這將使機(jī)架密度更高,能源效率提升27%。
固態(tài)變壓器取代了傳統(tǒng)的變壓器和低壓開關(guān)設(shè)備,從而最大限度地減少了功率轉(zhuǎn)換步驟和能量損耗。
![]()
最終目標(biāo)是過渡到 800 伏直流系統(tǒng)。英偉達(dá)以及包括 Flex 和 Vertiv 在內(nèi)的電力設(shè)備制造商預(yù)計(jì),到 2030 年,許多人工智能工廠將采用這種供電方式。
Gartner分析師Harvey表示:“僅配電系統(tǒng)就占總電力損耗的三分之一左右,這與所有電壓轉(zhuǎn)換都有關(guān)。如果我們能達(dá)到最終的800伏直流電壓,損耗率可能會降至1%以下。”
通過重新設(shè)計(jì)的電力系統(tǒng)節(jié)省的能源可以作為一項(xiàng)氣候措施,尤其是在與使用更清潔能源的努力相結(jié)合時。改用直流電力系統(tǒng)的另一個潛在好處是,數(shù)據(jù)中心可以更容易地連接到可再生能源,而可再生能源通常能夠產(chǎn)生這種電流。
Vertiv 首席產(chǎn)品和技術(shù)官 Scott Armul 表示:“直流電本質(zhì)上與可再生能源更容易融合。”
例如,中國已經(jīng)在可再生能源過剩的地區(qū)建設(shè)數(shù)據(jù)中心。美國遠(yuǎn)未達(dá)到可再生能源過剩的程度,但運(yùn)營商正在尋求利用電池和太陽能來輔助數(shù)據(jù)中心的運(yùn)行,盡管他們?nèi)匀恍枰揽刻烊粴獍l(fā)電來完成大部分繁重的能源消耗。
電力系統(tǒng)升級是人工智能領(lǐng)域企業(yè)最為關(guān)注的問題之一。例如,英偉達(dá)承諾每年都會發(fā)布一款性能更強(qiáng)大的新芯片。數(shù)據(jù)中心電力設(shè)備制造商GE Vernova公司已經(jīng)發(fā)現(xiàn),超大規(guī)模數(shù)據(jù)中心對800伏直流系統(tǒng)的需求十分強(qiáng)勁。
“每個人都要求我們?yōu)榧磳⒌絹淼挠唵翁峁┙鉀Q方案,”GE Vernova 電氣化部門首席執(zhí)行官 Philippe Piron 說。
(來源:編譯自bloomberg )
*免責(zé)聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個人觀點(diǎn),半導(dǎo)體行業(yè)觀察轉(zhuǎn)載僅為了傳達(dá)一種不同的觀點(diǎn),不代表半導(dǎo)體行業(yè)觀察對該觀點(diǎn)贊同或支持,如果有任何異議,歡迎聯(lián)系半導(dǎo)體行業(yè)觀察。
今天是《半導(dǎo)體行業(yè)觀察》為您分享的第4429內(nèi)容,歡迎關(guān)注。
加星標(biāo)??第一時間看推送
求推薦
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.