公眾號記得加星標??,第一時間看推送不會錯過。
Andy Bechtolsheim是Unix系統制造商Sun Microsystems的傳奇聯合創始人,之后又創辦了多家網絡初創公司。他對共封裝光器件(CPO)并不反對。當然,唯一的問題是,迄今為止,CPO模塊還無法實現量產。
毫無疑問,共封裝光模塊(CPO)即將應用于數據中心,尤其是在人工智能行業巨頭英偉達(Nvidia)在其Quantum X800 InfiniBand和Spectrum X800以太網交換機上采用CPO鏈路之后——這兩款交換機于2024年6月發布預覽,2025年3月正式上市,并于2025年12月開始出貨。英偉達還在今年3月的GTC大會上告知客戶,隨著未來“Feynman”GPU將于2028年問世,其機架級系統核心的NVSwitch 8相干內存擴展網絡也將遷移到CPO。這強烈暗示Feynman GPU以及英偉達與之搭配的下一代Arm服務器CPU(目前尚未公布代號)也將配備CPO端口。
為了解決制造工藝問題,在今年的GTC大會之前,英偉達分別向Lumentum和Coherent注資20億美元,這兩家公司主要生產驅動CPO端口的激光器。英偉達還與這兩家公司簽署了數十億美元、為期多年的供貨協議。3月晚些時候,英偉達又與Marvell簽署了一項類似的20億美元協議,旨在為定制加速器添加NVLink Fusion端口。但我們認為,Marvell在2025年12月以25億美元收購Celestial AI時獲得的CPO技術,也可能包含在這項協議中。
與此同時,人工智能數據中心需要更高的網絡密度,因此需要比過去二十年來主導數據中心的SFP、QSFP和OSFP可插拔模塊密度更高的光模塊。更具體地說,它們需要比OSFP可插拔模塊更高的密度。OSFP可插拔模塊最初由Arista Networks于2016年提出。Arista Networks是一家新興公司,在數據中心網絡領域挑戰思科系統(Bechtolsheim是該公司聯合創始人兼首席開發官)。大約一年后,谷歌和業界采納了該標準,并推出了速度高達400 Gb/s的可插拔模塊。這些模塊已成為歷史上最流行的可插拔光模塊。
問題在于,OSFP 模塊對于現代人工智能系統所需的基數來說太大了,尤其是在需要使用以太網進行縱向擴展和橫向擴展的情況下。這時,超密集可插拔光模塊(XPO)多源協議就派上了用場。該標準由 Arista Networks、微軟、Marvell、博通和 Ciena 等公司發起,目前已獲得超過一百家公司的支持。谷歌并不在支持名單之列,這可能意味著谷歌會在 XPO 模塊預計大規模上市的同一時期,嘗試從 OSFP 可插拔模塊過渡到某種片上 CPO 技術。
XPO模塊的巧妙之處在于,它在與OSFP模塊相同的空間內提供了更高的帶寬,這意味著交換機的前面板可以輸出更多的數據流,從而提供更大的帶寬。然而,由于物理定律的限制,XPO模塊必然會帶來更高的熱密度,因此需要通過冷板和液冷來散熱。但在GPU和XPU需要以越來越大的規模進行縱向和橫向擴展,并且液冷已成為機架級系統標配的今天,這只是一個微不足道的問題。目前,沒有其他方法能夠使組件彼此更緊密地連接,從而降低延遲并提升性能。
據Bechtolsheim稱,目前使用1.6 Tb/s的OSFP模塊,可以在1U以太網交換機的前面板提供32個端口,總吞吐量為51.2 Tb/s。OSFP模塊的功耗在30瓦到40瓦之間,即使加裝散熱板,也無法真正提升散熱能力或增加交換機前面板端口密度。這意味著,如果您擁有204.8 Tb/s的交換機ASIC芯片(信不信由你,我們很快就會擁有),則需要4U的機箱空間才能容納128個以1.6 Tb/s速率運行的OSFP模塊。
![]()
XPO模塊在兩個OSFP模塊所占的空間內集成了64個運行速度為200 Gb/秒的通道,通道密度提高了四倍。XPO模塊使帶寬提高了八倍,散熱能力提高了十倍,達到400瓦。
以下是XPO模塊的分解圖:
![]()
Bechtolsheim說,這里巧妙地利用了幾何原理,使得芯片板(電路的小型主板)能夠正好安裝在兩個 OSFP 模塊相同的空間內。因此,芯片和芯片板的設計無需更改。將兩個芯片板并排放置,然后將兩對芯片板首尾相接堆疊,就能在兩倍的空間內獲得八倍的通道數。
仔細想想,XPO 的設計理念似乎很符合直覺,就像許多優秀的工程設計理念在事后看來那樣。
XPO模塊將支持多種前面板光纖連接器:
Bechtolsheim指出,XPO的優勢在于它支持任何光學標準、任何光學技術、任何類型的驅動器、重定時器或齒輪箱、任何光纖連接器以及任何類型的電纜,并且無需轉向CPO即可提高密度。經濟效益或許會更好,但不要過早下結論。
另一個好處是,采用液冷技術的XPO組件在12.8 Tb/s ZR模塊(其原理圖和熱圖如下所示)中,溫度比風冷的1.6 Tb/s OSFP-ZR模塊低20到25攝氏度。(在相同的1.6 Tb/s帶寬下,XPO模塊的溫度大約低45攝氏度,而OSFP模塊的溫度則在65到70攝氏度之間。)
![]()
更低的溫度意味著現場故障會減少——具體減少多少還有待觀察。但這對于人工智能超級計算機來說意義重大,因為任何故障都會導致訓練運行完全停止,必須回滾到之前的檢查點并重新開始。對于GPU和XPU來說,時間就是金錢,而且是巨大的金錢。
在即將推出的采用 XPO 模塊的交換機設計中,XPO 模塊的電源將直接從 50 伏母線取用,而無需像使用 OSFP 模塊的交換機那樣通過主板電壓轉換器。這是一種更高效的電源分配方式。
總而言之,使用 XPU 模塊的交換機機架可以將 6.5 Pb/秒的總吞吐量塞進 Open Compute Project 的 Open Rack v3 交換機機架中,其外觀如下:
![]()
但真正讓AI數據中心建設者對XPO模塊感興趣的,是以下這筆經濟效益:由于網絡機架密度的提高,他們可以將數據中心的規模縮減一半。這種改變是巨大的。
假設您需要一排基于以太網的計算和網絡設備,將 512 個 XPU 連接在一起,并且您希望使用配備頂級 1.6 Tb/s OSFP 端口的交換機。每個機架將有 128 個計算引擎,需要四個機架用于計算,但網絡設備需要八個機架。如果改用 XPO,您仍然需要四個機架的 XPU,但只需要兩個機架的交換機。因此,在相同的計算和互連條件下,原本需要十二個機架的設備減少到六個機架。交換機機架的溫度會更高,但數量更少,功耗基本持平。XPU 和交換機之間的電纜長度也更短,這意味著減少了光纖的使用,從而降低了成本。在一個 1 吉瓦的數據中心里,這些看似微小的優勢會累積起來,就像減少混凝土用量和建造更小的機房一樣,都能為相同的計算和網絡容量節省成本。
那么,XPO究竟在多大程度上取代了CPO?貝希托爾斯海姆的回答和他多年來的回答如出一轍。
“我們已經向客戶和公眾聲明過,我們對任何技術都沒有絕對的執念,”貝Bechtolsheim表示。“這一點大家都能理解。我們唯一堅持的是能夠大規模交付產品。所有參與XPO項目的人員都是自掏腰包完成工作的,他們都希望擁有自己開發的成果,而且他們都會繼續參與其中。這項工作是由一個大型終端客戶推動的,但我認為所有人都認真審視過這個項目,并得出結論:這是實現更高密度水平的途徑。”
超過 20 家不同的供應商將生產 XPO 模塊,預計將于 2027 年實現批量生產。
https://www.nextplatform.com/connect/2026/04/17/bechtolsheim-friends-breathe-life-into-pluggable-optics-one-last-time/5218123
(來源:編譯自nextplatform)
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯系半導體行業觀察。
今天是《半導體行業觀察》為您分享的第4382內容,歡迎關注。
加星標??第一時間看推送
![]()
![]()
求推薦
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.