![]()
AI 算力的下一個增長點,在互連。
作者|徐珊
編輯|鄭玄
謝崇進做光通信,做了三十年。這三十年里,行業「涼」過兩次。
第一次是 2002 年。他剛從讀完博士后,進了貝爾實驗室。那是當時全球做光通信最好的地方,但他進去沒多久,互聯網泡沫破裂,光通信成為受沖擊最重的行業之一,朗訊一度十幾萬員工,三年內裁到只剩四、五萬。他那個團隊,進去七個,最后只剩謝崇進自己。
泡沫破滅后,行業一直低迷,從業者大批離開。謝崇進記得2013年去參加一個學術會議,對面的人聽完他的介紹,甚至愣了一下,「你怎么還在做光通信?」雖然數據中心重新給給光通信續了口氣,但光通信在那個年代的科技圈,仍是個非常小眾的行業,基本不被外界關注。
但謝崇進沒走。直到 2023 年,全球最大的光通信會議上,氣氛開始改變。這一年所有人都在搶芯片、搶產能、搶交付。「2013 年的時候,我完全沒想到,十年后這個行業會再次成為整個 AI 產業的主戰場。」他說道。
而讓光通信活過來的,是 GPU。
AI 算力現在卡在哪兒?誰都清楚。黃仁勛在2024年香港科技大學曾經說過,未來十年算力還要再漲 100 萬倍。不少業內人士認為,其中單芯片還有 100 倍提升空間,互聯提升 100 倍,以及集群規模擴大 100 倍。于是 AI 芯片和超算中心被盯得很緊。但中間那個 100 倍,也就是 GPU 和 GPU 怎么連接的問題,很長一段時間沒多少人真當回事。
直到英偉達自己下場。今年 3 月,英偉達拿出 40 億美元,砸向北美兩家光通信龍頭 Lumentum 和 Coherent,各投大約 20 億,外加數十億美元的長期采購協議。到了 5 月,又掏了 5 億美元綁定康寧,把對方在美國本土的光纖連接產能拉高了十倍。這幾十億美金,押的全是同一件事,第二個 100 倍,最終得用光來解。
謝崇進的想法不一樣。在這個行業里浮沉了三十年,他不去押「光互連是不是會贏電互連」更強的結論,這種長達十年的技術賭局,他自己也認為沒人能給確切的答案。他押的是另一件事,在共識形成之前的創業窗口里,先把客戶當下要用的東西做出來,站穩腳跟。
在這個思路下,他創辦的奇點光子第一代產品就是把 800G 的光模塊直接壓縮成一塊 6.4T 的芯片,在同等的傳輸能力之下,體積只有原來的十分之一。
至于光互連這件事到底有沒有未來,他給的回答卻相對謹慎,「我不認為現在能夠看到技術終局。」一個三十年都在場的人,選擇不押終局,這件事在硬科技領域是少見的。近期,極客公園獨家對話了謝崇進,在阿里擔任了十年首席通信科學家后,他究竟看到了什么新變化,決定離開阿里、自己出來做這件事?當英偉達、博通這些巨頭都在自己下場的時候,一家做光互連芯片的初創公司,還有沒有真正的位置?
01
光互連,怎么成了 AI 算力的主戰場?
過去十年,互聯網每一次大流量爆發,都靠光通信在底層撐著。光通信單波長速率從 10G 漲到了 1.6T,足足提升了 160 倍。而在過去二十年里,芯片的原始計算性能漲了 6 萬倍。同期,傳統電互連的帶寬只漲了 30 倍。
兩個數字相差兩千倍。這個差距,正在變成 AI 算力真正關鍵的地方。
放在以前,這其實并不奇怪。過去三十年,算力問題大多數時候靠單顆芯片就能解決。一顆 CPU 跑通用計算,一顆 GPU 跑圖形和并行任務,再大的需求撐死了也就幾臺服務器拼一拼,互連就是個配套服務。
但 AGI 對算力的需求持續增長,改變了這一切。目前,大模型的訓練規模每年漲四到十倍。單顆芯片的性能跟不上,HBM 的帶寬也開始觸頂。但行業發展的速度并沒有放慢,所有人都相信,靠堆算力把模型智能推上去這條路還遠沒到頭。所以接下來幾年,整個產業邏輯要從「單芯片時代」切換到「超算中心時代」,把成千上萬顆 GPU 拼成一個集群,當一臺機器用。
當需要算力的形態從一顆芯片變成一座超算中心時,互連的位置就變了。它開始決定這座超算中心能不能跑起來,站上了最強輔助的位置。沒有它,再強的 GPU 也只是一座孤島,終有算力見頂的時刻。押光通信,本質上就是在押 AI 算力的下一個增長。
行業里看明白這件事的人不少,給出的解法也不一樣。
最主流的一條路,是把傳統光模塊的速度做得更快,直接拉參數將單波長速度從 400G 一路提到 1.6T、3.2T。這條路技術成熟、產能集中,中際旭創、新易盛、Coherent、Lumentum ,據說不少企業的訂單已經排到 2027 年之后。但它主要解決的是機柜之間的光互聯,不是 GPU 之間的連接。傳統光模塊的尺寸、功耗、延遲,都裝不進 GPU 旁邊那幾厘米的空間。
更激進的一派,想要一步到位,押注下一個芯片技術架構。
一種是想用光直接替代電做計算,從根本上繞開電信號的物理極限。這條路最難的地方在于,光做計算的精度、能效、可擴展性很難同時滿足,光信號微小的強度波動就會讓復雜運算出錯。曦智科技、Lightmatter 這類公司過去十年都在這個方向上探索,但最好的結果整體能效也遠不及當代 GPU。據推測,這條路線上的產品想要真正能走到客戶機房,至少還要五到十年。
另一種更前沿的技術路線則是看好微環,也是一種比傳統結構更小、更省電的光學路徑,理論上可以做下一代光互聯的終極形態。量引科技、映訊芯光這類初創公司在押這條路,但目前還卡在最基礎的良率和工藝一致性上,而它的大規模量產時間線,最快也要 2028 年到 2030 年。
從這里就能看出,它們押的是五到十年后的市場,但客戶的服務器等不了那么久。
過去兩年,AI 訓練規模每年漲四到十倍。云廠商的 GPU 集群從 H100 換到 GB200,再到下一代,擴容節奏被持續壓縮。原本計劃一年完成的部署,常常被迫提前半年。「夠用就行,能用就先上」這已經成為被算力增長折磨已久的服務器企業最真實的狀態。
謝崇進看到的也是當下市場最急迫的需求。他需要的不是抵達光通信的終局,而是一個能盡快裝進客戶機房的產品。
奇點光子,就是從這個切入點切進整個賽道的。
02
做客戶最需要的,比做最強的更重要
光互連這道題的難度,不在于看出光互聯是AI算力下半場的瓶頸。這個判斷到 2024 年,行業里很多人都看見了。難的是看見之后,知道用什么技術、做什么形態、用多長時間做出來。這件事卡住了大多數人。
技術型創業者容易陷入哪種技術最先進的爭論里,光計算、微環、IPO 終極形態,每一條路都能講出十年后的故事,但很難判斷客戶三年內真正用什么。而從產業視角里走出來的人則反過來,知道客戶要什么,也理解每種光學結構、每種封裝工藝在物理上的邊界以及短期內能夠達到技藝上限。
這兩種身份,謝崇進都有,他 1996 年讀光通信博士,2001 年進貝爾實驗室做研究。光通信里每一代光學結構、每一種封裝工藝的物理邊界,都在實驗室里研究了十多年。2014 年,他加入阿里之后作為首席通信科學家創建和領導阿里光網絡團隊做了十余年的數據中心光互聯技術和產品,了解客戶機房里真正卡住的是什么,容忍度在哪里、什么時候必須有產品,這些方向,他也站在在甲方也看了十年。
兩段經歷疊加,這也讓他解光互連這道題時,判斷依據不只是技術終局應該長什么樣,也包括客戶在哪個時間點會買什么樣的產品。但即便如此,這條路也并不容易。把光從機房外的長距離傳輸搬到 GPU 之間的近距離傳輸,聽起來只是物理位置的轉移,但幾乎所有原來成熟的東西都要重做一遍。
「今天 1.6T 和 10G 的通信不是同一件事」,謝崇進說。速度高了之后,材料、工藝、所有的補償機制都要重新設計。「但光通信不僅僅是一個技術學科,更是一個工程學科。光通信里出來的好公司,最后都是工程能力贏的,不是理論領先贏的。」
![]()
把這個問題放在工程上,他拆成三個方面:光芯片、電芯片、封裝。每一件事想要做好都不容易,其中封裝更難。
在光芯片上,奇點光子目前想要做的是世界上最高速度的光芯片,單路200G,整片 6.4T,等于把市面上 8 個主流光模塊的傳輸能力塞進一顆芯片。想要達到這個傳輸速度上,材料、工藝、信號補償全部要重新做。謝崇進選擇的是工藝成熟的路線,一種幾十年來在長距離光通信里跑得最穩的光學結構,工藝成熟,能快速量產,現在就能滿足客戶需求。
有了光芯片,不代表著就沒有電芯片。相反,光信號最終還是要和電信號對接。光負責跑得遠、跑得快,電負責和 GPU 對話。兩者需要在同一塊基板上同步、對齊、協同,才能得到又快又穩的傳輸。「大多數光 IO 公司只做光,把電交給別人。」謝崇進說道,他們也曾想過,但最后發現,光和電,少了任何一塊,整套系統跑起來的效果都不好,最后只好全做。
但最難的步驟還是在封裝上。盡管當下的封裝設計已經比較多樣,但想要同時在一塊板上光、電等幾種完全不同的封裝工藝要同時跑通,還要保證可量產的良率,這放在當下,仍然是一個工程難題。
也因此,奇點光子在封裝上做了兩個反共識的決定。
一是產品形態上,采用芯粒架構,封裝形式選擇更滿足客戶和系統需求的產品,如 NPO(近封裝光學)和 CPO(共封裝光學),而不是IPO(集成封裝光學)。他們的區別是IPO是把光器件和GPU芯片直接集成在一起,CPO 是把光器件和 GPU 芯片共封裝在同一基板上,距離小于 1 厘米,NPO 是把光器件放在 GPU 芯片旁邊 1 到 10 厘米的位置。此外還要考慮客戶在易部署和易維護方面的要求,解決客戶痛點,而不是把技術強推給客戶。
「NPO/CPO 這條路上的技術已經走通了,」謝崇進說,「我們的產品做出來,就能直接裝進客戶機房。」
第一代產品的結果是,體積只有傳統光模塊的五分之一到十分之一,功耗降到三分之一,延遲降到百分之一。
![]()
傳統電互連技術 vs 光 I/O 架構 |來源:奇點光子
二是工程方法上。常規做法是先把芯片做出來,再去考慮怎么封裝。奇點光子反過來,第一天就開始跑封裝工藝,用空白測試芯片把整個封裝流程提前跑通。「我們第一天就在考慮封裝怎么做」,謝崇進說。
其實這幾個選擇背后是同一個判斷,不追求理論上最好,追求今天就能上手。到今年,奇點光子的芯片已經完成測試點亮,封裝工藝同步在跑,客戶那一頭已經開始排隊測試,預計 2027 年下半年量產。
但產品做出來只是一半,光通信公司能不能跑通,還要看怎么賣給客戶。謝崇進觀察到 AI 芯片這一波熱度里,大公司都想賣系統。像是英偉達賣 GB200 NVL72 整套服務器機柜,博通賣 CPO 整條光互聯路線圖,華為賣 Cloud Matrix 9384 整個超節點方案。理由很清楚,芯片要算錢,系統要算更多錢,把更多東西打包賣出去,才能撐得起一個估值更高的算力市場故事。
但客戶卻已經不再是原來全托管的形態了,云廠商在過去幾年里,已經開始變成自己集成一切的玩家。「我們在阿里時候,自己集成系統、服務器自、交換機,模塊,基本上不再依靠系統方案商了。」他發現如今這種自己設計、找代工生產的模式,已經從阿里擴散到字節、微軟、Meta,這些客戶的目標越來越清楚,不被任何一家供應商綁死。
過去,業內總認為系統廠商做不好真正頂級的部件,部件廠商也做不好系統,兩類公司的能力曲線、組織方式、定價邏輯都不一樣。但 AI 這一波,云廠商把「做系統」的角色收回了自己手里,更多開放出來的是「做最好的部件」這個位置。
為此,在商業化路徑上,奇點光子的選擇是不賣系統,只賣關鍵部件。「把 GPU 之間互聯的光芯片做到極致,讓客戶拿回去自己集成。」謝崇進說道。這放在當下來看,同樣是一個反共識的選擇。所有 AI 芯片公司都想做下一個英偉達,但奇點光子從一開始就明確說,「我們不和英偉達競爭,反而英偉達是我們的潛在客戶」。
![]()
現階段主要推進的產品 |來源:奇點光子
謝崇進將奇點光子的客戶分成四類。第一類是云廠商,阿里、字節、微軟、Meta 這一類自己搭超節點的公司,也是第一階段的核心客戶。第二類是GPU 廠商,像是英偉達、AMD、華為,奇點光子的芯片可以作為它們系統里的一顆,加入其中。第三類是服務器和交換機廠家,做超節點系統集成的,他們可以買奇點光子的器件再集成進自己的產品,提升通信效率。第四類是光模塊廠家,奇點光子可以將其中光芯片可以單獨拆出來賣,作為光模塊的核心部件。
「讓產業鏈每個位置都能買上一顆芯片,不和任何一類客戶搶生態位,也不依賴任何一類客戶活下去。」這是謝崇進對奇點光子的定位。但他在這之上還有一條更嚴格的判斷標準,「不是做最難的,是做客戶最需要的,但你做的事情不能讓客戶三年后就拋棄。」
目前,奇點光子已完成數千萬美元 Pre-A 輪融資,由凌云光在內的產業投資方領投。在此之前,公司已完成由明勢創投領投的天使輪融資。
「中國硬科技投資過去三年最大的錯位是,所有人都在投技術天才,但客戶已經不需要技術天才了,客戶需要的是能在 12 個月內出貨的供應商。」一位接近早期天使輪的投資人告訴極客公園。奇點光子的判斷比別人快,能夠知道客戶三年后真正要用什么,也知道現在就能用什么把它做出來,會是更具有價值的地方。
03
光互連的答案,還尚未有定論
把奇點光子押的這件事放在更大的產業框架里看,它的解法本身仍然有幾個未被回答的問題。
這些問題不是關于這家公司的執行力。目前從測試結果到客戶反應,目前看奇點光子都走在自己的預期之內。真正的不確定性,在光互連這條路本身。這也是不少投資人猶豫的地方。「投光通信不是賭某一種技術會贏,是賭產業鏈上的'卡點'。」一位光通信賽道的投資人告訴極客公園,「但卡點的存在,不等于卡點的解法已經被驗證。」
比如說,光真的是解決互連的唯一答案嗎。
在業內,其實還有一種聲音認為,AI 算力真正的瓶頸最終不會落在「光還是電」這個層面,而會落在材料和制程。摩爾定律走到 1 納米以下之后,電傳輸的物理邊界確實會更尖銳,但光也未必能解決所有問題。下一代答案,也有可能拿在「賭對下一代材料的公司」,像是二維材料、碳基、硅光的材料企業手里。如果新材料能在物理層面突破電傳輸的瓶頸,光的角色就會被重新定義。
如果從這個角度看,光互連可能不是終局,只是一個過渡態產品,或許它在 2027 到 2030 這個窗口里有非常確定的價值,但更長的時間維度上,會被誰取代,今天沒人說得清楚。
這一點謝崇進其實也看到了。「我不認為現在能夠看到技術終局」他說。「我們做的就是這個窗口期里的事。我們內部對什么節點該用什么技術,是有自己的判斷的。」他從一開始就沒有把奇點光子定死在某條路線上,而是在2027 到 2028 這個具體窗口里能不能把產品做出來、能不能裝進客戶機房、能不能站穩市場。但公司能不能在窗口期之后存活,這更像是一個產業級問題,不是一家公司能單獨回答的。
第二個問題是關于工程路徑本身。奇點光子采用了「先解決好當下的算力短缺問題」,選擇了工藝成熟及對客戶更友好的技術路線,盡快交付產品。從交付角度是沒有問題的,它把不確定性切小,把可量產的部分先做出來,讓企業用上。但這種思路也帶來一個新的問題,先有技術的應用能不能幫助企業更快進入到下一個關鍵產業節點?尤其是在光通信領域,單點突破從來都不是難點,難點在系統協同。
超節點不是單一部件的堆疊,是光芯片、電芯片、封裝、協議、調度、散熱、機柜機構件一整套系統的協同。即使奇點光子把自己負責的那一顆芯片做好了,最終能不能在客戶的整套系統里跑出 「1+1>2」 的協同效率,也取決于整個產業鏈上其他幾十個環節是否同步推進。
第三個問題是關于場景本身。奇點光子押的場景是 AGI 路徑上的算力升級,超節點、十萬卡集群、百萬倍算力躍升。這個場景今天看是高度確定的,幾乎所有的大模型公司、所有的云廠商都在朝這個方向跑。
但這個場景本身能不能按照今天預期的方向跑下去,還比較難確定。我們也曾在硬科技領域有過類似的劇本,AI 四小龍押的場景是城市級智能化和大規模 to B 落地,那個場景在 2017 到 2019 年看也是高度確定的,幾乎沒人懷疑。但走到今天,那個場景沒有走到當年所有人預期的那個體量。
奇點光子其實也是同理,如果在這個過程中 AGI 不需要那么多算力、比如分布式訓練范式變了、比如算力被壓縮到更小的模型上,那 GPU 之間高密度互聯作為一個高度專精的問題,可能就不再是最關鍵的瓶頸。
如此看來,你會發現奇點光子的未來方向很大程度上還是依賴于產業判斷。它押注光會在 2027 到 2030 這個窗口里更重要、單點芯片的提升能夠在系統協同層發揮更大的作用,而 AGI 對算力的需求也沒有到達極限。
但奇點光子并不是唯一一家這么押的公司。硅谷估值最高的光子公司 Lightmatter,過去幾年累計融資 8.5 億美元、估值 44 億。它名義上是一家光子計算公司,2025 年 4 月還在 Nature 上發表了關于光子 AI 處理器的論文。但仔細看它的產品線,Passage M1000、L200、L20。你會發現全部都是光互連的產品,2025、2026 年陸續送樣、上市。「2026 年是硅光的元年,2027 年產品會開始放量。」 Lightmatter創始人 Nicholas Harris 說道。
這也表示,光通信這一波熱度里,最有錢、最受關注、最敢押的那些公司,其實也和奇點光子看好的是同一個方向,2027 年光互連將展現出其最強輔助位的能力,從一定程度上解決算力增長困境。
「過去幾年押光通信的錢大多在賭技術終局,但技術終局到來之前,市場已經會跑出至少一輪贏家。」這是產業里少數押窗口期的投資人對奇點光子這條路的判斷。
從現在到 2027 年下半年,留給奇點光子的時間是 18 個月。這也是謝崇進自己設定的觀察期,「你要做客戶三年后還要的東西,但你出現的時間應該在客戶提出明確需求之前的 12 到 18 個月。」它能不能在這 18 個月里把自己負責的那一顆芯片做出來,是能力問題,而能不能在 18 個月之后贏得這個賽道,是產業問題。前者它自己可以決定,后者,更多的是看準時間線。
謝崇進在光通信賽道即將迎來第 30 年。這一次,他不是在看行業會不會死,是在看自己會不會在算好時間節點的那一年里,把產品送到客戶手里。
*頭圖來源:奇點光子
本文為極客公園原創文章,轉載請聯系極客君微信 geekparkGO
極客一問
你如何看待光互連?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.