昨天,一則新聞刷爆了朋友圈:中國(guó)科學(xué)院上海光學(xué)精密機(jī)械研究所空天激光技術(shù)與系統(tǒng)部謝鵬研究員團(tuán)隊(duì)在解決“光芯片上高密度信息并行處理”難題上取得突破,研制出超高并行光計(jì)算集成芯片“流星一號(hào)”,該芯片首次在50GHz光學(xué)主頻下驗(yàn)證了并行度>100的片上光信息交互與計(jì)算。
那么問(wèn)題來(lái)了,這個(gè)芯片到底是做什么的,光計(jì)算又是什么?
研究的內(nèi)容是啥?
現(xiàn)在計(jì)算機(jī)都是圍繞電子學(xué)而展開(kāi),所謂光子計(jì)算,就是圍繞光子學(xué)而設(shè)計(jì)的計(jì)算芯片。
早在1979年,我國(guó)科學(xué)家錢(qián)學(xué)森就看好光子學(xué),并圍繞光子學(xué)提出了光子工業(yè)的概念。在論文中,錢(qián)學(xué)森就提到了光子計(jì)算機(jī):“光子技術(shù)的一個(gè)肯定要推進(jìn)的方面是光子計(jì)算機(jī)。現(xiàn)在已經(jīng)開(kāi)始了一些集成光路的基礎(chǔ)工作,將來(lái)可能是繼電子計(jì)算機(jī)之后,超過(guò)電子計(jì)算機(jī)的光子計(jì)算機(jī)。從原理上估計(jì),光子計(jì)算機(jī)的運(yùn)算能力可以為電子計(jì)算機(jī)的百倍、千倍以至萬(wàn)倍。”
這幾年,錢(qián)學(xué)森提出的理論已經(jīng)成為了現(xiàn)實(shí),光計(jì)算已經(jīng)擁有了諸多突破。目前,光學(xué)神經(jīng)網(wǎng)絡(luò)、神經(jīng)形態(tài)計(jì)算、通用處理器等技術(shù)已得到展示。然而,可擴(kuò)展性仍然是一個(gè)關(guān)鍵問(wèn)題,因?yàn)楦叩墓庥?jì)算能力需要更多的片上元件。例如,大多數(shù)片上可編程光子單元尺寸約為10至100微米,一個(gè)4英寸晶圓最多只能容納10000個(gè)。進(jìn)一步增大光子芯片尺寸會(huì)導(dǎo)致累積計(jì)算誤差、更高成本、調(diào)制不同步以及封裝風(fēng)險(xiǎn),從而限制了系統(tǒng)的可擴(kuò)展性。因此,可擴(kuò)展的片上光計(jì)算技術(shù)需求迫切,但目前仍在開(kāi)發(fā)中。為了利用光子的固有自由度,并行光計(jì)算得到了探索。
在眾多光計(jì)算技術(shù)中,基于馬赫-曾德?tīng)柛缮鎯x(MZI)網(wǎng)格的光計(jì)算支持使用僅空間編碼矢量的可編程矩陣乘法,這有望通過(guò)有效整合更多維度(如頻率通道)來(lái)實(shí)現(xiàn)并行光計(jì)算。然而,能夠通過(guò)結(jié)合頻率和空間自由度進(jìn)行并行矩陣-矩陣計(jì)算的光學(xué)張量核心仍未得到充分探索。本研究則提出并演示了一種由孤子微梳源和MZI網(wǎng)絡(luò)驅(qū)動(dòng)的并行光計(jì)算架構(gòu)。
根據(jù)研究團(tuán)隊(duì)的敘述,針對(duì)光計(jì)算高密度寬譜數(shù)據(jù)信號(hào)色散誤差問(wèn)題、高密度信道串?dāng)_問(wèn)題、光學(xué)矩陣高精度驅(qū)動(dòng)問(wèn)題,研究團(tuán)隊(duì)從底層物理機(jī)制出發(fā),建立了并行光計(jì)算物理模型,提出了一種適用于片上信息并行處理的糾錯(cuò)方法,將多波長(zhǎng)并行計(jì)算一致性提升至90%以上;團(tuán)隊(duì)系統(tǒng)性地設(shè)計(jì)了與波分復(fù)用兼容的多波長(zhǎng)光源,配合系統(tǒng)調(diào)制頻率需求,抑制了通道間信息串?dāng)_;面向并行光計(jì)算器件大帶寬需求,團(tuán)隊(duì)通過(guò)逆向設(shè)計(jì)方法,提升器件帶寬與魯棒性,使光計(jì)算芯片帶寬>40nm,滿足了系統(tǒng)需求。
換句話說(shuō),這個(gè)研究解決了并行架構(gòu)一些挑戰(zhàn),為提升光計(jì)算性能開(kāi)辟了新途徑,為發(fā)展低功耗、低時(shí)延、大算力、高速率的“超級(jí)光子計(jì)算機(jī)”帶來(lái)了可能性。
并行光計(jì)算輸出光譜一致性
具體到芯片層面來(lái)看,就是研究團(tuán)隊(duì)自主研制的核心光芯片“流星一號(hào)”,具體為孤子微梳源和MZI網(wǎng)絡(luò)驅(qū)動(dòng)的并行光計(jì)算架構(gòu),而該芯片的最大亮點(diǎn)就是并行度>100上。
該集成芯片采用90nm CMOS兼容工藝在絕緣體上硅(SOI)平臺(tái)上制造。MZI結(jié)構(gòu)由兩個(gè)分束器和兩個(gè)相移器組成。MZI中的分束器采用寬帶MMI。MZI中的相移器通過(guò)在波導(dǎo)層頂部圖案化的電阻加熱器實(shí)現(xiàn)。為了減輕熱串?dāng)_,每個(gè)相移器的驅(qū)動(dòng)功率保持在毫瓦級(jí),并采用了額外的熱隔離結(jié)構(gòu)。
芯片系統(tǒng)包含了集成微腔光頻梳,作為芯片級(jí)多波長(zhǎng)光源子系統(tǒng);大帶寬、低時(shí)延、可重構(gòu)光計(jì)算芯片,作為高性能并行計(jì)算核心;高精度、大規(guī)模、可擴(kuò)展的驅(qū)動(dòng)芯片,作為光學(xué)矩陣驅(qū)動(dòng)子系統(tǒng);基于該系統(tǒng),驗(yàn)證了并行度>100的片上光子信息交互與計(jì)算原型,在50GHz光學(xué)主頻下,單芯片理論峰值算力>2560TOPS,功耗比>3.2TOPS/W。
超高并行光計(jì)算架構(gòu)
光計(jì)算之所以這么受歡迎,不僅僅是因?yàn)樾阅軓?qiáng),更重要在于功耗低。謝鵬也在最近采訪中表示:“‘流星一號(hào)’的突破不僅在于算力提升,更在于其低功耗特性,未來(lái)可大幅降低數(shù)據(jù)中心能耗,助力綠色計(jì)算。”
光計(jì)算到底是啥?
伴隨ChatGPT、DeepSeek為代表的人工智能革命性成果的誕生,隨之而來(lái)的就是4~6個(gè)月翻倍一次的算力需求,但目前摩爾定律正在逐步放緩,傳統(tǒng)納米電子計(jì)算架構(gòu)面臨物理極限(如功耗、散熱和尺寸限制),算力越來(lái)越難以追趕AI的增長(zhǎng)速度。
當(dāng)前,解決電子芯片的“功耗墻”“存儲(chǔ)墻”的路徑包括三類路徑:一是通過(guò)先進(jìn)制程繼續(xù)縮小電子邏輯器件,包括光刻、封裝、材料多方面,如極紫外(EUV)光刻機(jī)、GAAFET、CFET、二維材料晶體管等;二是通過(guò)3D封裝互連和Chiplet實(shí)現(xiàn)多芯片異質(zhì)集成;三是直接舍棄傳統(tǒng)路線,如碳基計(jì)算、量子計(jì)算(光量子也屬于其中一環(huán))、光計(jì)算,其中,光計(jì)算或光電混合計(jì)算是當(dāng)前距離產(chǎn)業(yè)最近的路線。
光計(jì)算作為非馮?諾伊曼結(jié)構(gòu)代表,具有可擴(kuò)展、低功耗、超高速、寬帶寬、高并行度的天然優(yōu)勢(shì),是后摩爾時(shí)代破解高維張量運(yùn)算、復(fù)雜圖像處理等大規(guī)模數(shù)據(jù)快速計(jì)算的關(guān)鍵技術(shù)之一。
眾所周知,光具有波粒二象性,其中利用波動(dòng)性可以實(shí)現(xiàn)光經(jīng)典計(jì)算,利用粒子性可以實(shí)現(xiàn)光量子計(jì)算。光量子計(jì)算目前也在不斷迭代中,不過(guò)相比來(lái)說(shuō),光經(jīng)典計(jì)算走得更快一些。
細(xì)分到光計(jì)算,也有許多路線,包括數(shù)字路線和模擬路線,不過(guò)其中只有基于光學(xué)神經(jīng)網(wǎng)絡(luò)(ONN)的光計(jì)算技術(shù)是受關(guān)注度較高、產(chǎn)業(yè)化應(yīng)用前景較好的兩大類技術(shù)路線。
線性矩陣計(jì)算是ONN的基礎(chǔ),其實(shí)現(xiàn)方式主要分為基于空間光學(xué)和基于片上集成光學(xué)兩種路線。非線性激活函數(shù)有兩種實(shí)現(xiàn)方案:一是“光-電-光”的轉(zhuǎn)換方案,二就是“全光”方案。
基于空間光學(xué)的方案在自由空間中的傳播特性進(jìn)行計(jì)算,具有天然的并行性優(yōu)勢(shì),包括光學(xué)4f成像、空間光衍射、Fabry-Perot 激光器、偏振光束分裂器、波分復(fù)用系統(tǒng)等。
片上集成將光學(xué)元件集成到芯片上,以實(shí)現(xiàn)更小尺寸、更高集成度和更穩(wěn)定性能的ONN。包括MZI干涉結(jié)構(gòu)、MRM波分結(jié)構(gòu)、亞波長(zhǎng)衍射結(jié)構(gòu)等方案。目前,MZI路線最大的有點(diǎn)是成熟、可以量產(chǎn)、并且比較穩(wěn)定;MRM這個(gè)工藝的穩(wěn)定性和成熟度還不是很好;衍射方的優(yōu)點(diǎn)在于功耗可以更低,但它可能會(huì)犧牲可編程性。總之,過(guò)去三年MZI是落地最快的一個(gè)場(chǎng)景。而此次的超高并行光計(jì)算芯片也選擇了MZI路線。
誰(shuí)在做光計(jì)算?
目前,光計(jì)算領(lǐng)域初創(chuàng)企業(yè)聚焦在ONN,全球范圍內(nèi),中國(guó)和歐美在光計(jì)算領(lǐng)域基本處于并跑狀態(tài)。
在多數(shù)媒體宣傳中,普遍將光計(jì)算描繪為比GPU高1000倍以上的一種技術(shù)。光子作為信息載體確實(shí)具有獨(dú)特的優(yōu)勢(shì),有實(shí)現(xiàn)千倍算力提升的潛力,但顯然目前肯定實(shí)現(xiàn)不了這樣的效果。
在這種情況下,如何突破現(xiàn)有算力生態(tài)的瓶頸,真正把光的“能量”帶到產(chǎn)業(yè)中去,才是企業(yè)當(dāng)下需要考慮的問(wèn)題。從初創(chuàng)企業(yè)的動(dòng)作來(lái)看,大部分也在推出性能高出現(xiàn)有電子芯片幾倍或者十幾倍的芯片,提升幅度也許不是很大,但能夠真正進(jìn)入行業(yè)。
國(guó)內(nèi)方面:
上海曦智科技:成立于2018年,是中國(guó)最早進(jìn)行光計(jì)算產(chǎn)業(yè)化的公司之一,其技術(shù)源于麻省理工學(xué)院,公司創(chuàng)始人沈亦晨博士是MZI干涉方案代表性論文的第一作者。其圍繞光子矩陣計(jì)算(oMAC)、片上光網(wǎng)絡(luò)(oNOC)和片間光網(wǎng)絡(luò)(oNET)三大核心技術(shù)開(kāi)發(fā)產(chǎn)品,目前最新推出的曦智天樞光子矩陣規(guī)模達(dá)到128x128,采用“OPU光學(xué)處理單元+ASIC光電混合處理器”,是曦智上一代產(chǎn)品等效光算力的4倍,是一個(gè)當(dāng)下即可落地,實(shí)現(xiàn)單位算力能耗快速提升的實(shí)用解決方案。軟件層面,曦智科技同樣構(gòu)建了完整的開(kāi)發(fā)工具鏈以實(shí)現(xiàn)光計(jì)算芯片的實(shí)用化。智規(guī)劃明年底完成的256x256光子矩陣產(chǎn)品樣片,2027年正式發(fā)布。
蘇州光本位科技:成立于2022年,其技術(shù)源于牛津大學(xué),采用MRR波分系統(tǒng)與相變材料(PCM)結(jié)合的方案,公司稱之為“PCM+Crossbar方案”,光本位科技則在光芯片的技術(shù)路線中選擇了一條特殊路線——光本位采用硅光+相變材料的異質(zhì)集成以及獨(dú)有的Crossbar光子矩陣計(jì)算結(jié)構(gòu),成為首家實(shí)現(xiàn)光計(jì)算芯片存算一體的商業(yè)化公司。主要產(chǎn)品是光計(jì)算板卡,目前正在調(diào)試矩陣規(guī)模為128×128的光計(jì)算板卡,預(yù)期峰值算力可超過(guò)1000 TOPS,算力密度已超越先進(jìn)工藝的電芯片,預(yù)計(jì)在今年推出商業(yè)化光計(jì)算板卡產(chǎn)品。
北京芯算科技:成立于2023年,技術(shù)源于麻省理工學(xué)院,采用MRR波分系統(tǒng)與相變材料(PCM)結(jié)合的方案,創(chuàng)始人楊文強(qiáng)畢業(yè)于中國(guó)科學(xué)院光所,2023年推出高維光計(jì)算芯片和光電混合計(jì)算原型板卡,該板卡集成了片上多波長(zhǎng)光源芯片、光子矩陣運(yùn)算芯片、波分復(fù)用模組和光電轉(zhuǎn)換模組等,算力已突破100 TOPS。
北京光子芯力:成立于2024年,技術(shù)源于清華大學(xué),采用亞波長(zhǎng)衍射結(jié)構(gòu)方案。“光子芯力”的產(chǎn)品是一款光電融合計(jì)算芯片,團(tuán)隊(duì)開(kāi)創(chuàng)性地采用全波計(jì)算技術(shù)路徑,第一代光芯片已經(jīng)流片完成,目前正與多家客戶合作開(kāi)發(fā)落地方案。
國(guó)外企業(yè):
Lightmatter:成立于2017年,總部位于美國(guó)加利福尼亞州,技術(shù)源于麻省理工學(xué)院。創(chuàng)始人尼古拉斯·哈里斯是MZI干涉方案代表性論文的共同作者。產(chǎn)品線包括光子計(jì)算平臺(tái)(Envise)、芯片互連產(chǎn)品(Passage)、適配軟件(Idiom。
Luminous Computing:成立于2018年,總部位于美國(guó)加利福尼亞州,CTO Mitchell Nahmias博士期間專注于光學(xué)AI芯片研究,技術(shù)源于普林斯頓大學(xué)Paul Prucnal課題組的MRR方案。2023年,公司展示了O波段TRX光子鏈路芯片,該芯片使用45nm工藝,具有16個(gè)通道,能在112Gbps下工作,功耗約為4.3pJ/bit(不含激光器功耗)。
Optalysys:成立于2013年,總部位于英國(guó)利茲,技術(shù)源于劍橋大學(xué),2019年推出了商用分立光學(xué)處理系統(tǒng)FT:X2000,該產(chǎn)品基于空間光傳輸可等效于卷積操作的原理,通過(guò)集成微透鏡實(shí)現(xiàn)器件小型化,可用于處理高分辨圖像和視頻。目前,Optalysys的產(chǎn)品聚焦在光計(jì)算安全加密領(lǐng)域。
Lighton:成立于2016年,總部位于法國(guó)巴黎。2020年推出了基于離軸光全息技術(shù)的空間光學(xué)計(jì)算系統(tǒng),主要應(yīng)用于機(jī)器學(xué)習(xí)、衛(wèi)星圖像分析和自然語(yǔ)言處理等智能計(jì)算領(lǐng)域。2021年,成功將“Appliance”光學(xué)處理單元(OPU)集成到法國(guó)Jean Zay超級(jí)計(jì)算機(jī)上,能夠在超大規(guī)模上加速隨機(jī)算法,并可與標(biāo)準(zhǔn)硅處理器和NVIDIA的A100 GPU技術(shù)協(xié)同工作。
Fathom Computing:成立于2014年,總部位于美國(guó)加利福尼亞州,其光子原型計(jì)算機(jī)在2014年時(shí)識(shí)別手寫(xiě)數(shù)字的準(zhǔn)確率約為30%,到2018年已超過(guò)90%。然而,該公司近年來(lái)并未公開(kāi)更多進(jìn)展。
目前光電融合可以解決很多問(wèn)題
目前,突破算力限制有兩條創(chuàng)新路線:第一條是存算一體路線,本質(zhì)有近存計(jì)算和存內(nèi)計(jì)算兩類方式,通過(guò)將存儲(chǔ)單元放在計(jì)算邏輯芯片上,解決存儲(chǔ)與計(jì)算之間帶寬和數(shù)據(jù)搬運(yùn)的問(wèn)題;第二是通過(guò)非GPU架構(gòu),如美國(guó)Sambanova的流式計(jì)算架構(gòu)、谷歌TPU專用的ASIC架構(gòu),通過(guò)將芯片上的晶體管重新排列,提高晶體管在計(jì)算時(shí)的利用率。
很顯然,兩種路線都不能解決數(shù)字芯片最根本的晶體管數(shù)量問(wèn)題。并不是說(shuō)兩條路線不好,而是未來(lái)兩條路線最終一定還會(huì)繞回晶體管密度這個(gè)問(wèn)題上。所以,通過(guò)將光子和電子混合在一起,就能解決這根本性的問(wèn)題。與此同時(shí),近存計(jì)算或流式架構(gòu)同樣適用于光電混合計(jì)算芯片上,從而實(shí)現(xiàn)更大的底層突破。
之所以晶體管很難進(jìn)一步提高單位面積的絕對(duì)計(jì)算密度,是因?yàn)榈羌{德縮放比例失效,如果把晶體管繼續(xù)做小會(huì)產(chǎn)生量子極限的隧穿效應(yīng),而如果以兩倍的主頻運(yùn)行會(huì)同時(shí)帶來(lái)兩倍的熱量,單位面積芯片如果不能把這些熱量散發(fā)出去就會(huì)導(dǎo)致芯片融化。這兩個(gè)問(wèn)題的本質(zhì)都在于銅導(dǎo)線存在電阻,晶體管收放電都會(huì)產(chǎn)生熱量,而光則不會(huì)產(chǎn)生熱量,因此可以通過(guò)提高其主頻或復(fù)用波長(zhǎng)數(shù)量進(jìn)一步增加單位面積的絕對(duì)算力。
總體來(lái)說(shuō),當(dāng)前光計(jì)算產(chǎn)品主要以“光電融合”方式實(shí)現(xiàn),芯片內(nèi)部包含光芯片、電芯片及其他外圍器件,光芯片進(jìn)行整數(shù)運(yùn)算,電芯片負(fù)責(zé)浮點(diǎn)運(yùn)算。不過(guò),目前光計(jì)算產(chǎn)業(yè)鏈仍處于發(fā)展起步階段,成熟度較低。但已有一些性能功耗比不錯(cuò)的產(chǎn)品,成為GPU的重要互補(bǔ)。
隨著全球人工智能產(chǎn)業(yè)高速發(fā)展,光計(jì)算芯片正迎來(lái)新一輪增長(zhǎng)機(jī)遇。預(yù)計(jì)到2027年,全球光芯片市場(chǎng)規(guī)模將達(dá)到56億美元。引用行業(yè)一句話:“當(dāng)電子芯片還在2納米懸崖邊徘徊時(shí),光計(jì)算芯片已點(diǎn)燃新的火炬。”
參考文獻(xiàn)
[1]Yu, X., Wei, Z., Sha, F.et al. Parallel optical computing capable of 100-wavelength multiplexing. eLight 5, 10 (2025). https://doi.org/10.1186/s43593-025-00088-8
[2]錢(qián)學(xué)森. 光子學(xué)、光子技術(shù)、光子工業(yè)[J]. 中國(guó)激光, 1979, 6(1): 1. 錢(qián)學(xué)森. [J]. Chinese Journal of Lasers, 1979, 6(1): 1.
[3]信熹資本:https://mp.weixin.qq.com/s/6uUf-AO91dt1Zv6QQrVodw
[4]維科網(wǎng)光通訊:https://mp.weixin.qq.com/s/yPWRxbijBxx8R81I5zr2wQ
[5]集成光學(xué)PIC:https://mp.weixin.qq.com/s/VV6BNY9GdIn4YSeWs6zZng
歡迎將我們?cè)O(shè)為“星標(biāo)”,這樣才能第一時(shí)間收到推送消息。
關(guān)注EEWorld旗下訂閱號(hào):“機(jī)器人開(kāi)發(fā)圈”
回復(fù)“DS”領(lǐng)取《DeepSeek:從入門(mén)到精通》完整版
掃碼添加小助手回復(fù)“機(jī)器人”
進(jìn)群和電子工程師們面對(duì)面交流經(jīng)驗(yàn)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.