[首發(fā)于智駕最前沿微信公眾號]對于自動駕駛來說,激光雷達的重要性不言而喻,它能精確告訴系統(tǒng)物體在哪里、有多遠,但在顏色識別上,它卻是個門外漢。之所以會出現(xiàn)這個問題,主要是因為激光雷達工作在905納米或1550納米的近紅外頻段,這個波段超出了人類肉眼的可見范圍,自然也就無法直接感知紅、綠、藍等色彩信息。它輸出的是由無數(shù)個點構(gòu)成的三維坐標(biāo)圖,雖然這些點帶有反射強度信息,能區(qū)分出路面和標(biāo)線,但卻無法分辨紅綠燈的顏色,也看不出車身的漆面色彩。
就在最近,禾賽發(fā)布了全彩激光雷達,讓激光雷達也具備了色彩識別能力。小編查閱了網(wǎng)上的一些內(nèi)容,了解了下全彩激光雷達色彩識別的基本原理,今天就和大家一起來聊一聊,若是存在錯誤之處,也歡迎大家評論區(qū)補充。
![]()
圖片源自:禾賽科技
為什么激光雷達看不見顏色?
激光雷達之所以是色盲,主要受制于其硬件架構(gòu)和物理特性。在過去,如果想要讓激光雷達擁有色彩,通用的辦法是拼湊。工程師會通過一個甚至多個攝像頭,先讓激光雷達畫出物體的輪廓,再讓攝像頭拍下照片,最后通過算法把照片上的顏色一張張貼到激光雷達的點云上,這個過程被稱為傳感器融合。
![]()
圖片源自:網(wǎng)絡(luò)
這種后期貼圖的方式雖然讓感知信息更加豐富,但在實際應(yīng)用中卻埋下了不少隱患。由于激光雷達和攝像頭的物理位置不同、數(shù)據(jù)更新的頻率不一致,再加上光線折射等物理因素,系統(tǒng)在高速運動或者光影劇烈變化的環(huán)境下,很難實現(xiàn)物理意義上的完全同步。這就好比一個后期配音的電影,如果音軌和畫面差了零點幾秒,觀眾會感到違和,而對于需要毫秒級反應(yīng)的自動駕駛系統(tǒng)來說,這種對不齊可能導(dǎo)致算法對物體性質(zhì)的誤判。
此外,后期融合非常吃算力。車載大腦需要花費大量的計算資源去校準(zhǔn)兩套完全不同的數(shù)據(jù)流,試圖把它們強行按在同一個坐標(biāo)系里。這種繁瑣的處理邏輯,不僅增加了系統(tǒng)的延遲,也讓感知的可靠性打了一定折扣。
如何在一顆芯片上搞定空間與色彩?
全彩激光雷達其實是傳感器從物理組合進化到了底層融合。其核心技術(shù)突破在于將接收激光回波的感光單元與接收可見光的色彩感應(yīng)單元,集成到了同一塊SPAD(單光子雪崩二極管)系統(tǒng)級芯片上。但想要實現(xiàn)色彩識別的功能,依舊是非常難的,因為它要求芯片既能捕捉到極微弱的激光光子來計算飛行時間,又能像相機感光元件一樣感知不同波長的可見光。
![]()
圖片源自:禾賽科技
要理解激光雷達如何實現(xiàn)彩色識別,首先得打破激光雷達只能發(fā)光的固有印象。在全彩激光雷達的芯片設(shè)計中,每一個探測單元其實更像是一個精密的小型實驗室,它不再只盯著自己發(fā)出的那道激光回波,而是開始同時留意環(huán)境中的自然光。這就像是在一個黑屋子里,你不僅通過手電筒閃爍的間隔來判斷墻壁的遠近,還能通過眼睛分辨出那堵墻是紅色的還是藍色的。
1)每一個像素里到底藏著什么玄機?
實現(xiàn)彩色識別的第一步,是在傳感器底層的像素結(jié)構(gòu)上做加法。在傳統(tǒng)的芯片方案中,像素點只需要對特定波長的近紅外激光產(chǎn)生反應(yīng)。但全彩激光雷達引入了類似數(shù)碼相機感光元件的設(shè)計思路,在同一個微小的芯片像素上,通過半導(dǎo)體工藝覆蓋了一層極薄的濾光膜。
這些濾光膜就像給感應(yīng)器戴上了三色濾鏡,分別允許紅光、綠光和藍光通過。這意味著,當(dāng)這個像素在接收激光脈沖返回信號來測量距離(也就是深度信息)的同時,它也能捕捉到來自這個點位的可見光光子。因為測距信號和色彩信號是共用同一個像素、同一套光路收集進來的,這就保證了輸出的每一個三維坐標(biāo)點在誕生時就自帶了顏色屬性。這種物理層面的結(jié)合,讓數(shù)據(jù)從源頭就是高度統(tǒng)一的。
2)怎么讓距離和顏色在同一時刻各就各位?
全彩激光雷達最難的部分應(yīng)該是如何讓激光測距和色彩感應(yīng)互不干擾。激光雷達工作時發(fā)射的脈沖極快,屬于納秒級別,而環(huán)境色彩的采集則依賴于對自然光的積累。全彩激光雷達的核心芯片采用了單光子探測技術(shù),這種技術(shù)極其靈敏,甚至能夠捕捉到單個光子的跳動。它利用極高的采樣頻率,在激光脈沖往返的極短時間內(nèi),劃分出不同的時隙。
芯片內(nèi)部的邏輯電路會把信號分成兩路處理,一路專門記錄激光脈沖從發(fā)射到回傳的時間差,用來換算成物體的精確距離;另一路則負責(zé)統(tǒng)計在同一光軸上進入的可見光光子數(shù)量,并根據(jù)濾光片的反饋計算出RGB數(shù)值。由于這兩項任務(wù)是在同一塊單光子雪崩二極管(SPAD)陣列上完成的,它們在時間軸和空間位移上是絕對對齊的。這種設(shè)計徹底告別了過去那種激光雷達看形狀,攝像頭看顏色的拼接模式,避免了因為車輛顛簸或高速行駛導(dǎo)致畫面和輪廓對不齊的尷尬。
![]()
圖片源自:禾賽科技
3)為什么這種自帶顏色的能力如此重要?
從感知的邏輯來看,全彩激光雷達提供的不再是冷冰冰的幾何點,而是具有語義信息的視覺點云。在傳統(tǒng)的感知方案中,如果路面上突然出現(xiàn)一個五顏六色的彩色塑料袋,普通激光雷達可能只能探測到一個低矮的障礙物,無法判斷它的材質(zhì)。但全彩激光雷達能立刻通過色彩特征分析出它可能只是一個質(zhì)地輕盈的漂浮物。
這種能力在識別交通環(huán)境時非常重要。比如在復(fù)雜的十字路口,地面上不同顏色的導(dǎo)向箭頭、彩色施工護欄,或者是遠處交通信號燈投射在物體表面的微弱光影,都能被這種全彩點云直接捕獲。對于后臺的自動駕駛算法來說,這相當(dāng)于減少了一個極其繁瑣的拼圖步驟。系統(tǒng)不需要再拿著攝像頭的圖像去和激光雷達的輪廓反復(fù)比對校準(zhǔn),而是直接拿到了一張高清的、帶有深度信息的彩色三維實景圖。這種數(shù)據(jù)維度的增加,不僅提升了系統(tǒng)對周圍環(huán)境的理解深度,也極大地提高了感知任務(wù)的可靠性和實時性。這就好比我們從看一部配音電影,變成了看現(xiàn)場直播,所見即所得。
這種技術(shù)突破能改變什么?
當(dāng)激光雷達真正看到色彩后,自動駕駛系統(tǒng)的感知能力會發(fā)生質(zhì)的飛躍。最直觀的改變體現(xiàn)在語義識別的精度上。在傳統(tǒng)的點云數(shù)據(jù)中,一個黑色塑料袋和一個黑色的水泥墩可能看起來差別不大,因為它們的形狀和反射率可能比較接近。但如果激光雷達自帶全彩視覺,算法就能瞬間識別出它們的材質(zhì)和色彩差異,從而做出更合理的避讓策略。
對于交通標(biāo)志和地面標(biāo)線的識別,全彩激光雷達也表現(xiàn)出極強的優(yōu)勢。很多時候,車道線的顏色(黃色或白色)或者交通指示牌的底色,對于理解交通規(guī)則至關(guān)重要。原生全彩數(shù)據(jù)讓系統(tǒng)不再需要去猜測顏色,而是直接獲取高清的彩色三維地圖。這不僅能顯著提高系統(tǒng)在復(fù)雜路口、施工區(qū)域的判斷準(zhǔn)確率,還能在夜間或強光直射等攝像頭容易致盲的場景下,通過激光和視覺信息的互補,提供更穩(wěn)健的感知冗余。
![]()
圖片源自:網(wǎng)絡(luò)
這種技術(shù)也極大地釋放了計算壓力。因為數(shù)據(jù)在傳感器端就已經(jīng)完成了融合,車載計算機不再需要運行復(fù)雜的融合對齊算法,可以將寶貴的算力投入到更高級的決策和規(guī)劃任務(wù)中。這種軟硬件一體化的趨勢,正在讓自動駕駛的感知系統(tǒng)變得更加簡潔和高效,讓其既能看清距離,也能讀懂世界的色彩。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.