![]()
![]()
在噪聲中堅持做難而正確的事。
作者|劉楊楠
編輯|栗子
具身智能行業(yè),數(shù)據(jù)一直是關(guān)鍵卡點。模型廠商需要大量來自物理世界的真實數(shù)據(jù)訓(xùn)練模型,讓機(jī)器人變得更聰明,能夠更快走進(jìn)家庭和工廠。
于是,各方大建數(shù)采中心,具身數(shù)據(jù)正在越來越多,一些公司則定下了在2026年發(fā)布百萬小時級數(shù)據(jù)集的目標(biāo)。
然而,在這海量的數(shù)據(jù)中,真正能用于訓(xùn)練具身模型,讓機(jī)器人“聰明”起來的數(shù)據(jù),卻仍然稀缺。因為大多數(shù)數(shù)據(jù)處于一種“混沌狀態(tài)”:時間戳無法對齊、模態(tài)不同步、標(biāo)注信息不完整、數(shù)據(jù)結(jié)構(gòu)不統(tǒng)一。
造成這種“混沌”的原因很復(fù)雜,目前已經(jīng)有一些初創(chuàng)企業(yè)開始在其中尋找解法。2025年12月成立的智域基石,正是其中十分有特色的一家。
智域基石提出了“數(shù)據(jù)編譯”的全新理念,把在軟件工程領(lǐng)域已經(jīng)成熟的“編譯”概念引入具身智能數(shù)據(jù)處理,搭建了一套包含“質(zhì)檢、底座、編譯、檢索、交付”五個環(huán)節(jié)的數(shù)據(jù)編譯管線。
這套管線既不是傳統(tǒng)的數(shù)據(jù)標(biāo)注,也不同于自動駕駛的數(shù)據(jù)清洗,它是一個需要同時理解機(jī)器人本體、具身模型算法以及大數(shù)據(jù)工程的數(shù)據(jù)新基建。
目前,智域基石已完成數(shù)千萬元天使輪融資,本輪投資方由四家代表性機(jī)器人廠商——靈初智能、穹徹智能、浙江人形、智平方(拼音序),以及紫江集團(tuán)控股的紫竹高新區(qū)旗下VC投資管理平臺小苗朗程共同構(gòu)成。
近期,「甲子光年」與智域基石CEO楊哲軒、CTO徐良威、COO張計業(yè)進(jìn)行了一次深度交流,試圖理清在具身智能這場漫長的競賽中,智域基石選擇的數(shù)據(jù)編譯賽道,究竟是一門怎樣的生意,又將走向何方?
1.具身智能需要“數(shù)據(jù)編譯”
楊哲軒進(jìn)入具身智能行業(yè)的時間不算長。
![]()
從左至右依次為智域基石COO張計業(yè)、CEO楊哲軒、CTO徐良威,圖片來源:智域基石
徐良威有騰訊、小鵬機(jī)器人的從業(yè)背景,是實戰(zhàn)經(jīng)驗豐富的機(jī)器人軟硬件專家,熟悉具身智能算法對于數(shù)據(jù)的需求,也有豐富硬件落地的經(jīng)驗。張計業(yè)則為前華為地市總經(jīng)理,曾擔(dān)任具身智能公司穹徹智能生態(tài)負(fù)責(zé)人。
三個人在行業(yè)里觀察了將近兩年。他們注意到,整個具身智能領(lǐng)域的“投入產(chǎn)出比”并不可觀。2023 年,資本大量涌入具身智能賽道,投模型、投本體、投零部件,但真正在產(chǎn)業(yè)端落地的成果卻乏善可陳——無論工業(yè)場景還是家庭場景,并未出現(xiàn)特別亮眼的突破。
在楊哲軒看來,具身智能之所以難以落地,本質(zhì)上在于它與物理世界的交互方式與大語言模型或自動駕駛完全不同。
“大語言模型的突破背后,有一個容易被忽視的前提,它是有數(shù)據(jù)的。”楊哲軒向「甲子光年」解釋,“GPT-3.5出來之后,國內(nèi)投了幾百億,很快模型廠商就有所突破。為什么?因為算法是成熟的,算力雖然緊張但不會成為核心矛盾,關(guān)鍵在于數(shù)據(jù)已經(jīng)存在了。”
自動駕駛也是類似的邏輯。道路資源由政府提供,作為一種普惠的基建存在,主機(jī)廠只需把車改造后上路,汽車行駛過程中自然能夠進(jìn)行數(shù)據(jù)采集,幾乎沒有過多額外的數(shù)據(jù)采集成本。
“但具身智能不同。”楊哲軒說,“它是所謂的‘千行萬業(yè)’,每進(jìn)入一個場景都有成本、有門檻,因為你要跟物理世界接觸,要采數(shù)據(jù)、要跟人溝通、要處理各種價值分配關(guān)系。”
因此,場景越是碎片化,單一模型公司或本體廠商自建數(shù)采體系的邊際成本就越高。 一家做工業(yè)揀選的公司,很難為了訓(xùn)練一個擰螺絲的技能,再去打通一個五金車間的入場權(quán);一家做家庭陪伴的公司,也很難為了一次廚房場景的數(shù)據(jù)采集,去解決千家萬戶的隱私授權(quán)問題。
物理世界的非標(biāo)與封閉,決定了大多數(shù)玩家很難靠“自給自足”拿到所需場景的高質(zhì)量數(shù)據(jù)。正是基于這一判斷,三人在一個月內(nèi)迅速達(dá)成共識:在物理世界的勞動與數(shù)字世界的模型之間,必須生長出一個獨立的中間層,一個專門做具身智能數(shù)據(jù)的“編譯層”。
這一層不參與模型的路線之爭,也不介入本體的硬件博弈,只專注于一件事:用工程化的技術(shù)手段,把真實場景中碎片化的物理交互數(shù)據(jù),轉(zhuǎn)化為模型可消化、可執(zhí)行的通用養(yǎng)料。
2.“數(shù)據(jù)編譯”難在哪?
或許有人會疑惑,自動駕駛或大語言模型訓(xùn)練也需要大量數(shù)據(jù)標(biāo)注工作,所謂“數(shù)據(jù)編譯”是否只是換湯不換藥?
對此,徐良威解釋道,機(jī)器人訓(xùn)練所需的數(shù)據(jù)和自動駕駛、CV模型或NLP模型所需的數(shù)據(jù)類型有本質(zhì)不同。
后者數(shù)據(jù)類型相對單一,通常使用標(biāo)準(zhǔn)化腳本或者線性管道,就能把原始數(shù)據(jù)變成模型可用的格式。但具身智能需要的數(shù)據(jù)的兩個特點使得數(shù)據(jù)處理難度極大提升:第一是數(shù)據(jù)種類的多模態(tài);第二,任務(wù)結(jié)構(gòu)和操作語義的非標(biāo)準(zhǔn)化。
目前,合成數(shù)據(jù)、遙操數(shù)據(jù)、真機(jī)數(shù)據(jù)、人類數(shù)據(jù)(Ego Centric 數(shù)據(jù))是常見的四類數(shù)據(jù)類型。
在楊哲軒看來,數(shù)據(jù)的價值取決于訓(xùn)練的目標(biāo)維度。
如果從“直接教機(jī)器人動起來”這個角度看,機(jī)器人遙操數(shù)據(jù)仍然是最直接有效的。因為它們有動作監(jiān)督,跟機(jī)器人執(zhí)行空間更近。
如果從“讓模型變聰明、懂任務(wù)、懂交互、懂長程邏輯”這個角度看,人類數(shù)據(jù)(Ego Centric數(shù)據(jù))的價值會越來越大。因為機(jī)器人未來不可能只靠昂貴真機(jī)數(shù)據(jù)堆出認(rèn)知能力。
如果從“做規(guī)模化擴(kuò)張”這個角度看,仿真與合成數(shù)據(jù)不可或缺,但不能脫離真實世界校準(zhǔn)。它更適合擴(kuò)張、補長尾、做壓測;但如果沒有真機(jī)閉環(huán),仿真很容易越做越漂亮、越做越脫離交付。
因此,楊哲軒認(rèn)為,真正高效的機(jī)器人訓(xùn)練數(shù)據(jù)不會只押一種形態(tài),需要構(gòu)建一套完整的“數(shù)據(jù)配方”——用第一人稱/互聯(lián)網(wǎng)數(shù)據(jù)學(xué)語義和技能先驗;用遙操作數(shù)據(jù)學(xué)動作映射;用仿真數(shù)據(jù)擴(kuò)展覆蓋面;用真機(jī)數(shù)據(jù)完成最終校準(zhǔn)與閉環(huán)。
這個過程中,“關(guān)鍵問題不是比例,而是什么數(shù)據(jù)在什么階段最有價值。”徐良威補充道。
事實上, 這個關(guān)鍵判斷已經(jīng)成為一種行業(yè)層面的共識。今年年初人類數(shù)據(jù)的爆發(fā),是這項行業(yè)新共識的有力印證。
無論是π0.6還是Generalist Intelligence 1(GEN-1),都讓行業(yè)看到了一個共同結(jié)論:模型要具備泛化能力,要提高成功率,必須依靠多層面、多階段、多級別的數(shù)據(jù)。
為此,在智域基石的編譯管線中,人類(Ego-Centric)數(shù)據(jù)在管線中的重要性會越來越高。因為Ego-Centric數(shù)據(jù)正在補足機(jī)器人和物理世界交互的空缺。
智域基石正在自研Ego-Centric采集設(shè)備,試圖從四個維度采集多模態(tài)、多維度、全方位的信息,涵蓋本體(人/機(jī)器人)、工具(手/夾爪/靈巧手)、物體(操作對象)、環(huán)境(空間重建)四個方面。
以“拿杯子”的場景為例,一個人用手去拿一個杯子,手和杯子之間產(chǎn)生了接觸關(guān)系。對應(yīng)到機(jī)器人,就是夾爪或靈巧手去操作杯子。Ego-Centric設(shè)備要做的,是同時采集人看到的信息、聽到的信息、觸摸到的信息,以及環(huán)境的空間重建信息。“這樣才能產(chǎn)生一套完整的數(shù)據(jù)對應(yīng)關(guān)系。”徐良威說。
然而,人類數(shù)據(jù)比傳統(tǒng)真機(jī)數(shù)據(jù)更難處理。
“二者本質(zhì)上沒有區(qū)別,都是真實數(shù)據(jù),即發(fā)生在物理世界中、與環(huán)境有交互的數(shù)據(jù)。”徐良威解釋,“但Ego-Centric需要更多的算子來支持從中提取結(jié)構(gòu)和語義信息。因為它是通過人的第一視角來觀測,通過人使用工具的決策來訓(xùn)練模型,這中間有一個‘翻譯’的過程。”
機(jī)器人訓(xùn)練對數(shù)據(jù)的苛刻需求,使得傳統(tǒng)數(shù)據(jù)標(biāo)注模式已然失效。
數(shù)據(jù)標(biāo)注是勞動密集型的工作,壁壘在于人力成本和管理效率;數(shù)據(jù)編譯是技術(shù)驅(qū)動的工作,壁壘在于整個管線的算法能力和系統(tǒng)工程能力。
智域基石正希望構(gòu)建整套數(shù)據(jù)編譯管線,把多種類的數(shù)據(jù)變成大多數(shù)模型可以直接使用的格式。就像此前C語言、Go語言、Rust語言,最終全都被編譯成Windows、Mac或Linux可以運行的程序。
不過,在智域基石的編譯管線中,真機(jī)遙操示教數(shù)據(jù)和人類第一視角數(shù)據(jù)將共同存在,瞄準(zhǔn)不同的模型訓(xùn)練需求。真機(jī)遙操示教數(shù)據(jù)瞄準(zhǔn)后訓(xùn)練或者是類似π0.6的異構(gòu)訓(xùn)練的需求,人類數(shù)據(jù)則瞄準(zhǔn)模型的預(yù)訓(xùn)練。正如GEN-1所展現(xiàn)的那樣,基于新一代VLA架構(gòu)的思路,把連續(xù)物理交互當(dāng)成一等公民來建模,可穿戴設(shè)備在物理世界的交互作為模型的燃料。
但要做成這件事,并不容易。
因為具身智能的數(shù)據(jù)處理天然位于“機(jī)器人硬件、模型算法、大數(shù)據(jù)工程”三者交匯處的空白地帶。
隨著具身智能數(shù)據(jù)量級正迎來指數(shù)級的躍升,“懂算法的不懂工程量產(chǎn),懂量產(chǎn)的不懂機(jī)器人硬件”的結(jié)構(gòu)性錯位,不僅推高了行業(yè)的試錯成本,更成為了制約具身大模型跨越物理鴻溝的最大掣肘。
而智域基石的團(tuán)隊稟賦,決定了他們具備打造具身智能數(shù)據(jù)“新基建”的先決條件。智平方曾對智域基石給予高度評價。他們認(rèn)為,智域基石的核心優(yōu)勢,不只是做數(shù)據(jù),更在于能把真實場景中的數(shù)據(jù)采集、加工和終端反饋閉環(huán)持續(xù)跑通,這對于具身智能產(chǎn)品迭代來說,具備非常現(xiàn)實的協(xié)同價值 。
目前,智域基石正在搭建了一條完整的數(shù)據(jù)編譯管線,并已獲得市場初步認(rèn)可。
3.具身智能的“數(shù)據(jù)編譯”怎么做?
智域基石搭建的數(shù)據(jù)編譯管線包含五個關(guān)鍵環(huán)節(jié),分別為“數(shù)據(jù)質(zhì)檢-數(shù)據(jù)底座重構(gòu)-數(shù)據(jù)編譯-智能檢索與組配-標(biāo)準(zhǔn)化打包與彈性交付”。
其中,第一環(huán)是數(shù)據(jù)質(zhì)檢,但它的重要性長期被行業(yè)忽視。
原始傳感器數(shù)據(jù)被記錄下來后,首先要面臨一道全量篩查,例如攝像頭是否丟幀、IMU是否漂移、關(guān)節(jié)數(shù)據(jù)是否完整。
不同于行業(yè)內(nèi)因成本所迫而普遍采用的抽檢模式,智域基石通過云原生分布式架構(gòu),將質(zhì)檢拆分為細(xì)粒度計算單元,在可控成本內(nèi)完成對每一幀數(shù)據(jù)的“來料檢測”。
楊哲軒補充道,這種將質(zhì)檢還原為分布式計算問題的思路,使得同等自動化水平下的資源成本僅為傳統(tǒng)方案的三分之一甚至更低。
質(zhì)檢通過的數(shù)據(jù),會進(jìn)入具身數(shù)據(jù)底座。底座環(huán)節(jié)的核心任務(wù)是時空對齊。
時間對齊相對容易理解,需要將不同頻率的數(shù)據(jù)統(tǒng)一時間基準(zhǔn)。攝像頭可能是15Hz或30Hz,IMU可能是200Hz甚至500Hz,底座需要將這些不同頻率的數(shù)據(jù)在時間維度上對齊,確保每一時刻的數(shù)據(jù)都能準(zhǔn)確對應(yīng)。
空間對齊則更復(fù)雜。機(jī)器人與物理世界交互時,需要知道“手在哪里”“眼睛在哪里”“操作對象在哪里”,這些信息都必須通過設(shè)備外參來進(jìn)行坐標(biāo)系變換,對齊到唯一的物理空間中。“對齊之后,數(shù)據(jù)就從散亂的、無規(guī)則的狀態(tài),變成相對有序的、可被后處理的數(shù)據(jù)了。”徐良威說。
在底座進(jìn)行時空對齊后,數(shù)據(jù)就正式進(jìn)入“編譯”環(huán)節(jié),這是整套管線的“靈魂”。
徐良威解釋道,底座解決的是幾何與時間上的對齊,但數(shù)據(jù)此時仍不具備語義信息。
編譯環(huán)節(jié)的目標(biāo),就是從中提取出模型真正可用的特征。以機(jī)器人拿起杯子的任務(wù)場景為例,智域基石的數(shù)據(jù)編譯能力不只是標(biāo)注“用左手拿起杯子”的動作標(biāo)簽,更包括杯子在桌面上的位置、周圍物體關(guān)系、抓取意圖乃至從視覺數(shù)據(jù)中推理出的接觸狀態(tài)。
數(shù)據(jù)編譯的本質(zhì),是讓原始數(shù)據(jù)產(chǎn)生出原本無法直接表達(dá)的語義與物理交互信息。
編譯完成后,數(shù)據(jù)進(jìn)入第四個環(huán)節(jié)——檢索。這是影響數(shù)據(jù)交付效率的關(guān)鍵環(huán)節(jié)。
從全國甚至全球采集數(shù)據(jù),涵蓋數(shù)千上萬種場景和操作對象,組合之后的數(shù)據(jù)種類是這個數(shù)字的無數(shù)倍。面對這樣的數(shù)據(jù)海洋,模型公司需要從中精準(zhǔn)挑選出特定場景、特定物體、特定技能的數(shù)據(jù)包,用于模型訓(xùn)練任務(wù)。這不僅是具身智能問題,也是一個復(fù)雜的大數(shù)據(jù)工程問題。
智域基石通過自研的查詢引擎,用類似SQL的方式,每一份數(shù)據(jù)都帶著豐富的元數(shù)據(jù)和語義標(biāo)簽,讓客戶能夠從海量數(shù)據(jù)中高效定位所需素材。
最后一個環(huán)節(jié)是交付。檢索與組配完成后,系統(tǒng)會將提取出的結(jié)構(gòu)化片段自動打包為帶版本號(如 v2.4.0)的標(biāo)準(zhǔn)化訓(xùn)練數(shù)據(jù)集,實現(xiàn)開箱即用。
面對單次交付動輒數(shù)百TB的超大規(guī)模數(shù)據(jù)體量,智域基石還構(gòu)建了一套彈性交付體系:既支持兼容S3等云原生協(xié)議的專線直連與授權(quán)調(diào)用,也能針對極高安全等級的場景,采用高吞吐的物理陣列(硬盤)進(jìn)行線下流轉(zhuǎn)。
這種雙軌并行的資產(chǎn)分發(fā)模式,徹底打通了從數(shù)據(jù)精煉廠到客戶算力集群之間的“最后一公里”。
這條管線的核心能力也備受投資人認(rèn)可。穹徹智能曾評價道,智域基石的價值不只是補充數(shù)據(jù)供給,更在于“能夠把分散的場景需求沉淀為可標(biāo)準(zhǔn)化、可加工、可持續(xù)復(fù)用的數(shù)據(jù)資產(chǎn)”。靈初智能同樣看重其“將雜亂數(shù)據(jù)自動化編譯成能直接提升任務(wù)成功率的高質(zhì)量訓(xùn)練輸入”的能力。
拆解智域基石的數(shù)據(jù)編譯管線后,「甲子光年」發(fā)現(xiàn),數(shù)據(jù)編譯帶來的商業(yè)想象力,不止在于數(shù)據(jù)交易的一錘子買賣,其本質(zhì)是向模型或本體公司提供一種可持續(xù)迭代的“數(shù)據(jù)服務(wù)”。其中,涵蓋三個極具張力的增長飛輪:
首先是技術(shù)重構(gòu)帶來的復(fù)利效應(yīng)。 編譯管線每成熟一分,處理新數(shù)據(jù)的邊際成本便遞減一分,這是一條典型的知識與技術(shù)復(fù)利曲線。
其次是搶占定義具身智能數(shù)據(jù)標(biāo)準(zhǔn)的先機(jī)。 當(dāng)模型廠商的訓(xùn)練代碼開始依賴于特定的數(shù)據(jù)格式與接口規(guī)范,遷移的成本將不僅是金錢,更是時間與工程重構(gòu)的隱性代價。
最后則是更長期的生態(tài)價值。 一旦成為具身智能領(lǐng)域事實上的“數(shù)據(jù)格式定義者”,平臺將真正成為連接上游物理世界與下游數(shù)字智能的必經(jīng)閥門,其粘性將隨生態(tài)繁榮呈指數(shù)級躍升。
從這個意義上說,智域基石這套數(shù)據(jù)編譯管線已經(jīng)具備了“具身智能數(shù)據(jù)新基建”的初級形態(tài)。而真正讓它從“形態(tài)”走向“實質(zhì)”的,是能否在真金白銀的商業(yè)訂單中跑通閉環(huán)。
至少在這一點上,成立僅四個月的智域基石已經(jīng)交出了第一份答卷。
4.從工業(yè)場景切入,搶占數(shù)據(jù)入口
目前,智域基石成立僅4個月,但到手訂單已達(dá)近億元規(guī)模。
其中,天使輪的四家產(chǎn)業(yè)股東貢獻(xiàn)了首批需求。但楊哲軒強(qiáng)調(diào),公司客戶來源不止于此,目前正在推進(jìn)與更多模型廠商或場景方的合作。楊哲軒坦誠地說,“作為一家數(shù)據(jù)公司,從一開始就有客戶,是非常重要的。”
因為數(shù)據(jù)本身不是產(chǎn)品,只有在真實的模型訓(xùn)練任務(wù)中被驗證為“有效輸入”之后,它才能真正釋放價值。 一家沒有客戶錨點的數(shù)據(jù)公司,極易陷入“拿著錘子找釘子”的技術(shù)盲區(qū),采回來的數(shù)據(jù)不知為誰所用,也不知是否符合最新的算法需求,最終淪為數(shù)據(jù)廢料。
而智域基石將客戶需求前置到公司搭建數(shù)據(jù)管線的過程中,股東中的四家具身智能企業(yè)既是出資方,也是需求定義方。這意味著,智域基石的數(shù)據(jù)編譯管線從設(shè)計之初就在真實的模型訓(xùn)練任務(wù)中打磨,并非閉門造車。
在落地場景方面,智域基石選擇從工業(yè)場景切入。
在楊哲軒看來,工業(yè)場景的邊界清晰、任務(wù)結(jié)構(gòu)化、容錯空間明確,更適配具身智能當(dāng)前的技術(shù)成熟度曲線。
對于公司的發(fā)展路徑,智域基石規(guī)劃了清晰的三個階段。
第一階段是2026-2027年,核心任務(wù)是搶占數(shù)據(jù)入口。 具體策略是通過為頭部客戶提供定制化的結(jié)構(gòu)化訓(xùn)練輸入,建立市場口碑和信任關(guān)系。這個階段的關(guān)鍵指標(biāo)是場景覆蓋度和數(shù)據(jù)質(zhì)量,在真實客戶需求中打磨管線,建立標(biāo)準(zhǔn)化的數(shù)據(jù)處理流程。
第二階段是2027-2029年,目標(biāo)是標(biāo)準(zhǔn)化資產(chǎn)訂閱。 當(dāng)編譯管線足夠成熟之后,數(shù)據(jù)的組織方式、元數(shù)據(jù)格式、索引結(jié)構(gòu)都可以標(biāo)準(zhǔn)化。客戶不再需要定制化開發(fā),而是可以選擇訂閱特定類型的標(biāo)準(zhǔn)化數(shù)據(jù)資產(chǎn)。
這個階段也是整個商業(yè)路徑中最難的一步。因為它要求數(shù)據(jù)處理能力足夠成熟,能夠在算法路線快速變化的具身智能行業(yè)中保持穩(wěn)定輸出。
第三階段是2029年之后,目標(biāo)是開放API和開發(fā)者生態(tài)。 屆時,智域基石的數(shù)據(jù)編譯能力可能以API的形式對外輸出,第三方開發(fā)者可以在平臺上構(gòu)建自己的數(shù)據(jù)處理工具和應(yīng)用。
這條清晰的路線圖,是智域基石對自身未來的規(guī)劃。但通往終點的賽道,從來不會只有一位參賽者。
「甲子光年」梳理發(fā)現(xiàn),當(dāng)前具身智能數(shù)據(jù)賽道上至少已擠入四類玩家:
本體公司自建數(shù)采團(tuán)隊(如智元、宇樹),優(yōu)勢是離場景近,劣勢是缺乏規(guī)模效應(yīng)與跨本體通用性;互聯(lián)網(wǎng)大廠入局(如京東),挑戰(zhàn)在于大廠的組織架構(gòu)能否適應(yīng)數(shù)據(jù)精細(xì)化運營的“臟活累活”;傳統(tǒng)數(shù)據(jù)標(biāo)注公司轉(zhuǎn)型,有人力管理經(jīng)驗但缺乏機(jī)器人領(lǐng)域的垂直認(rèn)知;以及與智域基石正面交鋒的同類數(shù)據(jù)創(chuàng)業(yè)公司。
對于越發(fā)擁擠的賽道,楊哲軒的態(tài)度出奇平靜。他希望行業(yè)不要過早關(guān)注競爭。“我們更關(guān)注怎么幫助具身智能進(jìn)入工業(yè)場景,怎么讓增量資金進(jìn)入行業(yè)。競爭是之后的事情。”他說。
在決定投資智域基石之前,小苗朗程內(nèi)部對具身智能數(shù)據(jù)賽道有過一次全面評估。小苗朗程發(fā)現(xiàn),當(dāng)前國內(nèi)約有一百家具身智能企業(yè)、大廠和產(chǎn)業(yè)方在自研硬件、嘗試采集數(shù)據(jù),整個產(chǎn)業(yè)在重復(fù)造輪子,效率低下。本質(zhì)是缺乏第三方能提供跨本體、跨各類模型需求的高質(zhì)量數(shù)據(jù),智域基石是業(yè)內(nèi)少有的既具備技術(shù)能力、商業(yè)前瞻性、又有清晰階段性落地思考的團(tuán)隊。
而浙江人形認(rèn)為:“智域基石最突出的價值,在于其復(fù)合型團(tuán)隊能夠真正深入工業(yè)現(xiàn)場,打通數(shù)據(jù)入口、加工處理到終端場景驗證的完整鏈路。這種面向工業(yè)落地的系統(tǒng)能力,能夠與浙江人形形成高效協(xié)同,共同推動人形機(jī)器人在真實場景中的訓(xùn)練與落地。”
談及公司的核心壁壘,楊哲軒短暫思索后,給出了兩個答案:
“一是品味。我們?nèi)珕T都配備頂級AI Coding Agent的研發(fā)人員,連行政都要求有AI Native的工作習(xí)慣。我們積極擁抱領(lǐng)先的工具,并把它轉(zhuǎn)化為日常工作的一部分。二是團(tuán)隊,一個尊重事實、敢于自我批判和迭代的團(tuán)隊。我們不強(qiáng)求一開始就正確,但要求能夠快速發(fā)現(xiàn)問題、修正方向。”
事實上,這也是「甲子光年」在這家成立僅數(shù)月的公司身上所看到的,一種在當(dāng)下具身領(lǐng)域十分稀缺的冷靜與務(wù)實。
他們描繪了一幅關(guān)于具身智能數(shù)據(jù)基礎(chǔ)設(shè)施的宏大愿景,站在具身數(shù)據(jù)這個全社會高度關(guān)注的風(fēng)口上,但具體到落地上,他們沒有夸張的融資PPT,也沒有激動人心的愿景宣言,創(chuàng)始團(tuán)隊似乎并不喜講述太多關(guān)于“未來”的故事,更希望聚焦當(dāng)下的每一步——打磨技術(shù)、 一步一個腳印地拿下訂單。
“講故事講到最后,如果沒有真正創(chuàng)造價值,行業(yè)也就沒了。”楊哲軒說。這或許正是智域基石的生存哲學(xué):在風(fēng)口上保持清醒,在噪聲中堅持做難而正確的事。
(封面圖來源:AI生成)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.