近日,LiberAI 宣布完成數(shù)億元 Pre-A 輪融資,由順為資本領(lǐng)投,凱輝基金、元禾原點(diǎn)、慕華科創(chuàng)等知名機(jī)構(gòu)跟投,老股東紅杉中國(guó)、真格基金持續(xù)追加。
今年 5 月,LiberAI 剛剛宣布了近 5 億的種子輪、天使輪和天使+輪融資,由真格基金、紅杉中國(guó)、美團(tuán)龍珠、順為資本等聯(lián)合押注。真格基金自 2025 年獨(dú)家投資種子輪后已連投三輪,一路陪伴至今。
從科研的角度看,在大語(yǔ)言模型后,世界模型是接棒的新潮流。它的核心目標(biāo),是讓 AI 能夠像人類一樣,構(gòu)建一個(gè)對(duì)外部物理環(huán)境進(jìn)行理解和模擬的模型——不只是看懂世界,而且能夠預(yù)判動(dòng)作會(huì)對(duì)世界產(chǎn)生怎樣的影響。OpenAI、谷歌和微軟等頂級(jí)科技公司,以及楊立昆和李飛飛等 AI 領(lǐng)域最具影響力的學(xué)者,都在把資源和注意力集中到這個(gè)方向上。
然而,同一個(gè)世界模型,各有各的理解。既然是在百家爭(zhēng)鳴的時(shí)代,短期內(nèi)就很難說(shuō)哪種技術(shù)路線最終能跑出來(lái)。也正因如此,00 后新銳英才也有機(jī)會(huì)和學(xué)界泰斗站在同一個(gè)起跑線上,掌握定義新技術(shù)和新趨勢(shì)的權(quán)力。
LiberAI 切入世界模型的角度是什么呢?
![]()
抽象一點(diǎn)來(lái)說(shuō),世界「應(yīng)該用什么形式來(lái)表示」,是當(dāng)下各方路線分歧的核心,由此催生了競(jìng)爭(zhēng)最激烈的幾大技術(shù)流派:
以 OpenAI 的 Sora 和谷歌的 Genie 為代表的視頻生成派,核心思路是用海量視頻數(shù)據(jù)訓(xùn)練模型;以李飛飛創(chuàng)立的 World Labs 為代表的 3D 空間智能派,是從 3D 空間出發(fā)構(gòu)建世界;以英偉達(dá)的 Isaac 和 Genesis 為代表的物理引擎派,則把規(guī)律和數(shù)據(jù)寫進(jìn)代碼;以楊立昆為代表的隱空間預(yù)測(cè)(JEPA)派,不具象地畫世界,轉(zhuǎn)而在隱空間里直接預(yù)測(cè)世界狀態(tài)的變化;以英偉達(dá) GEAR 的 DreamZero 為代表的世界動(dòng)作模型(WAM)派,則在預(yù)測(cè)世界的同時(shí),同步輸出動(dòng)作。
在強(qiáng)化學(xué)習(xí)、物理引擎等各種技術(shù)路線中,LiberAI 選擇重注預(yù)訓(xùn)練。
從 GPT-3 到今天,大語(yǔ)言模型、視頻模型,還是自動(dòng)駕駛,底層邏輯都是預(yù)訓(xùn)練,從數(shù)據(jù)中挖掘智能。從本質(zhì)上說(shuō),預(yù)訓(xùn)練是給 AGI 打地基,只有在此基礎(chǔ)上,才能通過(guò)后訓(xùn)練等方法塑造各種能力。在創(chuàng)始人劉松銘看來(lái),「當(dāng)前階段做預(yù)訓(xùn)練是第一性正確的事情。」
劉松銘,00 后清華特獎(jiǎng)得主,Al for Physics 背景,師從視頻生成領(lǐng)域的大牛朱軍,并在 2024 年博士階段轉(zhuǎn)向具身研究,兼具物理、具身和視頻基礎(chǔ)。
他曾主導(dǎo)發(fā)布全球首個(gè)使用大規(guī)模預(yù)訓(xùn)練 + 擴(kuò)散 Transformer 范式的基座模型 RDT-1B,比硅谷公司的 PI-0 模型早一個(gè)月。次年,他又先于 Generalist 的 GEN-0 模型一個(gè)月,發(fā)布首個(gè)使用大規(guī)模 UMI 無(wú)本體人類數(shù)據(jù)預(yù)訓(xùn)練范式的具身模型 RDT-2。
2025 年底,他決定創(chuàng)業(yè)。4 個(gè)月后,LiberAI 發(fā)布了一款高自由度靈巧操作具身基礎(chǔ)模型。
之所以給公司起名叫 LiberAI,是因?yàn)樵谒磥?lái),擁有做選擇的自由是人生意義的重要組成部分。而機(jī)器人,正是他設(shè)想中幫助人們從繁重工作中解放出來(lái),獲得更多選擇自由的關(guān)鍵一環(huán)。
以下為訪談全文。
![]()
信仰被摧毀又建立
Q:美團(tuán)和順為都有投你,你有見過(guò)他們的老大嗎?
劉松銘:都見過(guò)。王興總是線下,雷總是線上。
Q:還挺好奇,你們都聊什么了?
劉松銘:我個(gè)人的感覺(jué)是,兩個(gè)人聊天的風(fēng)格差別挺大。
我印象里,和王興總交流時(shí),全程聊的基本都是細(xì)節(jié),能看出來(lái)他對(duì)業(yè)務(wù)鉆研很深,會(huì)具體落地到一件事該怎么做、會(huì)遇到哪些工程層面的難題、同行競(jìng)品都落地了哪些方案。
但和雷總溝通的風(fēng)格完全不一樣。雷總聊天更偏向軟性素養(yǎng)層面,提問(wèn)也大多是偏軟性的。我印象很深,他總愛(ài)問(wèn)一些凝練總結(jié)類的問(wèn)題,比如:能不能用三句話描述你的創(chuàng)業(yè)感受?創(chuàng)始人最重要的核心素質(zhì)是什么?
Q:雷總當(dāng)時(shí)問(wèn)你創(chuàng)業(yè)感受,你是怎么回答的?
劉松銘:第一點(diǎn),熱情是撐過(guò)漫漫雪夜的明燈。
這是我內(nèi)心很真實(shí)的感受。創(chuàng)業(yè)特別像在刺骨的雪夜里行走。你要不停地走,去一個(gè)很遠(yuǎn)的地方;暴風(fēng)雪很大,每走一步都要耗費(fèi)很多能量,也看不清前面到底有什么。
你手里只有一盞煤油燈,靠近燈的地方是溫暖的。你會(huì)聚集一大群人跟你一起走,但大家手里都沒(méi)有燈,所有人都仰仗你手里的這盞燈獲得溫暖。所以這盞燈無(wú)論如何都不能滅。
這盞燈既是熱情——你對(duì)自己做的事情充分相信,對(duì)自己的 vision 有足夠強(qiáng)烈的熱情;也是意志力——你會(huì)非常堅(jiān)定地把這件事做下去。哪怕到了最艱難的時(shí)刻,哪怕你自己心里也沒(méi)底,你也要不斷給團(tuán)隊(duì)信心。所以創(chuàng)業(yè)其實(shí)挺反人類的。
第二個(gè)感受,創(chuàng)業(yè)是信仰被摧毀又建立的過(guò)程。
一開始,你會(huì)非常相信自己做的事情。但很快,一些事實(shí)會(huì)告訴你,這個(gè)東西可能是錯(cuò)的。你必須快速摧毀原來(lái)的信仰,再建立一個(gè)新的信仰。
在不斷摧毀和不斷重建信仰的過(guò)程中,人很容易產(chǎn)生一種兩面性:一方面,你必須非常堅(jiān)定,相信自己想做的事情是對(duì)的;另一方面,你又要保持一定的懷疑,意識(shí)到這件事也有可能確實(shí)不對(duì)。
當(dāng)真正有一些跡象出現(xiàn)的時(shí)候,絕不能沉浸在幻想里。試錯(cuò)之后要快速調(diào)整,去做下一個(gè)對(duì)的事情。你必須比你的對(duì)手調(diào)整得更快。
最后一個(gè)感受,想要在這個(gè)游戲里面取勝,離不開快、準(zhǔn)、狠。
首先是要專注。創(chuàng)業(yè)公司和大公司不一樣,資源是有限的,對(duì)創(chuàng)始人的要求會(huì)很高。特別是做技術(shù),你對(duì)技術(shù)的判斷要盡可能準(zhǔn),要專注地去做一件事。這樣你才有足夠的資源在單點(diǎn)投入上壓倒對(duì)手。
其次是要極致。專注做一件事,還要把它做到極致。你要比別人想得更多、更進(jìn)一步,才有可能在競(jìng)爭(zhēng)中獲得優(yōu)勢(shì)。別人只做到 80%,你有能力做到 180%,這可能就是碾壓式的優(yōu)勢(shì)。如果每一個(gè)環(huán)節(jié)都只是和對(duì)手做得差不多,其實(shí)沒(méi)有太大意義。
最后是快。速度是創(chuàng)業(yè)公司的生命。但快的前提,是你要把這件事想清楚。很多時(shí)候不夠快,不是因?yàn)榇蠹野疽拱镜貌粔蚨啵且驗(yàn)閯?chuàng)始人自己沒(méi)有想清楚,自己在搖擺。
把事情想得足夠清楚,能提前算出一些可能的風(fēng)險(xiǎn),對(duì)快來(lái)說(shuō)非常重要。
![]()
預(yù)訓(xùn)練是當(dāng)前最第一性的事情
Q:現(xiàn)在世界模型還處于百家爭(zhēng)鳴的階段,你也在這個(gè)跑道上,你是怎么理解世界模型的?
劉松銘:在我們的視角里,世界模型最核心、最有價(jià)值的點(diǎn),是它在嘗試建模物理因果。
以往的視頻模型,幾乎沒(méi)有因果建模的能力。視頻本質(zhì)上只是建模相鄰幀之間的狀態(tài)轉(zhuǎn)移關(guān)系。
舉個(gè)例子,前一幀畫面是你伸手準(zhǔn)備抓水杯,后一幀畫面是你把水杯抓起來(lái)。但「伸手」這個(gè)動(dòng)作,并不代表一定能抓起水杯。能不能抓起來(lái),核心是你對(duì)杯子施加了力,是物理作用力導(dǎo)致了結(jié)果的發(fā)生。
視頻模型捕捉不到這層邏輯。但世界模型不一樣,它會(huì)把物理模態(tài)納入考量,建立因果層面的推理邏輯,「強(qiáng)迫」模型基于物理 action 推導(dǎo)世界 state 的轉(zhuǎn)移。
從「刻舟求劍」到「知其所以然」,這是學(xué)習(xí)范式上的一個(gè)革命。
Q:聽下來(lái)很有「第一性原理」的意思。
劉松銘:對(duì),因果性比相關(guān)性更好泛化。對(duì)于 VLA 來(lái)說(shuō),vision 一旦變了就很難泛化。而世界模型記住的是 state 和 action 之間的因果關(guān)系,這個(gè)關(guān)系是普適的。
Q:你們打算怎么實(shí)現(xiàn)這種能力?
劉松銘:我們認(rèn)為,預(yù)訓(xùn)練是當(dāng)前階段最第一性的事情。
從 2023 年到今天,大模型成立的本質(zhì)就是預(yù)訓(xùn)練。沒(méi)有一個(gè)好的預(yù)訓(xùn)練基礎(chǔ)模型,再怎么做微調(diào)和 RL 都是 overfit。
所以我們整個(gè)團(tuán)隊(duì)都是圍繞預(yù)訓(xùn)練去構(gòu)建的。我們兩位創(chuàng)始人都是具身領(lǐng)域預(yù)訓(xùn)練的專家,模型團(tuán)隊(duì)吸納了許多大模型預(yù)訓(xùn)練人才,數(shù)據(jù) Infra 的團(tuán)隊(duì)有很強(qiáng)的工程背景。
現(xiàn)在,預(yù)訓(xùn)練的攔路虎是物理數(shù)據(jù)稀缺。如果直接和純視頻混訓(xùn),很容易導(dǎo)致模態(tài)不均衡的問(wèn)題,視頻會(huì)淹沒(méi)稀缺的物理信號(hào)。
我們的解法是對(duì)齊:在數(shù)據(jù)多、泛化性強(qiáng)的視頻空間和數(shù)據(jù)少的物理空間之間建立橋梁,用視頻模態(tài)的泛化性去增強(qiáng)物理的泛化性。
這是一個(gè)「四兩撥千斤」的效果,十分之一的數(shù)據(jù)能有一百倍的泛化性。
![]()
創(chuàng)業(yè)的人生是很酷的
Q:聊聊你自己的情況。你的家庭背景是怎樣的?過(guò)往有哪些事情把你導(dǎo)向現(xiàn)在創(chuàng)業(yè)這條路?
劉松銘:我是 2000 年出生。
小時(shí)候,我父親剛好在早期創(chuàng)業(yè)。他特別忙,每次見到他的時(shí)候,身邊都會(huì)圍著很多同事,或是在應(yīng)酬。我時(shí)常能感受到創(chuàng)業(yè)給這個(gè)家庭帶來(lái)的壓力,也經(jīng)常聽到父母在討論怎么處理各種危機(jī)。
但這件事對(duì)我的正面影響也很多。
第一,小孩子下意識(shí)都會(huì)模仿父母。從小我就覺(jué)得,父親這樣的人生特別酷,扛著壓力打拼的生活才有意思。
第二,我能感覺(jué)到他很喜歡自己的工作。雖然壓力特別大,但自己能掌控一攤事,并且不斷看到進(jìn)展,這種感覺(jué)是會(huì)上癮的。
后來(lái)我在思考自己的人生選擇時(shí),時(shí)常會(huì)「靈魂出竅」。我好像在玩一個(gè)游戲,操控著一個(gè)叫劉松銘的角色。這個(gè)視角特別有意思,它會(huì)讓你不那么執(zhí)著于結(jié)果得失,讓你更享受過(guò)程本身,也會(huì)更容易去選擇一些大膽的事情。
這些選擇背后可能是一段更精彩、更好玩的人生。玩游戲不就是為了「節(jié)目效果」嗎?
![]()
找到下一個(gè) GPT 時(shí)刻
Q:你是通過(guò)化學(xué)競(jìng)賽進(jìn)的清華,本科時(shí)做 AI for physics,PhD 階段轉(zhuǎn)到具身,每一步選擇都是怎么做出來(lái)的?
劉松銘:如果我相信這個(gè)事情可以 work,我就真的會(huì)愿意冒風(fēng)險(xiǎn)去試。
Q:你當(dāng)時(shí)是怎么決定從 AI for physics 轉(zhuǎn)向 robotics 的方向,是因?yàn)楫?dāng)時(shí)風(fēng)口起來(lái)了嗎?
劉松銘:那個(gè)時(shí)候的絕對(duì)熱點(diǎn)是 GPT 出圈。我當(dāng)時(shí)就在想,我要?jiǎng)?chuàng)業(yè),我要找下一個(gè) GPT 時(shí)刻,我找的下一個(gè)時(shí)刻會(huì)在什么樣的領(lǐng)域。
AI for physics 可能更遠(yuǎn)一些,因?yàn)樗臄?shù)據(jù)沒(méi)有那么好獲取。另一個(gè)方向是視頻,視頻的數(shù)據(jù)很多,也已經(jīng)有人做了一段時(shí)間,但我覺(jué)得這不是屬于我的 timing。
機(jī)器人這個(gè)方向剛剛好,它的數(shù)據(jù)還不多,但有增長(zhǎng)的潛力;它沒(méi)有那么晚,我還有機(jī)會(huì)可以去做。我從小就對(duì)機(jī)器人這個(gè)概念很感興趣。
Q:你一方面有創(chuàng)業(yè)者的基因,另一方面學(xué)術(shù)上也很強(qiáng),這兩方面能力同時(shí)在一個(gè)年輕人身上具備很難得。
劉松銘:某種程度上有一些巧合,但另一方面,這也是我規(guī)劃的結(jié)果。
清華特別好的一點(diǎn)是創(chuàng)業(yè)氛圍非常濃厚。我本科參加過(guò)清華創(chuàng)協(xié)、啟創(chuàng)計(jì)劃,也跟很多優(yōu)秀的前輩交流過(guò)。那時(shí)我就已經(jīng)有一些判斷:時(shí)代的重點(diǎn)會(huì)從傳統(tǒng)商業(yè)逐步走向硬科技,而清華剛好又是一個(gè)很硬科技的地方。
所以我當(dāng)時(shí)的計(jì)劃就是,我要?jiǎng)?chuàng)業(yè),要去做硬科技。
Q:做研究和創(chuàng)業(yè)這兩件事,在你人生中的比例大概是什么樣?
劉松銘:如果讓我排一個(gè)序,我覺(jué)得創(chuàng)業(yè)是更主要的。我首先是一個(gè)商人,其次才是科學(xué)家。我的終極目標(biāo)是商業(yè)成功和市場(chǎng)擴(kuò)張。
![]()
真誠(chéng)才是必殺技
Q:你在學(xué)術(shù)方面拿下了非常多的成就,你覺(jué)得自己在這方面有天分嗎?
劉松銘:我不覺(jué)得自己在學(xué)術(shù)上特別有天分。
雖然我的工作影響力比較大,但其實(shí)我不是那種特別擅長(zhǎng)寫文章,做很漂亮的論文,然后拿去評(píng)獎(jiǎng)的人。
如果要?dú)w納一下我為什么能產(chǎn)生一些影響力,我覺(jué)得真誠(chéng)才是必殺技。人是會(huì)有共鳴的。實(shí)話說(shuō),我做的工作本身不一定有多新、多精巧,也沒(méi)法靠一個(gè)巧妙的公式成立。
但我一直在做的是具身的「主線任務(wù)」——探索并推動(dòng) Scaling Law。這個(gè)方向本身是能引起大家廣泛共鳴的。
Q:這跟你們清華務(wù)實(shí)的精神有關(guān)嗎?
劉松銘:我覺(jué)得挺有關(guān)的。也有點(diǎn)哲學(xué)的感覺(jué),有時(shí)候無(wú)心插柳,反倒容易柳成蔭。
Q:你在轉(zhuǎn)向具身方向之后,研究過(guò)的一個(gè)具體問(wèn)題是什么?
劉松銘:可以講 RDT2。
當(dāng)時(shí)大家面臨的問(wèn)題就是沒(méi)有數(shù)據(jù)。那時(shí)候很多人用的是遙操數(shù)據(jù),但遙操的問(wèn)題在于成本很高。
我們的方案就是 scale up 無(wú)本體的 UMI 夾爪數(shù)據(jù)。我們不再需要一個(gè)機(jī)器人。人類自己戴著夾爪就能到處去采數(shù)據(jù),效率自然就高了。
這個(gè)想法非常簡(jiǎn)單直接。真正的難點(diǎn)在于它很麻煩、很 dirty,你要做大量工程才能把這個(gè)想法變成現(xiàn)實(shí)。
Q:是哪一年開始做的?花了多長(zhǎng)時(shí)間?
劉松銘:我們是 2024 年底開始做,2025 年發(fā)布的工作,前后一共做了一年。這個(gè)周期特別長(zhǎng)。一般來(lái)說(shuō),厲害的同學(xué)幾個(gè)月就可以做一篇文章,但我兩年時(shí)間只做了兩篇文章。所以如果從 ROI 的角度來(lái)看,這并不是一個(gè)特別劃算的選擇。
![]()
以自由命名公司
Q:公司叫 LiberAI,是因?yàn)槟阌X(jué)得自由這件事很重要嗎?
劉松銘:對(duì),我覺(jué)得自由非常重要。
Q:自由重要到什么地步,你需要把它用作公司名字?
劉松銘:人生最終的結(jié)局都是注定的,所以過(guò)程非常重要,而過(guò)程里自主選擇的權(quán)利就成了本質(zhì)。
那是什么阻礙了我們自由選擇?除了金錢之外,就是我們有太多瑣碎的事情要做。
但現(xiàn)實(shí)世界有它的客觀規(guī)律,世上的勞作不會(huì)憑空消失。那些沒(méi)人愿意做的臟活、累活,總要有人承接。從整個(gè)社會(huì)的視角來(lái)看,一部分人能夠清閑自由、隨心生活,就必然意味著另一部分人被瑣事束縛,失去自由。
所以我一直在思考,有沒(méi)有辦法讓全人類都擁有自由,讓每個(gè)人都能支配自己的時(shí)間,選擇真正想做的事。從第一性原理去推導(dǎo),幾乎只有一個(gè)解決方案:創(chuàng)造一種新的載體,替人類承接這些繁雜的工作。
這個(gè)事物就是機(jī)器人。
Q:但很多人工作的初衷只是謀生,不是為了享受樂(lè)趣。如果機(jī)器人取代了他們賴以為生的工作怎么辦?
劉松銘:早年人力車夫靠拉車謀生,汽車普及之后,人力車夫這個(gè)職業(yè)慢慢消失了,但社會(huì)整體的就業(yè)崗位并沒(méi)有因此減少。
生產(chǎn)力進(jìn)步的過(guò)程中一定會(huì)源源不斷誕生新的崗位。
行業(yè)更迭當(dāng)然會(huì)帶來(lái)短期陣痛,但長(zhǎng)遠(yuǎn)來(lái)看,從業(yè)者最終會(huì)轉(zhuǎn)向條件更好的工作。同理,未來(lái)如果瑣碎繁雜的工作交由機(jī)器人承接,社會(huì)對(duì)體力勞動(dòng)的需求會(huì)越來(lái)越少,但人類也會(huì)不斷催生新的需求,社會(huì)結(jié)構(gòu)也會(huì)隨之轉(zhuǎn)變。
Q:大家現(xiàn)在會(huì)說(shuō),人類所剩無(wú)幾的優(yōu)勢(shì)可能就是這副并不完美的肉身,是人類的具身性,因?yàn)槟X力工作反而更容易被 AI 取代。但如果世界模型和物理 AI 大規(guī)模應(yīng)用,是不是意味著人類連這點(diǎn)所剩無(wú)幾的優(yōu)勢(shì)也不存在了?
劉松銘:人的存在不是為了工作。反過(guò)來(lái),工作的目的是為了讓人更好地存在。
如果 AI 能取代人的所有工作,那人就都不工作好了,沒(méi)有必要比個(gè)高低。我的觀點(diǎn)是,人的存在本身就是意義。
人活著,去選擇自己想要的事情,決定如何過(guò)完自己的一生,嘗試各種新奇的體驗(yàn),這就是價(jià)值所在。
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.