亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

對(duì)話原力靈機(jī)唐文斌:純“世界模型”路線走不通

0
分享至


作者 | 鄭敏芳 編輯 | 松壑

一場(chǎng)關(guān)于具身智能的“數(shù)據(jù)暗戰(zhàn)”正在悄然打響。

今年 1 月,湖北人形機(jī)器人創(chuàng)新中心向智元機(jī)器人交付了數(shù)千小時(shí)的訓(xùn)練數(shù)據(jù),完成了國(guó)內(nèi)首例定制化人形機(jī)器人數(shù)據(jù)交易。

行業(yè)巨頭方面,京東日前喊出了建成全球規(guī)模最大、場(chǎng)景最全的具身智能數(shù)據(jù)采集中心的口號(hào),計(jì)劃動(dòng)員超10萬內(nèi)部員工及最多50萬外部人員,開啟一場(chǎng)史無前例的“人海戰(zhàn)術(shù)”。

視線轉(zhuǎn)向海外,韓國(guó)機(jī)器人公司 Robotis 于今年 1 月在烏茲別克斯坦設(shè)立子公司,計(jì)劃在一塊 11 萬平方米的土地上建起一座巨大的“數(shù)據(jù)工廠”,用于收集機(jī)器人行為數(shù)據(jù)。

按小時(shí)計(jì)費(fèi)的定制化交易、數(shù)十萬人的大動(dòng)員、遠(yuǎn)赴中亞建廠,這一系列舉措都折射出整個(gè)具身智能行業(yè)沉重的“數(shù)據(jù)焦慮”。

與在互聯(lián)網(wǎng)語料中成長(zhǎng)的大語言模型不同,具身智能需要理解世界并與真實(shí)世界進(jìn)行交互,這對(duì)數(shù)據(jù)的真實(shí)性、模態(tài)等都提出了更高的要求。

這也是原力靈機(jī)創(chuàng)始人兼CEO唐文斌當(dāng)下正在攻堅(jiān)的難題之一。

回溯履歷,唐文斌更為人熟知的身份是上一波AI浪潮中明星獨(dú)角獸曠視科技的聯(lián)合創(chuàng)始人兼CTO。

成立僅一年的原力靈機(jī)已經(jīng)悄然吸金超10億元,拿下了阿里、蔚來、君聯(lián)、啟明等頭部機(jī)構(gòu)的投資。

目前原力靈機(jī)已發(fā)布旗下首個(gè)具身原生大模型 DM0,并與華勤技術(shù)達(dá)成戰(zhàn)略合作,實(shí)現(xiàn)數(shù)據(jù)采集機(jī)器人 DOS?W1 的量產(chǎn)交付。

在經(jīng)歷了上一波AI落地的洗禮后,唐文斌對(duì)行業(yè)有了更多的敬畏之心。

在日前與華爾街見聞·全天候科技的對(duì)話中,唐文斌分享了原力靈機(jī)的數(shù)據(jù)采集思路:不依賴單一來源,而是以“質(zhì)量?數(shù)量?多樣性”的組合方式實(shí)施分布式采集,以此填滿機(jī)器人的能力空間。

對(duì)于通過世界模型生成數(shù)據(jù),讓機(jī)器人能夠模仿學(xué)習(xí)的路線,唐文斌認(rèn)為這條路難以走通,他指出更為可行的范式是將世界模型與VLA(視覺-語言-動(dòng)作)模型相統(tǒng)一。即不僅能預(yù)測(cè)未來世界,還能據(jù)此反推出所需的精準(zhǔn)動(dòng)作。

當(dāng)行業(yè)玩家們正以各自的方式瘋狂“囤積”數(shù)據(jù)糧草時(shí),究竟哪種路線才能“笑到最后”,市場(chǎng)正在拭目以待。

以下是對(duì)話實(shí)錄。

詳細(xì)數(shù)據(jù)采集

全天候科技:能否分享你們的數(shù)據(jù)采集思路?

唐文斌:目前我們還是模仿加強(qiáng)化學(xué)習(xí)的方式。

模仿涉及數(shù)據(jù)分布的模擬。我們的目標(biāo)是讓數(shù)據(jù)盡可能地填滿機(jī)器人的能力空間,見過足夠多的東西。核心在于識(shí)別未見過場(chǎng)景的處理能力,數(shù)據(jù)的價(jià)值便在于此,所以我們的數(shù)據(jù)采集是圍繞開放環(huán)境和實(shí)際場(chǎng)景展開。

但我們會(huì)希望數(shù)據(jù)保持高質(zhì)量的同時(shí),還能夠盡可能的填滿這個(gè)空間,所以我覺得數(shù)據(jù)是一個(gè)“質(zhì)量?數(shù)量?多樣性”的組合問題。

全天候科技:那數(shù)據(jù)如何進(jìn)行采集?

唐文斌:其實(shí)我們并不依賴某一種數(shù)據(jù)來源,這樣做也沒必要,基本上是一個(gè)組合模式。真機(jī)數(shù)據(jù)方面,主要通過各種經(jīng)過校準(zhǔn)的傳感器進(jìn)行采集,具體包括類似外骨骼等,但確實(shí)采集成本會(huì)比較高。

同時(shí),我們也會(huì)通過無本體和第一人稱視角收集數(shù)據(jù),形成更大規(guī)模的數(shù)據(jù)集,這其實(shí)就是介于真機(jī)和合成數(shù)據(jù)的中間派了。

除此之外,還有采集成本更低的互聯(lián)網(wǎng)數(shù)據(jù)。

全天候科技:能否具體解釋無本體采集?

唐文斌:無本體的意思就是說它可能是一個(gè)手套或手持夾爪,沒有機(jī)械臂、機(jī)器人的身體,所以相當(dāng)于就只是用了一個(gè)末端裝置。我記錄了這個(gè)末端裝置的大致位置和狀態(tài),目前這種數(shù)據(jù)采集方式也被稱為UMI。

今天,我們討論的第一人稱視角數(shù)據(jù)也很多,例如通過眼鏡拍攝操作過程,這也是一種無本體的采集方式。

全天候科技:每個(gè)人的AI眼鏡數(shù)據(jù)都具有隱私性,應(yīng)該沒有人愿意公開自己眼鏡的數(shù)據(jù)供采集。你們?cè)趺唇鉀Q這個(gè)問題?

唐文斌:確實(shí),如果我作為眼鏡的用戶,我也不想把我的數(shù)據(jù)分享給大家。但是訓(xùn)練的話,我們可以請(qǐng)一些第三方的數(shù)據(jù)采集員,通過日常佩戴眼鏡記錄工作流程,然后數(shù)據(jù)也會(huì)被記下來。

當(dāng)然,我們也希望眼鏡本身的功能可以更加強(qiáng)大,比如有立體視覺、多目的能力。同時(shí)我們未來可能還會(huì)增加手環(huán)、手套的裝置用于采集數(shù)據(jù)。

所以整體來看我們采集的對(duì)象是多樣化的。第一類是機(jī)器人本身,可以遙控操作;第二類是類似于夾爪等的無本體,即“人的身體+機(jī)器人末端”的裝置;第三類是完全針對(duì)人體的采集;第四類則是對(duì)物理世界的描述。

全天候科技:例如在末端傳感器中,主要采集的是力的數(shù)據(jù)嗎?

唐文斌 :不只是力度,我們還是希望數(shù)據(jù)是多模態(tài)的,比如包括增加視角。

實(shí)操方面,因?yàn)槭直劭赡軙?huì)遮擋部分?jǐn)?shù)據(jù),我們可以眼睛部位裝配一個(gè)相機(jī),兩個(gè)手腕上也可能各有兩個(gè)相機(jī),形成多視角的數(shù)據(jù)。

全天候科技:這種采集成本會(huì)很高嗎?

唐文斌:這其實(shí)就是一個(gè)數(shù)據(jù)質(zhì)量、數(shù)量和多樣性的復(fù)雜問題。如果需要采集所有模塊的數(shù)據(jù),成本將變得非常高昂。所以我們采用分布式的采集策略,有些數(shù)據(jù)我們會(huì)盡可能地保證其完整性,而有些數(shù)據(jù)為了降低成本、增加數(shù)量和提高速度,可能就不再那么注重完整性。

這是一個(gè)權(quán)衡的問題,我們擁有自己的采集工具,并且廣泛地與其他行業(yè)合作。

全天候科技:今年2月你們跟華勤技術(shù)合作推出了數(shù)據(jù)采集機(jī)器人,能否分享這款機(jī)器人的情況?

唐文斌:這款機(jī)器人主要是用在科研的場(chǎng)景,有點(diǎn)類似于ALOHA機(jī)器人的形態(tài),同行也有在做這個(gè)。(注:ALOHA代表"A Low-cost Open-source Hardware system for bimanual teleOperation",是一種用于雙手遠(yuǎn)程操作的低成本開源硬件系統(tǒng))

但是目前市場(chǎng)的數(shù)據(jù)采集機(jī)器人存在兩大痛點(diǎn),

一方面是可靠性,產(chǎn)品表現(xiàn)確實(shí)不盡如人意,例如頻繁故障會(huì)對(duì)科研工作產(chǎn)生負(fù)面影響,降低工作效率。

我們目前也無法確保產(chǎn)品的長(zhǎng)時(shí)間穩(wěn)定性,所以我們的改進(jìn)點(diǎn)是簡(jiǎn)化了修理過程,設(shè)計(jì)了模塊化可拆卸的產(chǎn)品結(jié)構(gòu)。一旦某個(gè)部件損壞,用戶可以快速更換。例如很多地方的連接處都不是螺絲,是那種旋鈕,所以可能30秒就能修好了;

另一方面是成本仍然比較高,所以我們通過與華勤的合作設(shè)計(jì)了一款類似ALOHA的產(chǎn)品,支持主從、拖拽式操作。最核心就是修得快,價(jià)格便宜。(注:主從是指人通過操控主臂,實(shí)現(xiàn)對(duì)從臂的實(shí)時(shí)遠(yuǎn)程控制,動(dòng)作零延遲復(fù)刻,以此實(shí)現(xiàn)實(shí)現(xiàn)低成本、高精度的雙臂精細(xì)操作數(shù)據(jù)的采集。)

全天候科技:同行買過這個(gè)機(jī)器人去采集數(shù)據(jù)嗎?

唐文斌 :是的,其實(shí)行業(yè)的痛點(diǎn)還是比較一致的,所以其實(shí)大家都會(huì)買同行的產(chǎn)品回去搭配一起使用。

世界模型路線走不通

全天候科技:能不能聊一聊對(duì)世界模型和VLA的看法?

唐文斌:這里要區(qū)分兩點(diǎn),就是理解世界和生成世界是不一樣的。

我們今天討論的大模型能力,大家普遍關(guān)注的是它們理解世界的能力。世界模型實(shí)際上是在嘗試預(yù)測(cè)未來,即預(yù)測(cè)下一幀可能會(huì)是什么樣子的,而VLA的實(shí)質(zhì)是與世界交互。

這些模型具有共通性,但又能夠從不同的角度解決問題。

我們覺得最佳的策略是相結(jié)合。只有這樣,我們才能真正理解并生成內(nèi)容,理解和與世界交互。

理論上來說,如果能夠預(yù)測(cè)未來世界,我們便能夠反向推斷出我們應(yīng)該如何操作。而如果我們知道如何操作,那說明我們是能夠預(yù)測(cè)未來的發(fā)展。

所以我們現(xiàn)在的技術(shù)框架里世界模型跟VLA是統(tǒng)一的,就是我們希望一個(gè)模型既能夠理解這個(gè)世界,同時(shí)又能預(yù)測(cè)后續(xù)。

如此一來,模型不僅能執(zhí)行動(dòng)作,還能預(yù)測(cè)執(zhí)行該動(dòng)作后世界將如何變化。

全天候科技 :行業(yè)的技術(shù)框架是否和你們不同?

唐文斌:確實(shí),目前一些公司主張僅使用世界模型。有觀點(diǎn)是認(rèn)為通過世界模型生成數(shù)據(jù),讓機(jī)器人能夠模仿學(xué)習(xí),這樣就產(chǎn)生了一個(gè)無限的數(shù)據(jù)源。

但我自己覺得這條路是走不通的,因?yàn)槿绻澜缒P鸵呀?jīng)實(shí)現(xiàn)了,那生成的問題就已經(jīng)解決了,大家也不需要通過生成的數(shù)據(jù)再去訓(xùn)練機(jī)器人了。

那另外一條路就是我們和很多同行會(huì)去做的,就是通過預(yù)測(cè)未來世界模型,然后根據(jù)這個(gè)模型反推出所需的動(dòng)作,這種方法涉及到先預(yù)測(cè)未來的場(chǎng)景或世界狀態(tài),再計(jì)算出相應(yīng)的動(dòng)作序列,這種范式其實(shí)就是我剛才講的相結(jié)合統(tǒng)一的模型框架。

全天候科技 :從場(chǎng)景上來說,由于當(dāng)前工廠的產(chǎn)線自動(dòng)化程度很高,機(jī)器人進(jìn)廠打工會(huì)不會(huì)沒有用武之地?

唐文斌 :確實(shí)當(dāng)前工廠的自動(dòng)化解決方案已經(jīng)相當(dāng)成熟。但我們想去解決的是原來解決不了的問題,或者是原來解決起來成本很高的問題。

但其實(shí)大家看到的很多自動(dòng)化產(chǎn)線對(duì)泛化性要求是沒有那么高的,即不需要對(duì)象、環(huán)境和任務(wù)的泛化。例如可能SKU就幾個(gè),光照等外部環(huán)境條件已經(jīng)過調(diào)節(jié)。

那當(dāng)前解決不了的問題其實(shí)是對(duì)象多樣化,環(huán)境也隨時(shí)在變化,甚至可能會(huì)有很多不同的任務(wù)。

以物流場(chǎng)景為例,現(xiàn)在大家的機(jī)器人做的主要是搬運(yùn)工作,但是沒有做好手上的操作,因?yàn)檫@對(duì)泛化性的要求很高。

例如你購買了一瓶可樂和一包薯片,操作員就會(huì)把可樂和薯片分別包裝好。由于商品種類繁多且環(huán)境條件不斷變化,這個(gè)其實(shí)就很難用自動(dòng)化設(shè)備解決。

還有包裝的場(chǎng)景,以瓶裝沐浴露為例,我們收到產(chǎn)品時(shí)會(huì)發(fā)現(xiàn)瓶口部纏一圈塑料膜,這是為了防止沐浴露泄露。

實(shí)際操作過程中,目前通常是操作人員基于經(jīng)驗(yàn),纏上保鮮膜再放入泡沫袋中,并在封口貼上標(biāo)簽,這就沒辦法通過自動(dòng)化設(shè)備來完成。

我們現(xiàn)在主要是在物流、工業(yè)上有做一些嘗試。

全天候科技:你們是傾向于在特定場(chǎng)景進(jìn)行集中開發(fā),還是想在多個(gè)場(chǎng)景同時(shí)鋪開?

唐文斌:這個(gè)要分兩頭講,觀察大模型的發(fā)展,尤其是當(dāng)前最新的進(jìn)展,可以發(fā)現(xiàn)一個(gè)共同的趨勢(shì)。如果我們現(xiàn)在只構(gòu)建了一個(gè)垂直領(lǐng)域的模型,它是無法達(dá)到真正有泛化能力的模型,這是行不通的。

因此,從模型的角度來看,我們必須堅(jiān)定地追求泛化性,追求更加通用的技術(shù)能力。

但從應(yīng)用場(chǎng)景落地的角度來看,我們確實(shí)得一個(gè)一個(gè)場(chǎng)景去落地,逐一實(shí)現(xiàn)。

所以我們內(nèi)部經(jīng)常強(qiáng)調(diào)產(chǎn)品落地有兩點(diǎn)核心,首先,我們的解決方案必須能夠形成閉環(huán),即解決客戶業(yè)務(wù)中的所有問題和異常情況,滿足所有流程需求。其次,我們需確保成本可控,讓客戶覺得合作劃算。

只有在滿足這兩個(gè)前提條件時(shí),客戶才可能考慮規(guī)模化應(yīng)用我們的產(chǎn)品。

所以我們每實(shí)施一個(gè)場(chǎng)景,都必須清晰地理解客戶價(jià)值,并確保這兩個(gè)要點(diǎn)都能得以實(shí)現(xiàn)。這是一個(gè)逐年下單的過程。

我們內(nèi)部把這個(gè)過程描述為模型發(fā)展與應(yīng)用落地之間的關(guān)系,它們之間存在45度夾角,即它們相關(guān)但并不絕對(duì)相關(guān)。

當(dāng)然,我們的模型需要朝著那個(gè)通用方向發(fā)展。

對(duì)場(chǎng)景要有敬畏之心

全天候科技 :所以你們是主張通用機(jī)器人的路線嗎?

唐文斌:我個(gè)人認(rèn)為模型具有通用性,但硬件很難實(shí)現(xiàn)。

其實(shí)我們的雙手非常靈活,一只可以執(zhí)行精細(xì)操作,同時(shí)也能舉起20斤的重物,甚至更厲害還能舉起50斤的重物。

但是受到物理學(xué)和材料學(xué)的限制,能夠舉起2公斤商品的機(jī)械臂和能舉起20公斤重物的機(jī)械臂肯定不同,因?yàn)樗鼈兊墓β拭芏炔煌?/p>

所以我們認(rèn)為如果你采用一個(gè)通用的設(shè)計(jì)并應(yīng)用到具體場(chǎng)景中,很容易發(fā)現(xiàn)這是欠設(shè)計(jì)或者過設(shè)計(jì)。

欠設(shè)計(jì)就是可能重量限制無法通過,或者是傳感器的安裝空間過于狹窄,導(dǎo)致無法解決問題;可能恰好能搞定,但這可能過度設(shè)計(jì)了,價(jià)格就會(huì)變得很高。

以輪式雙臂為例,當(dāng)重心較高時(shí),它跑得更快。但一旦速度起來,它就很難停下來,否則就會(huì)摔倒。

這時(shí)我們可能會(huì)發(fā)現(xiàn),在某些場(chǎng)景中,靜止不動(dòng)可能是一個(gè)更優(yōu)的選擇,讓移動(dòng)的車輛將物品送過來。

因此,可能在這些場(chǎng)合會(huì)存在過度設(shè)計(jì)的問題。

我們的內(nèi)部邏輯是讓模型具有通用性,并且能夠適應(yīng)不同的硬件平臺(tái)。

全天候科技 :所以現(xiàn)在投資人比較看重你們的能力是模型?

唐文斌:對(duì),我們團(tuán)隊(duì)的獨(dú)特之處在于不僅從事機(jī)器人場(chǎng)景的研發(fā),而且深入理解模型。我們?cè)跁缫暤奈锪黝I(lǐng)域積累了豐富的經(jīng)驗(yàn),并且具備一定的規(guī)模,因此對(duì)產(chǎn)品有較深的理解,同時(shí)我們擁有一群專注于模型優(yōu)化的專業(yè)人士。

全天候科技:因?yàn)楹芏嗫赡苣骋粋€(gè)行業(yè)內(nèi)的公司對(duì)于本行業(yè)的需求會(huì)比較了解,但你們是模型業(yè)務(wù)起家,會(huì)不會(huì)對(duì)場(chǎng)景需求的了解程度比較弱?

唐文斌:其實(shí)之前我們?cè)跁缫暤臅r(shí)候就做了很多的場(chǎng)景了,所以我覺得我們還算是一幫被教育過的人。

這其實(shí)是心態(tài)問題,其實(shí)機(jī)器人行業(yè)是需要兩撥人,一波人更懂技術(shù),一波人更懂場(chǎng)景,我們其實(shí)是站在中間的人。

其實(shí)光搞技術(shù)的人會(huì)對(duì)場(chǎng)景做很多的假設(shè),他覺得不就是這些。但真實(shí)場(chǎng)景中的魔鬼隱藏在細(xì)節(jié)之中。例如當(dāng)出現(xiàn)問題時(shí),生產(chǎn)流程不能停,因此必須有完善的異常處理流程。

因此,技術(shù)工作的人必須對(duì)場(chǎng)景懷有敬畏之心。

但行業(yè)的人也有很多問題,我們歷史上就是很多同事對(duì)技術(shù)上會(huì)有兩種狀態(tài),一開始覺得技術(shù)無所不能,一旦涉及到AI智能,他們就會(huì)期望你能解決所有問題。然而當(dāng)他們發(fā)現(xiàn)某些問題無法解決時(shí),就會(huì)感到極度失望,進(jìn)而選擇回歸到傳統(tǒng)的、基于規(guī)則的方法。

但今天模型的發(fā)展其實(shí)既不是能達(dá)到無所不能,也不是什么都不行,是在一個(gè)中間階段,并且斜率很高,處于快速發(fā)展?fàn)顟B(tài)。

所以我們非常需要能夠既對(duì)場(chǎng)景有判斷,理解算法及其發(fā)展速度的人。同時(shí),也需要有人來設(shè)計(jì)應(yīng)該如何著手解決當(dāng)前的問題,讓項(xiàng)目盡快啟動(dòng)。

我們今天所從事的所有工作實(shí)質(zhì)上都是在滿足需求。我們肯定會(huì)有自己視野上的局限。

所以我主張廣泛學(xué)習(xí)和多角度觀察,但我們也應(yīng)有自己判斷的標(biāo)準(zhǔn),選擇那些能夠持續(xù)生存下來的場(chǎng)景。

全天候科技:那你們?cè)趺炊ㄎ蛔约旱哪繕?biāo)客群呢?是機(jī)器人公司,還是場(chǎng)景應(yīng)用方?

唐文斌 :其實(shí)還是場(chǎng)景應(yīng)用方。

坦白說,無論是國(guó)內(nèi)還是國(guó)外的同行,大家所使用的模型都不太成熟。因此今天大家并沒有達(dá)到將模型直接部署到機(jī)器人公司的設(shè)備上,經(jīng)過簡(jiǎn)單訓(xùn)練后就能使用的狀態(tài)。

我認(rèn)為在模型尚未成熟的情況下,要實(shí)現(xiàn)場(chǎng)景落地應(yīng)用,垂直整合是必要的。

如果我們自身都搞不定這個(gè)場(chǎng)景,卻期望合作伙伴和客戶能夠解決,這無疑是美好的幻想。我相信有朝一日,我們可能自己做了一些垂直的場(chǎng)景,而可能更多的場(chǎng)景可以通過開放平臺(tái)的方式,與我們的合作伙伴一起完成。他們既可以用我們的硬件,也可以只用我們的大腦,去自主探索更多可能性。

全天候科技:所以這是你們對(duì)模型開源的原因,就是希望更多人能加入進(jìn)來?

唐文斌:開源有兩方面的考慮。首先我們希望更多人使用我們的框架和模型,這樣大家可以共同探索更多應(yīng)用場(chǎng)景并推動(dòng)技術(shù)的落地。其次,盡管當(dāng)前行業(yè)熱度很高,但整體模型的成熟度仍處于初級(jí)階段,促進(jìn)相互交流和進(jìn)步至關(guān)重要。

全天候科技:你之前提到2026年的核心目標(biāo)是每個(gè)場(chǎng)景部署1000臺(tái)可持續(xù)運(yùn)轉(zhuǎn)的設(shè)備,能否分享一下這個(gè)目標(biāo)完成的情況?

唐文斌:這可能要到下半年才能實(shí)現(xiàn)持續(xù)運(yùn)行。目前我們還在進(jìn)行POC測(cè)試。

我們對(duì)自有場(chǎng)景實(shí)現(xiàn)批量化的潛力還是很有信心的。

其實(shí)要讓機(jī)器人能夠持續(xù)運(yùn)行,必須找到容錯(cuò)環(huán)節(jié)。坦白說,當(dāng)前模型驅(qū)動(dòng)的方法還無法做到百分之百的準(zhǔn)確率。

如果任務(wù)失敗怎么辦?這個(gè)問題必須有答案。我們需要探討通過什么種方式接管任務(wù),讓失敗的任務(wù)能夠被恢復(fù)。同時(shí)我們還需評(píng)估這種失敗對(duì)企業(yè)的影響,判斷這種影響是否可接受。

在采取了兜底方案之后,我們還需要確認(rèn)整個(gè)系統(tǒng)的ROI。

全天候科技:說到ROI的話,那客戶會(huì)直接提出說你們可以幫助產(chǎn)線節(jié)約多少錢嗎?

唐文斌:客戶通常會(huì)直接問我們能多久回本。

如果一個(gè)項(xiàng)目需要超過五年才能回本,那就不用做了。

如果預(yù)計(jì)兩到三年內(nèi)就能回本,那就是立馬干。在當(dāng)前的B2B環(huán)境中,我們大多數(shù)決策都是基于理性的分析,算清到底能為客戶提升多少效率。比如機(jī)器人能夠延長(zhǎng)某些生產(chǎn)環(huán)節(jié)的運(yùn)作時(shí)間,更高效地利用現(xiàn)有設(shè)備,為客戶帶來價(jià)值。

全天候科技 :能否劇透后續(xù)的模型更新情況?

唐文斌:今年我們的核心議題將集中在泛化性上。

全天候科技:去年才創(chuàng)業(yè)來做具身智能的模型,你覺得會(huì)不會(huì)太晚了?

唐文斌:其實(shí)在很多年前我們就很想做一個(gè)通用機(jī)器人了,當(dāng)時(shí)我們覺得技術(shù)上不成熟。但是隨著DeepSeek等大模型的發(fā)展后,確實(shí)讓我對(duì)這件事變得更有信心了。

全天候科技:如果讓你給2026年具身智能行業(yè)1個(gè)關(guān)鍵詞,你覺得會(huì)是什么?

唐文斌:我想給2個(gè)關(guān)鍵詞,一是模型能力的提升,二是場(chǎng)景的持續(xù)運(yùn)行。

我認(rèn)為當(dāng)前的模型還處于早期階段,但發(fā)展速度很快,所以我們要努力提升模型的算法能力,包括在對(duì)象、環(huán)境適應(yīng)性和任務(wù)泛化性上都有所提升,模型的泛化能力是至關(guān)重要的。其次,關(guān)于場(chǎng)景的應(yīng)用,我認(rèn)為單純的POC沒太大意義,它只是一個(gè)起點(diǎn),重點(diǎn)在于如何在實(shí)際場(chǎng)景中持續(xù)運(yùn)行,今年確實(shí)已經(jīng)到時(shí)候了。

*本文為全天候科技原創(chuàng)作品,未經(jīng)授權(quán)不得轉(zhuǎn)載,如需轉(zhuǎn)載,請(qǐng)?jiān)诤笈_(tái)回復(fù)“轉(zhuǎn)載”二字,獲取轉(zhuǎn)載格式要求。



點(diǎn)“在看”,變好看哦。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
曼聯(lián)選帥反轉(zhuǎn)!世界最佳年輕主帥愿接手,比卡里克強(qiáng)太多

曼聯(lián)選帥反轉(zhuǎn)!世界最佳年輕主帥愿接手,比卡里克強(qiáng)太多

奶蓋熊本熊
2026-04-16 05:10:35
后續(xù)!孕婦200買水果被老公罵:已去醫(yī)院終止妊娠 老公發(fā)怒砸東西

后續(xù)!孕婦200買水果被老公罵:已去醫(yī)院終止妊娠 老公發(fā)怒砸東西

小鋭?dòng)性捳f
2026-04-14 08:37:44
烏鴉變鳳凰!千億市值*ST股摘星,周一復(fù)牌

烏鴉變鳳凰!千億市值*ST股摘星,周一復(fù)牌

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-04-16 20:58:07
突破封鎖失敗,伊朗10艘船被攔截,美軍已剝奪革命衛(wèi)隊(duì)海峽控制權(quán)

突破封鎖失敗,伊朗10艘船被攔截,美軍已剝奪革命衛(wèi)隊(duì)海峽控制權(quán)

虎哥閑聊
2026-04-16 09:33:57
紀(jì)委談話不用慌!內(nèi)行都懂:三句關(guān)鍵話講清楚,既合規(guī)又穩(wěn)妥

紀(jì)委談話不用慌!內(nèi)行都懂:三句關(guān)鍵話講清楚,既合規(guī)又穩(wěn)妥

觀星賞月
2026-04-17 00:07:00
中日航線中斷4天,高市低頭,涉事者被投入大牢

中日航線中斷4天,高市低頭,涉事者被投入大牢

鐵錘妹妹是只貓
2026-04-16 16:24:51
德國(guó)準(zhǔn)備參與霍爾木茲海峽安全保障行動(dòng)

德國(guó)準(zhǔn)備參與霍爾木茲海峽安全保障行動(dòng)

財(cái)聯(lián)社
2026-04-16 22:23:08
黃仁勛一句話定義英偉達(dá):我們不是賣GPU,是把電子變成Token

黃仁勛一句話定義英偉達(dá):我們不是賣GPU,是把電子變成Token

華爾街見聞官方
2026-04-16 18:01:10
浙江東陽,33 歲的男子,在母親長(zhǎng)眠的公墓旁,在車?yán)锝Y(jié)束了生命

浙江東陽,33 歲的男子,在母親長(zhǎng)眠的公墓旁,在車?yán)锝Y(jié)束了生命

魔都姐姐雜談
2026-03-30 19:25:57
王曼昱在大賽奪冠之后,教練就會(huì)更換,已經(jīng)成為了定律

王曼昱在大賽奪冠之后,教練就會(huì)更換,已經(jīng)成為了定律

子水體娛
2026-04-17 00:06:06
全新寶馬 X5 國(guó)內(nèi)曝光,“絕美顏值”很帥氣!

全新寶馬 X5 國(guó)內(nèi)曝光,“絕美顏值”很帥氣!

新浪財(cái)經(jīng)
2026-04-14 18:56:49
鄭麗文離京四日換中山裝,大陸定調(diào)統(tǒng)一,臺(tái)灣85歲老將出山

鄭麗文離京四日換中山裝,大陸定調(diào)統(tǒng)一,臺(tái)灣85歲老將出山

衣服固元膏
2026-04-17 02:00:03
我國(guó)癌癥高發(fā),電飯煲是“幫兇”?醫(yī)生:7種省錢行為要不得

我國(guó)癌癥高發(fā),電飯煲是“幫兇”?醫(yī)生:7種省錢行為要不得

大象新聞
2026-03-24 13:53:11
無法無天!從醫(yī)生到病人全是演員!網(wǎng)友:以后誰還敢信中醫(yī)?

無法無天!從醫(yī)生到病人全是演員!網(wǎng)友:以后誰還敢信中醫(yī)?

華人星光
2026-04-15 12:55:39
雷軍再回應(yīng)小米被黑,稱不能因?yàn)橛泻诟寰筒徽f話

雷軍再回應(yīng)小米被黑,稱不能因?yàn)橛泻诟寰筒徽f話

IT之家
2026-04-16 20:26:13
馬筱梅也是的拎不清的,她完全分不清汪家的大小王,網(wǎng)友:智商低

馬筱梅也是的拎不清的,她完全分不清汪家的大小王,網(wǎng)友:智商低

魔都姐姐雜談
2026-04-16 19:49:26
6月起高速查得更嚴(yán)!中老年人自駕坐車,務(wù)必記清

6月起高速查得更嚴(yán)!中老年人自駕坐車,務(wù)必記清

娛樂圈見解說
2026-04-17 03:24:14
經(jīng)歷三次離婚后我才懂:所有夫妻關(guān)系破裂,都源于這三個(gè)原因

經(jīng)歷三次離婚后我才懂:所有夫妻關(guān)系破裂,都源于這三個(gè)原因

千秋文化
2026-03-01 22:12:24
震驚!父親去世后,子女把骨灰安放二樓臥室,稱“讓老人不孤單”

震驚!父親去世后,子女把骨灰安放二樓臥室,稱“讓老人不孤單”

火山詩話
2026-04-16 11:26:26
伊朗一仗點(diǎn)醒普京,俄羅斯或不再是世界大國(guó),中國(guó)不是第二強(qiáng)?

伊朗一仗點(diǎn)醒普京,俄羅斯或不再是世界大國(guó),中國(guó)不是第二強(qiáng)?

阿雹娛樂
2026-04-16 07:46:23
2026-04-17 04:19:00
全天候科技 incentive-icons
全天候科技
幫助投資者理解科技
3822文章數(shù) 15002關(guān)注度
往期回顧 全部

科技要聞

趙明:智駕之戰(zhàn),看誰在大模型上更高效

頭條要聞

特朗普宣布黎以將停火后 以軍大規(guī)模空襲黎巴嫩

頭條要聞

特朗普宣布黎以將停火后 以軍大規(guī)模空襲黎巴嫩

體育要聞

皇馬拜仁踢出名局,但最搶鏡的還是他

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財(cái)經(jīng)要聞

海爾與醫(yī)美女王互撕 換血抗衰誰的生意?

汽車要聞

空間大五個(gè)乘客都滿意?體驗(yàn)嵐圖泰山X8

態(tài)度原創(chuàng)

藝術(shù)
本地
數(shù)碼
健康
游戲

藝術(shù)要聞

你絕對(duì)想不到!這幅油畫背后的美麗故事!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

數(shù)碼要聞

榮耀史上最短發(fā)布會(huì),發(fā)布榮耀史上最強(qiáng)MagicBook數(shù)字系列

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

《荒野大鏢客3》最全新情報(bào)!前傳還是新故事?

無障礙瀏覽 進(jìn)入關(guān)懷版