无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴(yán)選
郵箱大師
網(wǎng)易云課堂

注冊(cè)免費(fèi)郵箱

注冊(cè)VIP郵箱（特權(quán)郵箱，付費(fèi)）
免費(fèi)下載網(wǎng)易官方手機(jī)郵箱應(yīng)用

移動(dòng)端
網(wǎng)易公開課
網(wǎng)易嚴(yán)選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

獨(dú)家丨美團(tuán)領(lǐng)投 A 輪， Mindverse 總?cè)谫Y 5000 萬美元，打造持續(xù)學(xué)習(xí)的 Agent 模型

2026-06-01 19:14:58　來源: 極客公園

北京舉報(bào)

0

分享至

構(gòu)建持續(xù)學(xué)習(xí)的 Agent 模型。

作者｜徐珊

編輯｜鄭玄

Mindverse 完成由美團(tuán)領(lǐng)投的 A 輪融資，元禾璞華、韶音、變量資本和老股東追加跟投，歷史股東包括螞蟻、源一、紅杉中國(guó)、真格、高榕等一線基金，融資額近 5000 萬美元，高鵠資本擔(dān)任獨(dú)家財(cái)務(wù)顧問。

一個(gè)會(huì)持續(xù)學(xué)習(xí)的先進(jìn) Agent模型，到底該怎么構(gòu)建？

在大模型智能上限一路被推高時(shí)，「持續(xù)學(xué)習(xí)」的最佳答案還是沒有出現(xiàn)。

「真正的 Agent 能力并非來自精巧的提示詞拼湊，而是源自后訓(xùn)練。」

Mindverse (心洲科技) 是少數(shù)把賭注押在模型「內(nèi)部」的一家創(chuàng)企，它在通用大模型的基礎(chǔ)上，用強(qiáng)化學(xué)習(xí)讓它從復(fù)雜、多步驟的真實(shí)任務(wù)中學(xué)會(huì)如何把事做成，讓模型從「知道很多」變?yōu)椤改苻k好事」。

而實(shí)現(xiàn)持續(xù)進(jìn)化的關(guān)鍵在于 LoRA 技術(shù)，它就像給一個(gè)強(qiáng)大的共享大腦掛上無數(shù)輕量的「技能包」，每個(gè)技能包只占極小參數(shù)，卻能獨(dú)立更新、彼此隔離，讓模型以極低成本不斷積累屬于特定用戶或場(chǎng)景的記憶與能力，而不是每次從頭重訓(xùn)。

三年前，當(dāng)整個(gè)行業(yè)的目光還盯在預(yù)訓(xùn)練上，Mindverse 的創(chuàng)始人 Andrew 就在一篇和姚順雨合作的論文里寫下了一個(gè)幾乎沒人認(rèn)同的判斷：

Agent 的能力，最終要回到模型訓(xùn)練本身，而不是靠 prompt 和框架拼出來。

早期 Mindverse（心洲科技）內(nèi)部研討會(huì)議｜來源：Mindverse

三年過去，當(dāng)行業(yè)注意力從預(yù)訓(xùn)練涌向后訓(xùn)練，這家公司發(fā)現(xiàn)，自己一直默默走的那條路，已經(jīng)站到了潮水的正中央。很快他們將開源自己訓(xùn)練的 750B agent 模型，這也會(huì)成為全球第一個(gè)在 GLM 5.1 上完成強(qiáng)化學(xué)習(xí)后訓(xùn)練的成果。

看準(zhǔn)這件事很早，公司團(tuán)隊(duì)卻不大。Mindverse 核心研發(fā)約 20 人，成員來自 DeepSeek、字節(jié) Seed、xAI，也有清華、MIT、杜克的背景，累計(jì)發(fā)表過 200 多篇頂會(huì)論文。

兩位創(chuàng)始人陳鍇杰、Andrew 從 2018 年就一起休學(xué)創(chuàng)業(yè)，做過機(jī)器人、辦過實(shí)驗(yàn)室，又各自回到學(xué)校，2023 年再次走到一起。Andrew 抓住了從 agent 訓(xùn)練到先進(jìn) agent model 的技術(shù)范式，首席科學(xué)家馬驍騰帶來了十年的強(qiáng)化學(xué)習(xí)積累，而陳鍇杰則主要關(guān)注業(yè)務(wù)模型的應(yīng)用和用戶價(jià)值判斷。

在和陳鍇杰這場(chǎng)對(duì)話里，我們想弄清楚的是：如何用后訓(xùn)練的方式，訓(xùn)練出一個(gè)便宜、好用、還能持續(xù)成長(zhǎng)的模型？

以下是極客公園和創(chuàng)始人陳鍇杰的對(duì)話，經(jīng)過整理：

01

模型變強(qiáng)的下半場(chǎng)，在后訓(xùn)練

極客公園：這一兩年，行業(yè)的注意力肉眼可見地從預(yù)訓(xùn)練轉(zhuǎn)向后訓(xùn)練。后訓(xùn)練這件事，是什么時(shí)候真正變重要的？

陳鍇杰：今天預(yù)訓(xùn)練和后訓(xùn)練的邊界已經(jīng)越來越模糊，預(yù)訓(xùn)練階段也會(huì)混入大量 Agent 軌跡數(shù)據(jù)。但大體上仍然可以這樣區(qū)分：預(yù)訓(xùn)練主要利用互聯(lián)網(wǎng)數(shù)據(jù)建立對(duì)世界的基本認(rèn)知，后訓(xùn)練則把這些認(rèn)知轉(zhuǎn)化成具體能力。

真正的分水嶺大概出現(xiàn)在 DeepSeek 發(fā)布 R1 的時(shí)候。那是行業(yè)第一次看到強(qiáng)化學(xué)習(xí)能夠系統(tǒng)性地推動(dòng)大模型能力提升，也是后訓(xùn)練地位快速上升的開始。在那之前，后訓(xùn)練消耗的算力可能只占預(yù)訓(xùn)練的 3% 到 5%，現(xiàn)在絕大部分模型能力的進(jìn)步都發(fā)生在后訓(xùn)練階段。

一個(gè)重要原因是，行業(yè)開始積累此前互聯(lián)網(wǎng)中不存在的數(shù)據(jù)。Claude Code 這樣的產(chǎn)品里大量真實(shí)任務(wù)產(chǎn)生的 Agent 軌跡開始被沉淀下來，成為推動(dòng)后訓(xùn)練持續(xù)演進(jìn)的重要基礎(chǔ)。

極客公園：后訓(xùn)練真正解決的，到底是模型的什么？是能力，是對(duì)齊，還是讓它「學(xué)會(huì)做事」？

陳鍇杰：是在「對(duì)世界的基本認(rèn)知」這個(gè)底子之上，去增強(qiáng)它在真實(shí)任務(wù)里的能力。預(yù)訓(xùn)練給了它知識(shí)和世界觀，但一個(gè)知道很多事的人，不等于一個(gè)能把事做成的人——后訓(xùn)練補(bǔ)的就是后面這半截：怎么在真實(shí)任務(wù)里把已有的認(rèn)知用起來、用對(duì)。

而且這件事還有一個(gè)更未來的形態(tài)，叫持續(xù)學(xué)習(xí)（continual learning）。我們想做的是有一種訓(xùn)練模型的方法，能讓模型用很低的成本不斷演化、進(jìn)化，學(xué)習(xí)新的知識(shí)、做新的任務(wù)，也遺忘那些不需要的知識(shí)和任務(wù)，讓效果以一種漸進(jìn)的方式提升。它不是訓(xùn)練完就定型，而是一邊在真實(shí)場(chǎng)景里運(yùn)行、一邊持續(xù)地更新自己。

極客公園：你們認(rèn)定要靠訓(xùn)練去解決這件事，其實(shí)下手很早。2023 年那篇 FireAct 就提出「agent 能力來自訓(xùn)練、而不是 prompt」，當(dāng)時(shí)還是個(gè)非共識(shí)。為什么你們敢這么早押？

陳鍇杰：這個(gè)判斷和我離開學(xué)校后的第二次創(chuàng)業(yè)經(jīng)歷有關(guān)。當(dāng)時(shí)我們?cè)谧?AI 游戲，用的是 GPT-2、GPT-3 時(shí)代的模型。能力很有限，但已經(jīng)需要構(gòu)建一個(gè)會(huì)隨著用戶行為不斷變化的 AI 世界，本質(zhì)上是在搭建復(fù)雜工作流。

那兩年我們很清楚地看到一個(gè)問題。單個(gè)步驟成功率達(dá)到 95%，看起來已經(jīng)很高，但當(dāng)十幾個(gè)步驟串聯(lián)在一起時(shí)，誤差會(huì)不斷累積，最終破壞整個(gè)體驗(yàn)。長(zhǎng)程任務(wù)不可能只依賴 Prompt 拼接完成，能力最終必須通過訓(xùn)練獲得。今天大家常說的 trajectory，本質(zhì)上就是一條連續(xù)的思考與行動(dòng)軌跡。

后來姚順雨提出 ReAct，把思考和行動(dòng)組織成一條連續(xù)軌跡。我們看到這件事的時(shí)候，其實(shí)非常有共鳴。也是從那個(gè)時(shí)候開始，我們?cè)絹碓酱_信，Agent 能力最終會(huì)回到訓(xùn)練本身。Andrew 和他一起發(fā)完 FireAct 那篇論文之后，我們也決定沿著這條路線繼續(xù)往前走，成立公司，把這件事做下去。

極客公園：這條路繞不開 LoRA。但大部分人對(duì) LoRA 的印象還停在「給圖片加個(gè)濾鏡」。在你們這兒它顯然不是這個(gè)角色，該怎么重新理解它，它和強(qiáng)化學(xué)習(xí)又是什么關(guān)系？

陳鍇杰：我們選 LoRA，最初其實(shí)是個(gè)很現(xiàn)實(shí)的考慮，它是一個(gè)極致性價(jià)比的訓(xùn)練方法。你可以把它理解成一個(gè)自適應(yīng)的適配器：它不去動(dòng)整個(gè)模型，而是把模型里最關(guān)鍵的那部分參數(shù)提煉出來訓(xùn)練，用很少的參數(shù)就能擬合整個(gè)模型的訓(xùn)練效果。因?yàn)槲覀冏钤缰挥袔资ā⒁话倏ǖ募?，受到這個(gè)限制我們必須把每一分算力的效率榨到極致。

但今天 LoRA 演變成了構(gòu)建持續(xù)學(xué)習(xí)的技術(shù)底座，它負(fù)責(zé)讓模型的能力能夠不斷地被承載、被更新。它和強(qiáng)化學(xué)習(xí)其實(shí)是分工的兩件事，強(qiáng)化學(xué)習(xí)是后訓(xùn)練里最主要的方法，負(fù)責(zé)把模型的能力真正練出來。在萬億參數(shù)這個(gè)規(guī)模下，強(qiáng)化學(xué)習(xí)和 LoRA 的適配兩件事情都很困難，但都繞不開。

極客公園：那你們研究真正的轉(zhuǎn)折點(diǎn)是哪一刻？我們注意到一個(gè)挺微妙的細(xì)節(jié)，幾乎在同一時(shí)間，硅谷的 Thinking Machines 也在做同一件事。

陳鍇杰：轉(zhuǎn)折在 2025 年 9 月前后。我們發(fā)現(xiàn)在足夠大的 MoE 模型上用 LoRA 做強(qiáng)化學(xué)習(xí)，性能是沒有損失的。一個(gè)輕量的低秩方法去更新模型，和把整個(gè)模型全參數(shù)更新一遍，效果一樣。這意味著我們能用 1/10 的成本，拿到和全參數(shù)訓(xùn)練一模一樣的結(jié)果?，F(xiàn)在它從一個(gè)性能和效率的取舍變成了對(duì)效率的單調(diào)優(yōu)化。

做出這個(gè)結(jié)果時(shí)我們第一反應(yīng)是懷疑自己。直到 Thinking Machines 隨后在 9 月 29 日他們發(fā)了《LoRA Without Regret》，結(jié)論跟我們完全一致?？吹剿麄儶?dú)立印證了同一件事，我們反而踏實(shí)了。

到去年 12 月底，我們完成了萬億參數(shù)的 LoRA 強(qiáng)化學(xué)習(xí)，和 Thinking Machines 同期發(fā)布。全球那時(shí)能做到的只有我們兩家，今年加上 Fireworks（Cursor Composer 模型的合作伙伴）也就三家。

極客公園：你說LoRA是「構(gòu)建持續(xù)學(xué)習(xí)的技術(shù)底座」。這句話具體怎么理解？為什么 LoRA 這層?xùn)|西，會(huì)成為模型「持續(xù)學(xué)習(xí)」的關(guān)鍵元器件？

陳鍇杰：它是基模上面的一個(gè)更小的層，比如我們最新要發(fā)的模型，就是基模加上面這個(gè) LoRA 一層，LoRA 這層的參數(shù)量大概是基模的千分之五，有很多個(gè)的話會(huì)更大。因?yàn)檫@一層參數(shù)不多，所以它便宜、好訓(xùn)、可以擴(kuò)展。

舉個(gè)例子，假設(shè)我服務(wù)一個(gè)金融客戶，先把他的股票、市場(chǎng)數(shù)據(jù)訓(xùn)成一個(gè)金融推理模型。過三個(gè)月，金融市場(chǎng)又發(fā)生很多事、股價(jià)也變了，這些新數(shù)據(jù)怎么辦？OpenAI、Anthropic 要把這些再訓(xùn)進(jìn)預(yù)訓(xùn)練里，是很貴、很難、動(dòng)起來成本極大的一件事；但這個(gè)金融客戶，因?yàn)?LoRA 本身夠小，只要繼續(xù)訓(xùn)這個(gè) LoRA、把新數(shù)據(jù)再訓(xùn)進(jìn)去就行。LoRA 的大小也不固定，可以做得很小很小，小到每個(gè)人有一個(gè)、薄薄的一片，用一個(gè)人一個(gè)月的數(shù)據(jù)去訓(xùn)，可能就是幾十美金的量級(jí)；而最大的、能追平全參數(shù)訓(xùn)練效果的 LoRA，也不過幾萬、幾十萬美金。所以它有非常大的可調(diào)節(jié)空間：你企業(yè)數(shù)據(jù)少能訓(xùn)，數(shù)據(jù)多也能訓(xùn)，想要接近預(yù)訓(xùn)練級(jí)別的大提升、讓它學(xué)會(huì)一門新的代碼語言，也能訓(xùn)。薄、好訓(xùn)、可加、便宜，這就是 LoRA 在持續(xù)學(xué)習(xí)上的第一層意義，在單個(gè) LoRA 上。

極客公園：如果不用任何術(shù)語，讓一個(gè)普通人聽明白，你們到底在做一件什么事？

陳鍇杰：我們?cè)谝粋€(gè)足夠強(qiáng)的大模型底座上，掛很多個(gè)「技能包」，讓一個(gè)模型能同時(shí)變成成千上萬個(gè)各有所長(zhǎng)的模型，去服務(wù)不同的人、不同的企業(yè)、不同的場(chǎng)景。

這個(gè)底座就是 base model，提供通用的智能上限；那些"技能包"就是 LoRA，每一個(gè)承載一小塊具體的東西，里面可以是某個(gè)用戶的長(zhǎng)期偏好、某個(gè)企業(yè)的業(yè)務(wù)經(jīng)驗(yàn)、某類任務(wù)的打法。過去大家的默認(rèn)做法是"一個(gè)模型服務(wù)所有人"，所有人共用同一套參數(shù)；我們想做的是反過來，共享同一個(gè)聰明的底座，但每個(gè)人、每個(gè)場(chǎng)景頭上都有一片屬于自己的、還能持續(xù)長(zhǎng)大的參數(shù)。我們把這套結(jié)構(gòu)叫 mixture of LoRA。

極客公園：mixture of LoRA，這名字會(huì)讓人立刻想到 MoE，大家熟悉的 mixture of experts。這兩個(gè)「mixture」是一回事嗎？

陳鍇杰：有學(xué)習(xí) MoE 的地方，但不一樣。MoE 里單獨(dú)一個(gè) expert 是沒法完成推理的，它更像是模型內(nèi)部自己分出來的計(jì)算單元。但 mixture of LoRA 里，每一個(gè) LoRA 都是獨(dú)特的、可以單獨(dú)調(diào)用、對(duì)應(yīng)一塊明確的能力。

舉個(gè)例子，假設(shè)我要做金融任務(wù)，我可以一次性掛 10 個(gè) LoRA，一個(gè)學(xué)股價(jià)、一個(gè)學(xué)財(cái)報(bào)、一個(gè)學(xué)風(fēng)控……分頭去學(xué)。哪天我又要加兩個(gè)新任務(wù)，比如港股打新的技巧，我完全不用動(dòng)前面那 10 個(gè)已經(jīng)學(xué)好的，直接再加兩個(gè) LoRA 進(jìn)去學(xué)就行，學(xué)完一掛，模型的能力就天然擴(kuò)展了一塊，舊的一點(diǎn)沒受影響。這就是為什么我們說它是一個(gè)"天生適合持續(xù)學(xué)習(xí)"的結(jié)構(gòu)。因?yàn)槠渌械哪芰κ且粔K塊累加上去的，而不是每加一點(diǎn)新東西就得把整個(gè)模型重訓(xùn)一遍、還冒著把舊本事弄丟的風(fēng)險(xiǎn)。這也是 LoRA 的第二層意義，在 mixture of LoRA 的持續(xù)擴(kuò)展上。

我們還在探索的、更遠(yuǎn)的可能，比如說讓 LoRA 之間協(xié)商、合作。當(dāng)我們有了 mixture of LoRA 這個(gè)架構(gòu)，我們會(huì)關(guān)注不同的 LoRA 之間的協(xié)作，會(huì)不會(huì)因?yàn)槟Ｐ偷亩鄻有詭砀玫慕Y(jié)果。

極客公園：這套結(jié)構(gòu)落到一個(gè)真東西上，就是你們即將要發(fā)的模型？

陳鍇杰：對(duì)我們很快會(huì)開源我們訓(xùn)練的模型，它天生就支持 mixture of LoRA，是一個(gè) 750B 參數(shù)的 Agent 模型，其中是 744B 的預(yù)訓(xùn)練 GLM 5.1 + 6B 的 LoRA。我們應(yīng)該是除了智譜以外，第一個(gè)在 GLM 5.1 上完成強(qiáng)化學(xué)習(xí)后訓(xùn)練的團(tuán)隊(duì)。

在 GLM5.1 上面做 LoRA 強(qiáng)化學(xué)習(xí)是有實(shí)打?qū)嵉墓こ涕T檻的，需要適配 DSA，DeepSeek Sparse Attention，還有 MTP，Multi Token Prediction。我們這個(gè)模型不是去追「什么都會(huì)」的通用基模，它是專門面向 agent 場(chǎng)景深度后訓(xùn)練出來的，主要服務(wù)于生成式 UI 的編碼、生活中的聊天、長(zhǎng)鏈路推理和工具調(diào)用。

極客公園：新模型你們定義成一個(gè) Agent Model。這個(gè)詞該怎么理解？大家在后訓(xùn)練上的投入，最終都是為了它嗎？

陳鍇杰：最新的前沿模型都是面向 agent 的模型。拿 Claude 舉例：它出了 Claude Code 之后，模型訓(xùn)練就會(huì)用 Claude Code 的數(shù)據(jù)，這些數(shù)據(jù)和我們平常用豆包那樣「問一句答一句」完全不同。在 Claude Code 里，你寫一段代碼是一個(gè)非常長(zhǎng)的任務(wù)，中間有很多交互，是一條很長(zhǎng)鏈路的數(shù)據(jù)。用這些數(shù)據(jù)訓(xùn)練之后，Claude 這個(gè)模型就越來越"agent native"，越來越適應(yīng) agent 的架構(gòu)，因?yàn)樗緛砭褪怯眠@些數(shù)據(jù)訓(xùn)出來的。所以模型和應(yīng)用場(chǎng)景是相輔相成的，大家都在往這個(gè)方向演進(jìn)，進(jìn)度各不相同。

我們做的也是這件事，只不過場(chǎng)景放在生活上。Macaron 是我們的 agent harness，生活場(chǎng)景里同樣有很多復(fù)雜的工具調(diào)用、代碼執(zhí)行，還有很多模糊的請(qǐng)求，用戶自己也不知道想干嘛。我們會(huì)把這些串成一條連續(xù)的任務(wù)鏈路，讓模型在這條鏈路里通過訓(xùn)練做得更好，去提升 agent 的表現(xiàn)。所以當(dāng)我們說 agent model 時(shí)，指的就是：這個(gè)模型訓(xùn)出來，是為了在一個(gè)多輪 agent 環(huán)境里使用的，它專門為這個(gè)環(huán)境做了優(yōu)化。它還是一個(gè)模型，但做了 agent 的訓(xùn)練。

我們很特別的地方在于，市面上幾乎沒有專門為 agent 工作流優(yōu)化的模型。國(guó)內(nèi)大批量的開源模型，基本還在追趕 GPT 和 Claude 最先進(jìn)的那一代，所以大家的精力很多還在預(yù)訓(xùn)練上，怎么先趕上，可能還顧不上把 agent 這部分在后訓(xùn)練里做得特別好。

Claude 肯定在逐漸做，做得也非常好，但同時(shí)他們要管的課題多很多。我們是專門為 agent 訓(xùn)練模型，讓它把 agent 任務(wù)做得更好，工具調(diào)用、記憶提取、什么時(shí)候該把任務(wù)交還給用戶、什么時(shí)候繼續(xù)多輪思考，這些它都會(huì)做得更好。

02

模型時(shí)代，時(shí)間就是最大的壁壘

極客公園：大家最初認(rèn)識(shí) Mindverse（心洲科技）就是從 Macaron 開始。你談到Macaron 不只是個(gè) C 端產(chǎn)品，而是模型的agent harness。能具體講講，模型和產(chǎn)品到底怎么互相喂養(yǎng)？這和大家常說的「拿用戶數(shù)據(jù)訓(xùn)模型」有什么不一樣？

陳鍇杰：我們從一開始，就是把模型訓(xùn)練和 C 端應(yīng)用的迭代放在一起看的，它不是"先有模型、再拿產(chǎn)品收集點(diǎn)數(shù)據(jù)"那么簡(jiǎn)單，而是一個(gè)雙向的循環(huán)。

但我們和很多人有個(gè)關(guān)鍵區(qū)別，我們不直接拿用戶的數(shù)據(jù)去訓(xùn)練。生活里的隱私和工作一樣重要，而很多人會(huì)直接拿用戶數(shù)據(jù)訓(xùn)模型。我們的做法是借助用戶的反饋，去理解數(shù)據(jù)里的分布和特點(diǎn)，然后造一個(gè)我們自己的模擬環(huán)境，把模型放進(jìn)這個(gè)模擬環(huán)境里訓(xùn)練。我們會(huì)故意往里面加很多噪聲、干擾、極端情況，因?yàn)檎鎸?shí)用戶的表現(xiàn)本來就非常極端：會(huì)中途打斷、會(huì)改目標(biāo)，還會(huì)給到錯(cuò)的、過時(shí)的信息。模型在這種環(huán)境里練出來，才扛得住現(xiàn)實(shí)里 agent 真正會(huì)遇到的狀況。而且后訓(xùn)練需要的數(shù)據(jù)量其實(shí)很小，幾萬條、幾十萬條就是一個(gè)很有意義的規(guī)模，它不像預(yù)訓(xùn)練要那么大的量，更關(guān)鍵的是數(shù)據(jù)質(zhì)量要非常高。

反過來，模型也喂產(chǎn)品。這些訓(xùn)出來的能力，訓(xùn)完是直接部署回 Macaron 的，產(chǎn)品體驗(yàn)的上限本就由模型能力決定。這和 Anthropic 是同一個(gè)邏輯，Claude 的訓(xùn)練直接服務(wù) Claude Code，Claude Code 里跑出來的東西又流回去訓(xùn)模型，只不過我們的場(chǎng)景是生活。所以 Macaron 對(duì)我們的意義，不是多一個(gè)產(chǎn)品入口，而是給模型提供了一個(gè)真實(shí)、長(zhǎng)期、會(huì)持續(xù)產(chǎn)生反饋的 agent harness 和訓(xùn)練環(huán)境。Macaron，現(xiàn)在有 200 多萬用戶、超過 10 萬日活。

極客公園：你們很看重「生成式 UI」。模型把答案講清楚不就行了，為什么非要它會(huì)「畫界面」？

陳鍇杰：模型什么都返給你一段文字，其實(shí)不是一種好的表達(dá)方式。人類天生就是一個(gè)視覺動(dòng)物，對(duì)圖形的感知要顯著的好于文字。同樣一件事，展示一張圖表，肯定比把這些數(shù)字寫成一大段話更清晰——這中間省掉的，是你的認(rèn)知負(fù)擔(dān)。Google 在 IO 大會(huì)上講的 omni 也是這個(gè)意思，模型該用更豐富的形式把結(jié)果交給你，而不是永遠(yuǎn)丟一堆文本讓你自己消化。

所以在 Google 定義的 A2UI 這個(gè)標(biāo)準(zhǔn)上，SOTA 衡量的就不只是「模型能不能生成 UI」，而是「它生成的這個(gè)界面，幫用戶下降了多少認(rèn)知負(fù)擔(dān)」。在生活場(chǎng)景里這件事尤其關(guān)鍵：你問「今天吃什么」，給你彈出幾個(gè)能直接點(diǎn)的選項(xiàng)卡，和給你寫三百字，體驗(yàn)完全是兩回事。模型會(huì)不會(huì)"好好說話"，在 C 端是直接決定體驗(yàn)的。

極客公園：你們?cè)谀Ｐ蜕厦婀嫉?benchmark 也挺有意思，生活類任務(wù)上拿了 SOTA，但代碼、數(shù)學(xué)這些硬核任務(wù)，你們明說了只逼近、不追第一。這個(gè)取舍本身是一種表態(tài)吧？

陳鍇杰：這個(gè)選擇本身就說明了我們是一家什么樣的公司。姚順雨在「AI 下半場(chǎng)」里的觀點(diǎn)我們特別認(rèn)同：接下來 benchmark 可能是模型訓(xùn)練里最重要的一環(huán)，因?yàn)槟氵x擇什么 benchmark，就是你想讓模型在哪些任務(wù)上變強(qiáng)。

我們挑了四個(gè)，Living Bench 是我們自己定義的、Vita Bench 是美團(tuán)出的，這兩個(gè)打的是生活類長(zhǎng)鏈路任務(wù)，比如一次旅行規(guī)劃，聽著簡(jiǎn)單，真做起來牽涉的環(huán)節(jié)和個(gè)人偏好特別多；A2UI 是 Google 提出的生成式 UI 標(biāo)準(zhǔn)；PinchBench 是海外常用來刻畫 OpenClaw 這類 agent 任務(wù)表現(xiàn)的榜單。這四個(gè)上我們都做到了 SOTA。

而客服、寫代碼、純數(shù)學(xué)這些傳統(tǒng)任務(wù)，對(duì)我們也重要，但不是我們最想爭(zhēng)第一的地方，我們會(huì)去逼近開源模型的最好水平，但不在這上面爭(zhēng)第一。說白了，我們不想做一個(gè)樣樣考第一的通用模型，我們想做一個(gè)在「真實(shí)生活里把復(fù)雜的事辦成」這件事上最好的 agent 模型。

但從另一個(gè)角度來看，我們整套訓(xùn)練框架是可復(fù)用在多個(gè)場(chǎng)景的。我們通過這次發(fā)布的首個(gè)模型，本質(zhì)上是驗(yàn)證了「基座大模型+技能包」這條路在復(fù)雜長(zhǎng)鏈路任務(wù)里的有效性。因此，面對(duì)更廣闊的企業(yè)端垂直需求，我們不需要從頭訓(xùn)模型，只需要基于同一個(gè)底座，快速增強(qiáng)出對(duì)應(yīng)場(chǎng)景的專精技能，以極低邊際成本覆蓋新的 Benchmark。

極客公園：聽說你們能將模型后訓(xùn)練的成本降低 1/10，且效果保持不變。這 10 倍到底省在哪？這個(gè)事情在萬億參數(shù)的模型上去做有什么難的地方？

陳鍇杰：省是因?yàn)槲也挥脼槊總€(gè)用戶、每個(gè)場(chǎng)景都復(fù)制一整個(gè)大模型。打個(gè)比方，如果要給幾千個(gè)人各部署一個(gè)完整的萬億參數(shù)大模型，那等于把同一個(gè)龐然大物原樣復(fù)制幾千份，需要的算力是個(gè)天文數(shù)字，經(jīng)濟(jì)上根本不可能發(fā)生。但在我們的結(jié)構(gòu)里，這幾千個(gè)模型共享同一個(gè)底座，各自只帶一片小小的 LoRA，所需的算力跟部署一個(gè)模型相比幾乎沒有增加，省掉的，就是那幾千份重復(fù)的底座。

至于為什么「越大越難」，是因?yàn)槔щy不是線性漲上去的，而是一道道工程門檻。在小模型上掛個(gè) LoRA 沒什么稀奇，但要在接近萬億參數(shù)的超大模型上穩(wěn)定訓(xùn)練、并且把成百上千個(gè) LoRA 同時(shí)部署好，背后是一整套系統(tǒng)工程：算子要重寫、顯存怎么管、訓(xùn)練和推理怎么保持一致、幾百萬個(gè)技能怎么加載切換、多個(gè)客戶之間怎么隔離……每一項(xiàng)到了這個(gè)尺度都會(huì)變成硬骨頭。

國(guó)內(nèi)目前能在這種尺寸上做 LoRA 訓(xùn)練的，可能就我們一家。我們現(xiàn)在甚至在往極小的方向摳，傳統(tǒng) LoRA 一般用 16 或 32 的 rank，我們?cè)谘芯?rank 等于 1、甚至比 1 還小的算法，因?yàn)楹芏鄠€(gè)性化要存的信息其實(shí)沒那么多，技能包越小，性價(jià)比越高，能掛的數(shù)量也越多。

極客公園：數(shù)量是個(gè)關(guān)鍵詞。去年 12 月你們一個(gè)底座上能掛 10 個(gè) LoRA，今年就說能到百萬級(jí)。這個(gè)跳躍靠什么？而且「模型數(shù)量」聽起來也成了一個(gè)新的 scaling 維度？

陳鍇杰：靠?jī)杉隆Ｒ皇前?LoRA 做得越來越小，剛才說的 rank 做到 1，單個(gè)就更容易承載；二是更好的緩存機(jī)制，以前大家可能是三層緩存，我們多做了一層，加上很多并行處理的方法。也因此，它不是上百萬個(gè)同時(shí)激活，而是這上百萬個(gè)能以很快的速度激活，大概一秒以內(nèi)，一個(gè)請(qǐng)求進(jìn)來、命中了一個(gè)還沒激活的 LoRA，也能在一秒內(nèi)響應(yīng)。所以「同一個(gè) batch 只能做幾十個(gè)」其實(shí)不是限制，它取決于資源，你要部署百萬個(gè)，把卡開多一點(diǎn)就行。

而「模型數(shù)量本身成為一個(gè) scaling 維度」，是讓我們很興奮的事。過去大模型的 scaling 主線是把一個(gè)模型越做越大；agent 時(shí)代多出來一條線，是把模型的數(shù)量也規(guī)?；?。

我們驗(yàn)證過它是成立的，掛上去的模型越多，整體智能穩(wěn)定往上走，差不多是一個(gè)自然對(duì)數(shù) scale 的線性提升。這對(duì)我們來說也是個(gè)挺震驚的發(fā)現(xiàn)。所以我們可以做到一人一個(gè)、一個(gè)公司一個(gè)，或者一個(gè)任務(wù)領(lǐng)域一個(gè)。

極客公園：你們說全球能做這件事的只有三家，可這聽起來更像是「做得早」。如果大廠下定決心、甚至自己造一套 LoRA 后訓(xùn)練架構(gòu)，他們做得到嗎？你們真正的護(hù)城河是什么？

陳鍇杰：在大模型這件事上，時(shí)間本身就是壁壘。你看 OpenAI 和 Anthropic 之間也沒有壁壘，沒有誰做得了、誰做不了，技術(shù)平臺(tái)一樣、人也在流動(dòng)。今天的 AI 是一個(gè)不斷「形成共識(shí)、追共識(shí)、再形成新共識(shí)」的過程。從有沒有共識(shí)，到強(qiáng)化學(xué)習(xí)、到 O1、R1、再到 agent，大家交替領(lǐng)先。真正的差別是在這種交替里，誰先做出來、誰走得更快，誰就能率先和用戶、和 toB 客戶形成循環(huán)，把價(jià)值鎖定下來。

但我們也確實(shí)積累了一些別人一時(shí)繞不過的東西。一個(gè)是真實(shí)的工程沉淀和行業(yè)認(rèn)可，我們?cè)陂_源社區(qū)和螞蟻、華為一起構(gòu)建 AReaL-MinT，和字節(jié)、英偉達(dá)一起構(gòu)建 verl-mint，這是國(guó)內(nèi)兩個(gè)最主要的強(qiáng)化學(xué)習(xí)框架，都把我們的 LoRA 技術(shù)整合了進(jìn)去；英偉達(dá)把我們掛在了官網(wǎng)首頁。這些不是 PR，是大家在底層真的用上。

另一個(gè)是我們看問題的起點(diǎn)不一樣，大廠做模型通常從預(yù)訓(xùn)練、從數(shù)據(jù)和基礎(chǔ)設(shè)施往下推，我們是從用戶需求、從真實(shí)產(chǎn)品里跑出來的問題往回推。這個(gè)從產(chǎn)品里長(zhǎng)出來的洞察，是只在實(shí)驗(yàn)室里訓(xùn)模型的人拿不到的。

極客公園：這些和大廠的合作具體落在哪一層？順著聊聊錢，你們的商業(yè)化邏輯是什么？既給云廠商做底層、自己又做產(chǎn)品，這中間不會(huì)打架嗎？

陳鍇杰：合作分幾個(gè)層次。和英偉達(dá)是在開源社區(qū)雙向的技術(shù)共建，我們把算子寫出來、一起共建底層平臺(tái)；和字節(jié)、螞蟻是在開源社區(qū)共建強(qiáng)化學(xué)習(xí)框架，我們既用他們的平臺(tái)，也把高效訓(xùn)練的方法貢獻(xiàn)了進(jìn)去。再往上到業(yè)務(wù)層，因?yàn)槲覀冇懈咝У牟l(fā)訓(xùn)練、并發(fā)推理基礎(chǔ)設(shè)施，能幫客戶把訓(xùn)練成本降一個(gè)數(shù)量級(jí)、大概到原來的 1/10，就和華為云、微軟云、阿里云、火山這樣的客戶形成合作，和華為是很深的戰(zhàn)略合作。

至于會(huì)不會(huì)打架，我們想得比較清楚，不想把自己做成一家純商業(yè)化的公司。如果某個(gè)方向要做成大規(guī)模服務(wù)、需要很大投入，我們更愿意交給華為云、微軟云這些平臺(tái)伙伴去規(guī)模化，自己專注在技術(shù)本身。所以「既服務(wù)云廠商、又自己做產(chǎn)品」不是左右手互搏，而是分工。他們做規(guī)模，我們做上限。C 端主要還是 Macaron，對(duì)今天的我們來說，把后端技術(shù)做到足夠好，比急著談收入更重要，技術(shù)真到位了，需求自然會(huì)找上來。

03

「模型記憶不應(yīng)該是記事本，應(yīng)該在參數(shù)里」

極客公園：當(dāng)一個(gè)底座上掛著成千上萬個(gè) LoRA，模型與模型之間，會(huì)開始發(fā)生什么新的事情？

陳鍇杰：會(huì)開始出現(xiàn)分工和協(xié)作。Andrew 講過很讓我興奮的一個(gè)類比，他覺得我們正在讓模型長(zhǎng)出「生物學(xué)」。

在生物出現(xiàn)之前，世界上只有化學(xué)，只有原子和分子。從化學(xué)躍遷到生命，最關(guān)鍵的轉(zhuǎn)折點(diǎn)便是細(xì)胞膜。它劃清了內(nèi)外邊界，界定了生命體的本質(zhì)。放到 AI 領(lǐng)域，我們將這種邊界隔離稱作 Isolation。每一個(gè) LoRA 都是獨(dú)立的單元，如同被細(xì)胞膜包裹的個(gè)體。

以前的模型只有「物理和化學(xué)」，拼參數(shù)量、拼數(shù)據(jù)量、拼算力；而當(dāng)你能把模型一個(gè)個(gè)隔離開、又讓它們之間高效地交換信息時(shí)，就像單細(xì)胞走向多細(xì)胞生命，分工協(xié)作自然形成，遺傳、進(jìn)化亦隨之發(fā)生。AI 的發(fā)展軌跡，正從純粹的化學(xué)層級(jí)，跨步走入生物演化的長(zhǎng)河。

極客公園：但 isolation 聽起來是個(gè)很「工程」的詞，甚至有點(diǎn)平庸。你為什么把它抬到這么高的位置？

陳鍇杰：恰恰因?yàn)樗雌饋砥接梗湃菀妆坏凸?。大家談?dòng)洃浀奈磥?，一般?huì)盯著兩個(gè)很 fancy 的方向，更好的模型結(jié)構(gòu)、更高效的算法。isolation 排第三，聽上去就是個(gè)「把數(shù)據(jù)隔開」的臟活。但我前面說了，從化學(xué)到生物那一躍，靠的就是細(xì)胞膜這層「隔離」。

而且 isolation 不只是技術(shù)問題，它是這套東西能不能真正進(jìn)入社會(huì)的前提。企業(yè)和企業(yè)之間是有壁壘的，一家公司不可能、也不愿意把自己的長(zhǎng)期記憶交出去，和別人的揉成一個(gè)統(tǒng)一的大模型。人和人之間更是如此，如果一個(gè)模型同時(shí)握著我和你的長(zhǎng)期記憶，那我只要問它，就能把你的隱私全套出來，這是很可怕的。所以每個(gè)人、每個(gè)企業(yè)的記憶必須被干凈地隔開。LoRA 的「一個(gè)底座、無數(shù)獨(dú)立技能包」，現(xiàn)在看就是實(shí)現(xiàn)這種隔離的一個(gè)很好的方式。

極客公園：為什么你們認(rèn)定，光靠大模型本身解決不了「記憶」和「?jìng)€(gè)性化」這件事，非得用 LoRA 這種機(jī)制來補(bǔ)？

陳鍇杰：因?yàn)榻裉熘髁鞯挠洃涀龇?，本質(zhì)上是把東西寫進(jìn)一個(gè)外部的文檔或數(shù)據(jù)庫(kù)里，你可以理解成模型旁邊掛了一個(gè)不斷變長(zhǎng)的記事本，它記住的是事實(shí)和上下文。這種方式一開始很好用，模型越用越懂你；但它有個(gè)躲不掉的毛?。哼@個(gè)記事本只增不減，越記越長(zhǎng)，而模型每次能真正「讀進(jìn)腦子」的篇幅是有限的。于是記的東西越多，命中你當(dāng)下需要的那條的概率反而越低，到某個(gè)臨界點(diǎn)，體驗(yàn)會(huì)開始往下掉。消費(fèi)者其實(shí)很久沒用過一個(gè)"越用越難用"的產(chǎn)品了，微信是越用越好用的，因?yàn)榕笥言絹碓蕉?；但一個(gè)記事本式記憶的助手，可能用到第三周就開始變笨。

我們的判斷是，真正的長(zhǎng)期記憶不該寫在外部記事本里，而該「訓(xùn)進(jìn)參數(shù)」。寫進(jìn) prompt 或文檔的，是臨時(shí)的、外掛的；訓(xùn)進(jìn)參數(shù)的，才是模型自己長(zhǎng)出來的、穩(wěn)定的能力。LoRA 正好是承載這件事的工具——它把你這個(gè)人的偏好、習(xí)慣、和它打交道的方式，沉淀成模型參數(shù)里的一小塊，而不是一段隨時(shí)可能被擠出窗口的文字。

極客公園：在「參數(shù)化記憶」這個(gè)大方向下，我們注意到你們其實(shí)不止 LoRA 一條線，還有一個(gè)叫 δ-mem 的東西。一個(gè)是離線訓(xùn)練出來的參數(shù)技能包，一個(gè)是實(shí)時(shí)更新的在線記憶矩陣。這兩條在你們的記憶體系里怎么分工？還是說，你們自己也在賭哪條更對(duì)？

陳鍇杰：其實(shí)這兩條沒有大家想的那么對(duì)立。δ-mem 也是從 LoRA 這套方法里長(zhǎng)出來的，本質(zhì)上做的還是同一件事，是把記憶沉淀進(jìn)參數(shù)，而不是掛在外面。只是我們做研發(fā)的過程中，在架構(gòu)上產(chǎn)生了一些創(chuàng)新的想法，就把它做出來了，做出來發(fā)現(xiàn)效果還不錯(cuò)。

極客公園：那就得問一個(gè)最尖銳的問題了。如果三五年后，通用底模本身強(qiáng)到能直接理解每一個(gè)用戶，你們這套「為每個(gè)人掛一片 LoRA」的事，是不是就失去意義了？

陳鍇杰：我不這么認(rèn)為，而且原因正是剛才說的 isolation。最本質(zhì)的一點(diǎn)是，每個(gè)人的數(shù)據(jù)、經(jīng)驗(yàn)和生活經(jīng)歷，是各自保存的——這意味著我的數(shù)據(jù)、和另一個(gè)人的很難也不該被混在一起訓(xùn)進(jìn)同一個(gè)模型，再讓這一個(gè)模型把我們?nèi)齻€(gè)都服務(wù)得很好。模型本身肯定會(huì)越來越聰明，但每個(gè)人獨(dú)特的體驗(yàn)，最后還是要靠屬于每個(gè)人的那部分?jǐn)?shù)據(jù)來支撐，而這些東西最終會(huì)沉淀在屬于你的參數(shù)、屬于你的模型層里。所以哪怕底座越來越強(qiáng)，「每個(gè)主體有一片只屬于自己、被隔離的參數(shù)」這個(gè)需求不會(huì)消失，反而會(huì)更剛性——底座變強(qiáng)，只會(huì)讓掛在它上面的每一片個(gè)性化技能包更值錢，而不是把它們抹掉。

極客公園：這兩年另一個(gè)很熱的詞是 harness，給模型套一層環(huán)境記憶框架。會(huì)不會(huì)「通用模型 + harness」就夠了，根本用不著你們這套「通用模型 + LoRA」？

陳鍇杰：我們其實(shí)自己也做 harness，而且把 harness 和模型訓(xùn)練放在一起，所以反而有更多空間把這件事做好。在「后訓(xùn)練加 harness」這件事上，我們幾乎和最好的團(tuán)隊(duì)站在同一條線上，同時(shí)又有自己選的方向衣食住行、長(zhǎng)期生活主題。在這個(gè)方向上，把訓(xùn)模型、后訓(xùn)練、持續(xù)學(xué)習(xí)的 LoRA 和 harness 放在一起，我相信能做出最獨(dú)特、最有價(jià)值的產(chǎn)品體驗(yàn)。

所以 harness 的發(fā)展對(duì)我們是好事，因?yàn)槲覀兛梢詾榱?harness 去訓(xùn)模型，很多團(tuán)隊(duì)做不了。說具體點(diǎn)，就是在我們的產(chǎn)品體驗(yàn)里有一個(gè)專用模型，你隨手記錄、分享生活碎片，它越來越懂你，給你推薦需要的餐廳、健身計(jì)劃、減肥計(jì)劃，孩子要買什么，推薦得越來越準(zhǔn)。這種體驗(yàn)需要模型和 harness 協(xié)同。像 OpenAI 就不會(huì)專門為這件事去訓(xùn)一個(gè)專用的 harness 和專用的模型。這里就是我們的機(jī)會(huì)，把產(chǎn)品形態(tài)和模型訓(xùn)練放在一起。

極客公園：如果 LoRA 這條路一兩年、三五年都沒做出預(yù)期的效果，你們會(huì)掉頭去做別的嗎？還是說，你們就認(rèn)定了 LoRA？

陳鍇杰：我們真正三年沒變的有兩條：我們從第一天開始就堅(jiān)持用訓(xùn)練的方法去提升 agent 能力，第二是讓研究和產(chǎn)品一起做 co-design，用真實(shí)產(chǎn)品提供真實(shí)任務(wù)、真實(shí)的失敗案例，再把這些反饋訓(xùn)回模型。今天其實(shí)很少看見優(yōu)秀的模型公司沒有自己的產(chǎn)品了，反過來也挺難的。

極客公園：那你們到底把自己定義成一家什么公司？會(huì)直接說自己是「模型公司」嗎？和 Kimi、智譜這些比，區(qū)別在哪？

陳鍇杰：我們成為了一家做 Agent 模型的 Frontier Lab，但和大家熟悉的模型公司不太一樣。Kimi、智譜這些更多是從預(yù)訓(xùn)練、從數(shù)據(jù)和基礎(chǔ)設(shè)施出發(fā)，去做通用底模；我們是從用戶需求、從真實(shí)產(chǎn)品里跑出來的問題出發(fā)，去做后訓(xùn)練和持續(xù)學(xué)習(xí)。說得直白點(diǎn)，別人是先有模型再找場(chǎng)景，我們是從場(chǎng)景倒推模型。

它會(huì)自然導(dǎo)出一些特性，做后訓(xùn)練天然更貼近用戶，你得對(duì)數(shù)據(jù)有理解，才能做更好的后訓(xùn)練，預(yù)訓(xùn)練是學(xué)習(xí)互聯(lián)網(wǎng)、學(xué)習(xí)人類知識(shí)，后訓(xùn)練是學(xué)習(xí)場(chǎng)景、學(xué)習(xí)在一個(gè)場(chǎng)景里怎么更好地互動(dòng)。連公司規(guī)模也會(huì)不一樣，預(yù)訓(xùn)練和后訓(xùn)練需要的卡大概差半個(gè)量級(jí)、三到十倍，最后的體量也不同。在中國(guó)，以這個(gè)視角去訓(xùn)模型的公司，應(yīng)該是很少的。

外界有時(shí)把我們這種形態(tài)叫 Neo Lab，它不是傳統(tǒng)意義上的實(shí)驗(yàn)室，而是一種新的 AI 公司組織方式，團(tuán)隊(duì)年輕、人才密度高，目標(biāo)不是包裝一個(gè) AI 應(yīng)用，而是持續(xù)去探技術(shù)上限。海外像 Thinking Machines Lab、Ilya 的 SSI 和李飛飛的 World Labs 都有這個(gè)氣質(zhì)，國(guó)內(nèi)還比較少。我們大概是這個(gè)形態(tài)，技術(shù)深度上和它們有相通之處，但產(chǎn)品和模式開始得更早。

極客公園：你們是什么時(shí)候明確「要做一家后訓(xùn)練公司」的？這中間最大的糾結(jié)是什么，最后怎么決策的？

陳鍇杰：其實(shí)公司誕生時(shí) Andrew 那篇論文就埋下了，它叫 Towards Language Agent Fine-Tuning，走向大語言模型 agent 的后訓(xùn)練。但怎么把它做扎實(shí)是難的，要把研究員號(hào)召起來，要有足夠的算力和資金支持探索，應(yīng)用方向也得找到答案，不然沒法在空的環(huán)境里訓(xùn)練。更多是怎么在這兩年半里把它變成現(xiàn)實(shí)。

決定做大規(guī)模強(qiáng)化學(xué)習(xí)這件事真的很難。我們做出來的時(shí)候，國(guó)內(nèi)可能就四五家，DeepSeek、Kimi、字節(jié)、阿里，然后是我們。當(dāng)時(shí)下決心很難，錢不多、人也不多，卻要挑戰(zhàn)這么難的事。但你不做強(qiáng)化學(xué)習(xí)，就沒辦法做后訓(xùn)練，所以最后還是咬牙做了，今天看是正確的選擇。我能咬緊牙關(guān)，也是因?yàn)槲覀冋J(rèn)定自己是一家做后訓(xùn)練的公司我們對(duì)創(chuàng)業(yè)的偏好是一致的，它應(yīng)該是一家成功的、有技術(shù)價(jià)值的公司。

極客公園：現(xiàn)在高性能通用模型越來越閉源，而你們要基于足夠大的模型才效果好。如果未來模型都閉源、你們甚至成了模型的購(gòu)買方，這件事的利潤(rùn)空間還剩多少？

陳鍇杰：我覺得總會(huì)有開源模型。現(xiàn)在開源和閉源效果差異不大，如果哪天差異變得非常大，事情可能會(huì)不一樣；但我覺得中國(guó)會(huì)持續(xù)有很好的開源模型，這點(diǎn)不會(huì)變——只要有第二名，大家還是會(huì)有開源的傾向。如果真的都閉源了、我們要去購(gòu)買，那怎么算性價(jià)比、服務(wù)用戶能產(chǎn)生多少價(jià)值，可能就是未來商業(yè)模式的考量，今天公司還沒到思考這個(gè)問題的階段。也有可能在那種情況下，我們會(huì)像微軟和 OpenAI 當(dāng)初那樣，和某一個(gè)公司深度合作，這也不是沒有可能。

極客公園：三年后，你希望大家怎么記住 Mindverse（心洲科技）？有沒有想過終點(diǎn)，會(huì)是上市、被收購(gòu)，還是別的？

陳鍇杰：終局在我們心里，是 agent model 和 C 端產(chǎn)品形成一個(gè)飛輪。我們的技術(shù)驅(qū)動(dòng)出別人做不出來的產(chǎn)品體驗(yàn)，這里面甚至包含硬件和其他形態(tài)，也在和一些公司合作；同時(shí)這套訓(xùn)練和部署的能力會(huì)服務(wù)越來越多的企業(yè)，2B 這條線也在快速長(zhǎng)。再往遠(yuǎn)看，這個(gè)行業(yè)的終局可能是天文級(jí)的算力被部署到太空里，超過今天一個(gè)國(guó)家的發(fā)電量，那是個(gè)遙遠(yuǎn)的圖景，剩下的都是過程。

極客公園：如果只能在「做一個(gè)改變歷史的研究突破」和「做一家持續(xù)盈利的公司」之間選一個(gè)，你們選哪邊？

陳鍇杰：我們會(huì)選研究突破那一邊。不是不在乎盈利，而是我們相信，只要你在技術(shù)上真的解決了別人解決不了的問題，商業(yè)自然會(huì)來找你；反過來不成立。

如果非要落到一個(gè)普通人身上，這條路要是走通了，他的生活會(huì)少掉很多煩惱、多出一些踏實(shí)的幸福。但每個(gè)人的境遇各有不同，悲歡亦是千人千面，而這恰恰就是「?jìng)€(gè)性化」這件事的全部意義，不是給所有人一個(gè)更聰明的模型，而是讓智能真正洞悉每一個(gè)獨(dú)特的靈魂。

*頭圖來源：Mindverse

本文為極客公園原創(chuàng)文章，轉(zhuǎn)載請(qǐng)聯(lián)系極客君微信 geekparkGO

極客一問

對(duì) Mindverse，你還有哪些好奇？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

清華系團(tuán)隊(duì)做分布式預(yù)測(cè)世界模型、獲數(shù)億元A輪融資，落地終端設(shè)備達(dá)十萬量級(jí)｜硬氪首發(fā)

36氪 2026-06-10 09:39:06
0 跟貼 0
字節(jié)AI制藥開啟拆分融資 AI4S進(jìn)入產(chǎn)業(yè)化階段

財(cái)聯(lián)社 2026-06-10 14:16:08
0 跟貼 0

深挖產(chǎn)業(yè)鏈經(jīng)營(yíng)痛點(diǎn)，構(gòu)建標(biāo)本兼治的產(chǎn)業(yè)金融解決方案

財(cái)聯(lián)社 2026-05-19 04:21:58
0 跟貼 0

月薪3000富養(yǎng)貓狗，寵物經(jīng)濟(jì)有多瘋狂

華商韜略 2026-04-07 16:02:11
0 跟貼 0
李飛飛做AI游戲拿了4個(gè)億，像刷抖音一樣玩游戲

量子位 2026-05-09 18:53:55
0 跟貼 0

三次穿越產(chǎn)業(yè)周期，這個(gè)“賣水人”到底憑什么？

華商韜略 2026-05-22 19:14:50
0 跟貼 0

光輪智能CEO謝晨：具身數(shù)據(jù)金字塔的本質(zhì)是以仿真為中心的閉環(huán)

量子位 2026-04-15 07:59:18
0 跟貼 0
山東人的薩莉亞，一年爆賣20億！

華商韜略 2026-05-12 13:42:35
0 跟貼 0

潞晨尤洋談三類需要私有大模型的企業(yè)

量子位 2025-12-11 03:38:31
0 跟貼 0
車圈明星爭(zhēng)奪戰(zhàn)里，他為什么親自上？

華商韜略 2026-05-20 18:04:34
0 跟貼 0
馬拉松之神代言，這家乳企什么來頭？

華商韜略 2026-04-01 10:56:40
0 跟貼 0
不止一瓶好酒郎酒的全產(chǎn)業(yè)鏈共贏，才是真硬核

華商韜略 2026-04-30 19:23:14
0 跟貼 0
中礦資源集團(tuán)與津巴布韋礦業(yè)部深化交流合作

財(cái)聯(lián)社 2026-06-10 16:40:14
0 跟貼 0
永久免費(fèi)！美團(tuán)AI瀏覽器來了，10多個(gè)頂級(jí)模型幫你干活，還附送Agent外掛

智東西 2026-06-09 23:16:17
6 跟貼 6
美團(tuán)女騎手撞老人想跑路，路人仗義攔下女子，女子竟囂張叫囂不關(guān)

劉藏愛搞笑 2026-06-09 00:00:00
20 跟貼 20
活久見，時(shí)代少年團(tuán)給大模型上了一課

機(jī)器之心Pro 2026-05-09 12:48:20
1 跟貼 1
港股評(píng)級(jí)匯總：廣發(fā)證券維持美團(tuán)買入評(píng)級(jí)

財(cái)聯(lián)社 2026-06-10 15:14:40
0 跟貼 0
全球看中國(guó)，靈初智能用10萬小時(shí)人類數(shù)據(jù)寫下具身智能的中國(guó)答案

機(jī)器之心Pro 2026-05-14 12:44:08
0 跟貼 0
這邏輯沒一點(diǎn)毛病

奶桃影視君 2026-06-07 08:49:09
85 跟貼 85
新架構(gòu)模型HRM-Text創(chuàng)新紀(jì)錄!1B參數(shù)、1000美元,圖靈獎(jiǎng)得主都下場(chǎng)

機(jī)器之心Pro 2026-06-09 12:30:34
0 跟貼 0
最強(qiáng)Fable 5跨越神話時(shí)刻，但AI學(xué)會(huì)了自相殘殺！

新智元 2026-06-10 12:48:16
0 跟貼 0
呼吁美國(guó)放緩融資穩(wěn)定市場(chǎng)

中國(guó)李大霄 2026-06-09 19:35:29
1 跟貼 1
股民哽咽詢問比亞迪股價(jià)，王傳?；貞?yīng)

界面新聞 2026-06-10 13:35:07
1486 跟貼 1486
券商的重資本，應(yīng)該重在哪？增加新答案

財(cái)聯(lián)社 2026-06-10 10:20:05
0 跟貼 0
王石帶妻子參加會(huì)議，脖子上的紋身不一般，看來里面有乾坤??！

歡樂笑料站 2026-06-06 16:00:42
1 跟貼 1
SwarmFlow來了！openJiuwen開創(chuàng)蜂群可控協(xié)同新范式

機(jī)器之心Pro 2026-06-10 14:51:37
0 跟貼 0
藏不住了！Agnes免費(fèi)大模型實(shí)測(cè)：文圖、視頻樣樣精通

雷科技 2026-06-09 18:32:40
1 跟貼 1
不用一個(gè)字，MIT團(tuán)隊(duì)讓細(xì)胞自動(dòng)機(jī)教會(huì)了大模型推理

DeepTech深科技 2026-03-23 18:28:08
0 跟貼 0
奧特曼預(yù)言與現(xiàn)實(shí)相差幾何？12個(gè)頂級(jí)模型“創(chuàng)業(yè)”一年，僅3個(gè)存活

鈦媒體APP 2026-04-03 17:11:08
0 跟貼 0
盧麒元：終于拉爆了，有時(shí)候解決家務(wù)事需要外鬼

愛學(xué)習(xí)的小陸 2026-06-09 03:13:30
9 跟貼 9
長(zhǎng)沙“酒咕?！本扑赓u店售賣假軒尼詩(shī)被查，入駐美團(tuán)平臺(tái)

烈酒商業(yè) 2026-06-10 09:25:44
0 跟貼 0
匯通全球智創(chuàng)卓越｜第十四屆金融發(fā)展論壇暨卓越金融企業(yè)盛典啟幕在即

經(jīng)濟(jì)觀察報(bào) 2026-06-10 14:12:50
0 跟貼 0
馬云警告：新型第三者，正在批量破壞我們的婚姻！很多人渾然不覺

抽象老謝 2026-06-09 05:31:12
10 跟貼 10
藥明康德回應(yīng)被美國(guó)列入“中國(guó)軍工企業(yè)”名單：將立即采取措施挑戰(zhàn)及糾正這一錯(cuò)誤認(rèn)定

每日經(jīng)濟(jì)新聞 2026-06-09 18:58:29
2625 跟貼 2625
剛剛，Claude Mythos 5發(fā)布！5000萬行代碼1天搞定

量子位 2026-06-10 06:50:06
10 跟貼 10
我不信這雞湯

轂底草 2026-06-07 07:10:48
0 跟貼 0
普通人開始用不起強(qiáng)AI了

鈦媒體APP 2026-06-10 15:32:15
0 跟貼 0
董明珠是逆行者，大家贊賞的是本分的企業(yè)家

葉檀財(cái)經(jīng) 2025-12-17 19:14:36
49 跟貼 49
男人偷拍富豪賺外快這招太損了

小襪襪追劇 2026-06-10 09:51:51
1 跟貼 1
外賣缺少醬菜包商家爽快退款女孩吃完飯菜到店家吵架

直擊新鮮事 2026-06-08 07:27:33
94 跟貼 94

菲律賓慘敗聯(lián)合國(guó)！菲防長(zhǎng)：我們照收中國(guó)援助，但不對(duì)華緩和關(guān)系

菲律賓慘敗聯(lián)合國(guó)！菲防長(zhǎng)：我們照收中國(guó)援助，但不對(duì)華緩和關(guān)系

夢(mèng)在深巷aqa

2026-06-10 03:36:06

阿里重回大集權(quán)時(shí)代

阿里重回大集權(quán)時(shí)代

版面之外

2026-06-10 00:17:41

潑糞大戰(zhàn)+外掛火車，AI打造印度模擬器走紅，4天播放量直沖935萬

潑糞大戰(zhàn)+外掛火車，AI打造印度模擬器走紅，4天播放量直沖935萬

17173游戲網(wǎng)

2026-06-09 13:52:06

給所有男人一個(gè)忠告，不管女人多漂亮，一定不要暴露這三個(gè)秘密

給所有男人一個(gè)忠告，不管女人多漂亮，一定不要暴露這三個(gè)秘密

千秋文化

2026-06-09 23:00:09

0-0大冷！沙特隊(duì)逼平世界第14，世界杯小組出線有希望

0-0大冷！沙特隊(duì)逼平世界第14，世界杯小組出線有希望

何老師呀

2026-06-10 09:28:46

?；鶗?huì)董事長(zhǎng)蘇嘉全妄稱大陸選擇性“讀”與“回”，國(guó)臺(tái)辦回應(yīng)

海基會(huì)董事長(zhǎng)蘇嘉全妄稱大陸選擇性“讀”與“回”，國(guó)臺(tái)辦回應(yīng)

澎湃新聞

2026-06-10 10:52:26

突發(fā)！賭王女兒何超瓊套現(xiàn)46億走人！

突發(fā)！賭王女兒何超瓊套現(xiàn)46億走人！

財(cái)經(jīng)要參

2026-06-10 12:00:03

視頻丨存貸款利率時(shí)隔二十多年迎來大修對(duì)普通人將有哪些影響？

視頻丨存貸款利率時(shí)隔二十多年迎來大修對(duì)普通人將有哪些影響？

北青網(wǎng)-北京青年報(bào)

2026-06-10 09:00:04

全國(guó)最好吃10種下酒菜，你吃過幾個(gè)？最后一道讓無數(shù)老饕魂?duì)繅?mèng)縈

全國(guó)最好吃10種下酒菜，你吃過幾個(gè)？最后一道讓無數(shù)老饕魂?duì)繅?mèng)縈

阿龍美食記

2026-06-09 15:12:16

中國(guó)訪朝鮮！一趟低調(diào)的出訪，可能改寫東北亞的暗流涌動(dòng)

中國(guó)訪朝鮮！一趟低調(diào)的出訪，可能改寫東北亞的暗流涌動(dòng)

萬物知識(shí)圈

2026-06-09 16:48:14

王菲贏麻了！李嫣在巴黎被偶遇！高級(jí)美全網(wǎng)稱贊！養(yǎng)女兒她有一手

王菲贏麻了！李嫣在巴黎被偶遇！高級(jí)美全網(wǎng)稱贊！養(yǎng)女兒她有一手

樂悠悠娛樂

2026-06-09 15:03:55

為什么往死里掃黃？網(wǎng)友分享太真實(shí)了，一次說透

為什么往死里掃黃？網(wǎng)友分享太真實(shí)了，一次說透

另子維愛讀史

2026-05-27 20:16:03

直-21新照曝光，英國(guó)媒體感嘆：中國(guó)武裝直升機(jī)將領(lǐng)先全球了

直-21新照曝光，英國(guó)媒體感嘆：中國(guó)武裝直升機(jī)將領(lǐng)先全球了

瓦倫西亞月亮

2026-06-10 07:03:24

一部劇帶火一座廠，西安老軍工廠變身“工業(yè)秀帶”

一部劇帶火一座廠，西安老軍工廠變身“工業(yè)秀帶”

中國(guó)房地產(chǎn)報(bào)官方號(hào)

2026-06-09 10:11:11

厚顏無恥！關(guān)于澤連斯基的消息！

厚顏無恥！關(guān)于澤連斯基的消息！

故事終將光明磊落

2026-06-10 10:55:31

中國(guó)游客到朝鮮游玩，朝鮮人充滿疑問：為什么中國(guó)人是這樣的？

中國(guó)游客到朝鮮游玩，朝鮮人充滿疑問：為什么中國(guó)人是這樣的？

共工之錨

2026-06-10 00:25:42

公布個(gè)人手機(jī)號(hào)的原市委書記主動(dòng)投案，6天前還在主持工作會(huì)議

公布個(gè)人手機(jī)號(hào)的原市委書記主動(dòng)投案，6天前還在主持工作會(huì)議

大風(fēng)新聞

2026-06-09 21:20:08

油價(jià)調(diào)整：注意，預(yù)計(jì)下調(diào)250元/噸，油價(jià)保持下跌！

油價(jià)調(diào)整：注意，預(yù)計(jì)下調(diào)250元/噸，油價(jià)保持下跌！

金投網(wǎng)

2026-06-10 11:13:47

英超為本屆世界杯貢獻(xiàn)176名球員穩(wěn)居第一，中超入圍球員辣眼睛

英超為本屆世界杯貢獻(xiàn)176名球員穩(wěn)居第一，中超入圍球員辣眼睛

姜大叔侃球

2026-06-10 11:12:31

笑瘋了！女子嫌胸部太大，忍無可忍果斷縮胸，評(píng)論區(qū)太敢說了！

笑瘋了！女子嫌胸部太大，忍無可忍果斷縮胸，評(píng)論區(qū)太敢說了！

譚談社會(huì)

2026-06-08 11:58:48

讓最棒的創(chuàng)新成為頭條

12144文章數(shù) 78907關(guān)注度

往期回顧全部

財(cái)經(jīng)要聞

一紙研報(bào)引"光"速下跌 CPO落地節(jié)奏有變?

頭條要聞

16歲女孩前往醫(yī)院墮胎醫(yī)護(hù)人員懷疑其遭性侵強(qiáng)制報(bào)告

頭條要聞

16歲女孩前往醫(yī)院墮胎醫(yī)護(hù)人員懷疑其遭性侵強(qiáng)制報(bào)告

體育要聞

2026世界杯，我們看什么？

娛樂要聞

蒙淇淇發(fā)文開撕白鹿！輿論再次反轉(zhuǎn)

科技要聞

凌晨突發(fā)！Anthropic神級(jí)模型向你開放

汽車要聞

續(xù)航最高605km 吉利銀河星艦7 EV上市限時(shí)價(jià)9.98萬起

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數(shù)碼

時(shí)尚

教育

房產(chǎn)

公開課

數(shù)碼要聞

液冷穩(wěn)幀+海景側(cè)透：華碩天選7X高性能游戲主機(jī)解鎖全新電競(jìng)體驗(yàn)

頂流愛豆，怎么集體瘦成皮包骨了？

教育要聞

2026哈爾濱民辦小學(xué)首報(bào)結(jié)束，德強(qiáng)未能招滿？工附中簽率創(chuàng)新低？

房產(chǎn)要聞

再出新政！分化時(shí)代，廣州買房回歸“高確定性”！

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會(huì)要降低老年人門檻
為什么人類有不同的膚色？
七個(gè)無法存下錢的壞習(xí)慣
李彥宏：百度離破產(chǎn)30天

© 1997-2026 網(wǎng)易公司版權(quán)所有 About NetEase | 公司簡(jiǎn)介 | 聯(lián)系方法 | 招聘信息 | 客戶服務(wù) | 隱私政策 | 不良信息舉報(bào) Complaint Center | 廉正舉報(bào) | 侵權(quán)投訴

無障礙瀏覽進(jìn)入關(guān)懷版

<div id="vegb0"></div>