字節(jié) Seed 大模型人才外溢

2026-04-08 23:10:11　來源: 晚點LatePost

北京舉報

分享至

被動成為新一代 AI 黃埔軍校的字節(jié)跳動。

文丨申遠

編輯丨劉梓元

字節(jié) Seed 是對大模型人才最具吸引力的團隊之一，同時也有很多人正在離開字節(jié)跳動，最新一個目的地是騰訊。隨著騰訊重新整合大模型組織架構(gòu)，字節(jié)在 Infra 與數(shù)據(jù)方面的核心人員被招募，除了《智能涌現(xiàn)》報道過的肖學(xué)峰、張弛和黃啟，據(jù)悉還有負責(zé)數(shù)據(jù)處理的團隊被成批挖走。

這是騰訊在大模型領(lǐng)域的補課，在姚順雨入職之前，騰訊大模型業(yè)務(wù)分散在不同業(yè)務(wù)群，這種松散讓大模型研發(fā)的多個環(huán)節(jié)無法緊密銜接，導(dǎo)致訓(xùn)練數(shù)據(jù)質(zhì)量參差不齊、標注不規(guī)范，更重要的是底層工程能力欠佳。

這是字節(jié)的長處。曾有對字節(jié)模型基礎(chǔ)設(shè)施建設(shè)比較了解的人士表示，字節(jié)的工程化能力 “比國內(nèi)任何一家公司都要強”，這支精干的 Infra 團隊目前由項亮負責(zé)，他是一位已經(jīng)加入字節(jié) 10 年的老兵，早在這一輪 AI 浪潮之前，他就負責(zé)字節(jié)推薦算法研究。

大模型浪潮帶給人們一種錯覺，那就是大模型技術(shù)和過往算法有本質(zhì)不同，但實際上，這種本質(zhì)區(qū)別更多是思路上的而不是技術(shù)本身。經(jīng)驗仍然重要，特別是在基礎(chǔ)設(shè)施領(lǐng)域。大量搜廣推背景工程師正在大模型領(lǐng)域，而字節(jié)在此已經(jīng)有了十多年積累。正因如此，這成了外界挖人的重點領(lǐng)域——有這樣規(guī)模化豐富經(jīng)驗的人才實在是太少。

這樣的人員流動不僅局限在國內(nèi)，據(jù)晚點了解，在 OpenAI 和 Meta 的 Infra 團隊中同樣有前字節(jié) Infra 員工的身影。曾屬于 Infra 基礎(chǔ)設(shè)施方向重要成員的蔣子恒入職 Meta，早期曾在字節(jié) AML （Applied Machine Learning 應(yīng)用機器學(xué)習(xí)，字節(jié)負責(zé)搜廣推的核心機器學(xué)習(xí)平臺）工作的 Youlong Cheng 則加入 OpenAI。還有一位負責(zé)強化大語言模型訓(xùn)練擴展與加速的研究員據(jù)信已加入 Safe Superintelligence，后者由前 OpenAI 首席科學(xué)家 Ilya Sutskever 創(chuàng)建，有一支人數(shù)約為 50 人的精簡研究團隊。

字節(jié)的另一個優(yōu)勢領(lǐng)域視覺模型，同樣出現(xiàn)了批量人員流動。晚點此前報道過，視覺多模態(tài)生成負責(zé)人楊建朝、視覺基礎(chǔ)模型研究負責(zé)人馮佳時都已離職。馮佳時 2021 年從新加坡國立大學(xué)加入字節(jié)，坊間關(guān)于他的一個趣聞是在 ChatGPT 爆發(fā)后，馮佳時曾給張一鳴講解 AI 前沿技術(shù)，他的下一站同樣是騰訊。

從 Linkedin 上可以看到，海外大廠也延攬了不少字節(jié)視頻生成與多模態(tài)理解圖團隊的研究人員。包括在 OpenAI 語音和多模態(tài)方向的黃清清，Google Deepmind 多模態(tài)理解方向的 Chunyuan Li，Meta 多模態(tài)模型研發(fā)的喬思遠，以及曾在字節(jié)負責(zé)視頻模型生成的蔣路，現(xiàn)已入職蘋果。

視覺領(lǐng)域成為字節(jié)的模型長板并不讓人意外，更早之前從字節(jié)視覺技術(shù)負責(zé)人崗位離職的王長虎創(chuàng)立的愛詩科技剛剛完成 3 億美元的 C 輪融資，這是中國視頻生成領(lǐng)域最大的單筆融資。

除了 Infra 與視頻模型團隊外，事實上字節(jié)大模型人才的足跡遍布整個行業(yè)。DeepSeek 首位員工李宇琨來自字節(jié)搜索團隊，去年底離職的月之暗面強化學(xué)習(xí)負責(zé)人宋鴻涌，有近兩年時間在字節(jié)做游戲 AI 強化學(xué)習(xí)研究，階躍星辰聯(lián)創(chuàng)和 CTO 朱亦博，同樣也曾在字節(jié)從事 infra 相關(guān)內(nèi)容。

從技術(shù)到產(chǎn)品，大模型人才流失復(fù)刻了字節(jié)產(chǎn)品和運營人才出走的景象，投資人手里流傳著一本花名冊，上面涵蓋字節(jié)業(yè)務(wù)體系關(guān)鍵點位的負責(zé)人 —— 抖音、今日頭條、剪映和飛書的產(chǎn)品運營曾被認為是最具確定性的投資標的。前抖音產(chǎn)品負責(zé)人、PICO 副總裁任利峰創(chuàng)辦了數(shù)美萬物，Manus 的聯(lián)創(chuàng)之一是飛書海外產(chǎn)品負責(zé)人張濤，剪映商業(yè)化負責(zé)人陳冕創(chuàng)辦了 Lovart，以及曾一度在大模型六小龍任職的張心皓、張前川與明超平。

現(xiàn)在還要加上大模型從業(yè)者了，豆包 PC 端業(yè)務(wù)負責(zé)人齊俊元的創(chuàng)業(yè)項目，GUI Agent 智能終端投后估值達到數(shù)億美元，曾任字節(jié) AI 陪伴產(chǎn)品 “貓箱” 產(chǎn)品負責(zé)人的梁琛奇的創(chuàng)業(yè)項目也拿到了包括 IDG 和美團在內(nèi)的投資。

他們是字節(jié)人才外溢效應(yīng)囊括的最新群體。

極致執(zhí)行與飽和式出擊

三年前字節(jié)的 AI 還遠不是這番景象。昆侖萬維創(chuàng)始人周亞輝在 24 年初評價字節(jié)過去一年半的 AI 戰(zhàn)略是 40 分，但 9 個月后這個分數(shù)就變成了滿分。

這是一個非常 “字節(jié)” 的故事，尋找好想法，然后把它執(zhí)行到極致。過去十多年字節(jié)是這樣顛覆許多領(lǐng)域的，最開始是新聞資訊，然后是短視頻，再到小說和短劇，它們圍繞的重點無外乎兩個，極致用戶體驗，還有最高商業(yè)化效率。

“AI 是一個能影響世界的機會”，2023 年字節(jié)高層判斷，當下這個時代操作系統(tǒng)級別的機會就是 AI + 計算，這是一個怎么夸大都不為過的 “好想法”，因此，它需要字節(jié)執(zhí)行得更極致。在 2023 年中決定靠自有團隊做 AI 后，字節(jié)飽和式出擊，從算力芯片到云，從模型研發(fā)再到應(yīng)用。

應(yīng)用側(cè)很好體現(xiàn)了所謂 “飽和”，字節(jié)的布局堪稱一超多強。豆包的日活在 2025 年底已經(jīng)過億，穩(wěn)居第一，海外版 Dola 日活已經(jīng)過千萬。除了 AI 助手，字節(jié)還推出了 AI Coding 工具 Trae 和智能體平臺 Coze。

飽和出擊的另一個是發(fā)揮協(xié)同作用與規(guī)模效應(yīng)，這被寫進了 2025 年字節(jié)的 AI 目標中。字節(jié)有 50 多條業(yè)務(wù)線，在 AI 來之前，各個業(yè)務(wù)部門的孤立狀態(tài)正在形成，一個標志是招聘的停滯，2022 年，HR 被告知要控制組織增長的規(guī)模。All IN AI 很大程度上串聯(lián)起了字節(jié)的各條業(yè)務(wù)線，而大模型本來就是一個比移動互聯(lián)網(wǎng) APP 開發(fā)鏈條長得多的行業(yè)，受益最大的是云。

2020 年上線的火山引擎比主要的競爭對手晚了 10 年進入這個領(lǐng)域，很長時間都處于不溫不火的狀態(tài)。也正因如此，它成了最先最堅決轉(zhuǎn)向 MaaS（模型即服務(wù)）的云廠商，而飽和式投入 AI 給了火山引擎彎道超車的機會。

字節(jié)有中國最大的推薦算法模型，早在大模型時代之前，火山就有把數(shù)千張 GPU 做成單一集群的經(jīng)驗。火山引擎有專門團隊參與 Seed 模型研發(fā)，而產(chǎn)品部門開發(fā)的 AI 應(yīng)用都通過火山引擎調(diào)用自家的模型，這讓火山的 MaaS 服務(wù)在最初就有了規(guī)模效應(yīng)。

25 年火山引擎兩次上調(diào)收入目標，26 年 MaaS 收入超百億的目標也已經(jīng)再次上調(diào)。4 月，火山引擎宣布豆包大模型調(diào)用量超過了 120 萬億 tokens 每天，這個數(shù)據(jù)在去年 9 月還是 30 萬億，半年增長了 4 倍。

用人才而不是過去的成功經(jīng)驗，來解決 AI 的本質(zhì)問題

有些問題不是靠極致執(zhí)行和飽和式出擊就能解決問題的，在大模型的用戶體驗上，字節(jié)就遭遇了瓶頸，原有的方法并不完全奏效。

用戶反饋讓產(chǎn)品更好用這是基本的常識，字節(jié)過去的厲害之處是通過算法與產(chǎn)品設(shè)計讓這件事在不知不覺中最高效完成，產(chǎn)品從設(shè)計上就自帶數(shù)據(jù)反饋飛輪，每一次下劃、點贊和喜歡按鈕都在實時優(yōu)化推薦模型，隨著用戶規(guī)模的擴大，產(chǎn)品會更加了解用戶，字節(jié)和快手這樣的頂尖公司能把反饋壓縮到幾秒鐘內(nèi)，用戶下劃兩次就能遇到更符合自己口味的新視頻。

字節(jié)自己也確實想把這一點也復(fù)用在模型開發(fā)上。豆包 1.5 Pro 發(fā)布的時候官方宣稱：“依托字節(jié)在推薦、搜索和廣告領(lǐng)域的 AB Test 經(jīng)驗，構(gòu)建了基于大規(guī)模用戶反饋的閉環(huán)優(yōu)化系統(tǒng)”。

然而 “模型實際體驗” 和 “模型能力” 不是一回事。應(yīng)用體驗可以優(yōu)化，但模型在上線之后參數(shù)是固定的，用戶的反饋不能實時更新到模型中去，只能等待下一次模型訓(xùn)練。每次訓(xùn)練都是從頭來過，換句話說，移動互聯(lián)網(wǎng)時代字節(jié)最熟悉的那種產(chǎn)品飛輪效應(yīng)在大模型領(lǐng)域不存在。

同樣不存在的還有規(guī)模化效應(yīng)，App 的分發(fā)邊際成本為 0，但用戶和大模型的每一次互動都在消耗算力，這受制于物理規(guī)則、無法被平攤。

上述限制讓字節(jié)很難復(fù)制移動互聯(lián)網(wǎng)時代的成功。豐富的玩法和運營策略，以及大規(guī)模投流讓豆包在 2024 年底就成為了 AI 產(chǎn)品中的第一名，然而 2025 年春節(jié)，DeepSeek 橫空出世，它的成功牽涉了更本質(zhì)的東西：模型能力可以讓一個名不見經(jīng)傳的組織不花一分市場預(yù)算就蜚聲全球。實際上 OpenAI 也是靠同樣的邏輯，ChatGPT 爆火甚至讓它們內(nèi)部始料未及，這本是個實驗性質(zhì)更多的項目。

在用戶體驗飛輪并不能充分轉(zhuǎn)動的情況下，極致的商業(yè)化效率自然無從談起。最終，關(guān)于 AI 的競爭回歸原點，最樸素的基準只有一個，那就是模型能力。某種程度上，不管是大廠還是 “小龍”，所有大模型玩家位于同一起跑線。為此，字節(jié)成立一個內(nèi)部獨立的研究組織，Seed 正是字節(jié)人才外溢效應(yīng)發(fā)生的容器。

Seed 與 “最高 AI 人才密度”

Seed 最初是從字節(jié) AI Lab、AML 和搜索團隊等部門抽調(diào)人手組建的，它不屬于字節(jié)原有業(yè)務(wù)體系，從最初設(shè)計上就直接向字節(jié)集團管理層匯報。從一開始，字節(jié)就為 Seed 定了一個嚴格標準，保持戰(zhàn)略耐心，堅持不走捷徑（比如蒸餾現(xiàn)成的模型），而是聚焦基礎(chǔ)問題的本質(zhì)，拿出高水準的模型成果。耐心意味著堅定不移地投入，Seed 僅自有數(shù)據(jù)團隊就有近千人。

這種堅持很少出現(xiàn)在一個盈利性企業(yè)的內(nèi)部。25 年初，字節(jié)挖來了 Google 的吳永輝擔(dān)任一號位，他進一步細化了 Seed 的內(nèi)部結(jié)構(gòu)。Seed Edge 就是在這個時候提出的，它聚焦于需要長期攻關(guān)的 AGI 課題。Seed Edge 考核期是三年，相比之下 Seed 本身是半年，而一度堅定奉行 OKR 戰(zhàn)略的字節(jié)其他部門則是兩個月。

這種類似國中之國的架構(gòu)，目標是回歸字節(jié)價值觀 “始終創(chuàng)業(yè)”，而創(chuàng)業(yè)這個詞在字節(jié)的心目中和人才緊密相關(guān)。字節(jié)戰(zhàn)略部門的人士曾對晚點說過，張一鳴認為 “很多事表面上是戰(zhàn)略問題，本質(zhì)上是人才問題。” 而對處于創(chuàng)業(yè)階段的組織來說，對人才的如饑似渴非常重要。

Seed 恰好就是這樣饑渴的組織。23 年底開始，字節(jié)開始密集招人，最開始目標集中在高階人才。晚點曾經(jīng)報道過，當時許多頂尖論文作者都和張一鳴聊過，最終字節(jié)招募了來自 Google 的蔣路、面壁的秦禹嘉、零一萬物的黃文灝、智譜的丁銘，以及阿里通義千問模型的前負責(zé)人周暢。

周暢博士畢業(yè)就加入阿里，是達摩院內(nèi)部培養(yǎng)起來的應(yīng)屆生，離職時是通義千問的負責(zé)人，那是 2024 年中，一位接近周暢的人士告訴晚點，字節(jié)高層一對一和周暢聊過，表達了追求頂尖 AI 技術(shù)的決心，而字節(jié)在技術(shù)布局上的思路也和周暢的觀點更契合，他的研究興趣更多集中在視覺與多模態(tài)模型，而不是單純大語言模型，這恰好是字節(jié)擅長的領(lǐng)域。

除了高層人才之外，為了快速健全 Seed 架構(gòu)，字節(jié) HR 在招攬 AI 人才時甚至?xí)鄬捤傻嘏堪l(fā)放 offer，這是字節(jié)招聘的肌肉記憶。字節(jié)是組織成長最快的互聯(lián)網(wǎng)巨頭，人數(shù)達到十萬人用時僅 8 年，相比之下阿里是 19 年，騰訊則長達 23 年，訣竅之一就是開足馬力的 HR 體系，很長一段時間內(nèi)字節(jié) HR 的唯一工作就是招人，高峰時，字節(jié) HR 對中國最頭部 20 所大學(xué)核心專業(yè)的學(xué)生觸達率在 80% 以上。

2024 年 5 月，字節(jié)面向應(yīng)屆博士生發(fā)起 Top Seed 計劃，一年時間延攬 30 多名博士生，他們年薪可達數(shù)百萬人民幣。實際上，由于組織架構(gòu)相對獨立，即使沒有入選 Top Seed，相比字節(jié)其他部門，進入 Seed 依舊劃算，在 Seed 更容易獲得更高職級和薪水，甚至還有針對大模型人才發(fā)放的津貼，每月最高達 10 余萬。另外，字節(jié)還針對頭部高校提供 500 多個大模型相關(guān)的實習(xí)崗位。

這場劇烈的招聘行動持續(xù)了兩年，迅速提升了 Seed 的人才密度。MiniMax 創(chuàng)始人閆俊杰曾說，“客觀來說，字節(jié)的 AI 人才密度是最高的。”

人為什么離開？

高速成長的技術(shù)人才組織，往往伴隨著活躍的人員流動。一些人選擇離開，去探索新的可能性，這是 Seed 也無法避免的問題。

Seed 自成立以來一直在經(jīng)歷各種組織架構(gòu)調(diào)整，最初 Seed 只是吸收了 AI Lab 中做 NLP 自然語言處理的小組，隨后是視頻生成相關(guān)團隊，Seed 最終整合了原本分散在不同小組的視頻和多模態(tài)研發(fā)小組，負責(zé)人是前面提到的周暢。直到 2025 年底，AI for Science 、具身智能和 Reponsible AI 等小組才徹底并入 Seed。原 AI Lab 負責(zé)人，曾經(jīng)華為諾亞實驗室主任的李航退休返聘，向吳永輝匯報，而具身小組的負責(zé)人孔濤則在 2025 年中去職。

外部的競爭更加激烈，隨著越來越多大廠的加入，人工智能行業(yè)的人才流動速度顯著加劇。字節(jié)的大模型研究人員成為了絕佳標的，事實上幾乎每家公司的高級研究人員都遭遇過挖角，和移動互聯(lián)網(wǎng)時代不同的是，同樣的職位，對方能給出的薪資待遇往往是翻倍，職級也會升高一級不止，同時，目標人選越來越年輕。

對大模型行業(yè)來說，前沿研究人員的年輕化是一個普遍而明顯的趨勢，他們往往精力充沛，野心勃勃，極度自驅(qū)，“每個人都想成就一番事業(yè)。” 這個年齡區(qū)間甚至下探到了高中，月之暗面 3 月剛剛發(fā)表了一篇關(guān)于注意力殘差的論文，作者之一是只有 17 歲的高中生陳光宇。

字節(jié)恰好擁有許多年輕人，因此面臨更激烈的挖角。

重用年輕人是吳永輝的思路。2025 年初，吳永輝入職，他在內(nèi)部溝通時表示，加入字節(jié)的原因一方面是想做第一流的研究，同時也想打造第一流的 AI 研究團隊。對吳永輝看來，Seed 的人才供給已經(jīng)不是問題，但重要的是如何才能把人用好，于是解法順理成章變成了培養(yǎng)年輕人。

吳永輝到來之后，Seed 幾乎不再從外部招聘中高級技術(shù)管理者，而更多針對年輕人的計劃陸續(xù)出爐。去年 3 月，Top Seed 研究實習(xí)生計劃公布，最高薪資每天 2000 元，條件下探到本科生和高中生。今年 3 月，字節(jié)啟動最大規(guī)模實習(xí)生招聘，面向全球招聘 7000 人，研發(fā)崗位占比近 7 成，而 4 月 Seed 啟動了自己的校招計劃，打算招聘 100 名 27 屆畢業(yè)生。

在 Seed 官方對校招計劃的介紹中，畢業(yè)不到一年的校招生和尚未畢業(yè)的實習(xí)生都在深度參與核心模型的技術(shù)攻關(guān)，我們了解到，一位 2024 年從清華大學(xué)畢業(yè)的博士生現(xiàn)在同時向周暢和吳永輝匯報，Seedance 2.0 算法負責(zé)人就是 2021 年作為校招生入職字節(jié)的，他們正逐漸成為大模型研究的主力，與此同時，Seed 組織擴張階段結(jié)束，算法和工程技術(shù)人員穩(wěn)定在 1000 多人。

字節(jié)的野心

字節(jié)不是沒有意識到人員流失的問題。去年底，字節(jié)宣布在全球范圍漲薪，而針對大模型人才的豆包股同時曝光。這套虛擬股權(quán)激勵體系專門針對大模型人才，透過類似字節(jié)期權(quán)的回購機制，加強對人才的長期吸引和激勵。

但阻止人員流失更重要的或許是在選擇做一流研究組織和保證產(chǎn)出之間找到更為恰當?shù)钠胶猓@對每一個 AI 機構(gòu)來說都是挑戰(zhàn)，Google DeepMind CEO 德米斯·哈薩比斯（Demis Hassabis）曾說，希望組織同時有初創(chuàng)企業(yè)的專注活力以及學(xué)術(shù)界天馬行空的思維，在字節(jié)的語境里，或許還應(yīng)該加上一條，那就是同產(chǎn)品運營之間高效的銜接合作，盡管許多人都認為，高效是創(chuàng)新的敵人。

2026 年 1 月底，字節(jié) CEO 梁汝波在全員會上把 2026 年目標關(guān)鍵詞定為勇攀高峰，短期內(nèi)高峰指的就是豆包，在已經(jīng)取得 DAU 第一后，豆包的重中之重是 AI 模型能力要做到行業(yè)前列，并通過助手整合好已有的產(chǎn)品和服務(wù)。2 月，Seedance 2.0 震撼全網(wǎng)，似乎人員流失短期內(nèi)并沒有影響字節(jié)在視頻模型領(lǐng)域的統(tǒng)治力。實際上，就在那篇 Seed 校招的推文中，字節(jié)自豪地宣稱，“我們的 AI 業(yè)務(wù)在 C 端和 B 端均已取得領(lǐng)先優(yōu)勢。”

當一個組織人才密度足夠高、足夠龐大的時候，人才流動是不可避免的，現(xiàn)在 AI 競爭遠沒有到分出勝負的時候，旅程還在繼續(xù)。

題圖來源：《星際迷航》

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.