![]()
三年間,AI 研究員從年薪百萬漲到破億。
文丨陳佳惠 趙磊
編輯丨趙磊
在中國,年收入過億的人屈指可數。娛樂圈里,只有最頭部的流量明星能觸到這條線,即便是中國娛樂圈最鼎盛的 2017 年,在福布斯中國名人榜上,年收入過億的明星也就十幾個人。
2024 年,A 股 5400 多家上市公司中,董事長年薪最高的藥明康德李革只有 4180 萬,A 股董事長平均年薪僅為 133.94 萬元。而一半以上的 A 股上市公司,全年凈利潤還不到 1 億。
現在,一個新群體闖入了這個收入層級:大模型研究員。
在中國,傳言姚順雨以億元薪酬入職騰訊(后被公司否認),郭達雅以近億年薪(期權價值增長后的平均收入)加盟字節。在大洋彼岸,一些研究員的年薪超過 NBA 拿頂級合同年薪的勇士隊球星庫里,甚至超過了執掌蘋果多年的庫克。
三年前,AI 研究員普遍年薪百萬。到了 2024 年,少數人膨脹到千萬,如今極少數人能破億。
這個薪資膨脹速度比此前任何一個行業都快。2015 年的 O2O、出行大戰,2020 年的社區團購,以及后來的直播電商,都沒有如此瘋狂,字節、騰訊、阿里、DeepSeek、Meta、OpenA,國內外大廠同時在搶同一批人,總人數只有幾百人。
他們是這個時代的明星,被各家公司提前鎖定、天價簽約、競業隔離,甚至有人被前東家蹲守偷拍,只能戴口罩出門,流動上班。為了吸引他們,各家公司一號位親自下場,開出幾倍的薪資,許諾更大的管理權限和自由。
我們訪談了研究員、獵頭、大廠 HR、投資人,還原了搶人大戰的過程,以及中國最貴的幾百個人是如何誕生的。
大模型三年,研究員收入翻了 6 倍不止
2023 年,頂級 AI 研究員的薪酬不過上百萬。經歷了 ChatGPT 時刻的震撼后,中國一年內涌現出上百家大模型公司,但一年過去,市場情緒從狂熱轉向懷疑,一級市場融資降溫,二線大模型公司開始裁員收縮。
彼時大廠還處于降本增效的尾聲,對大模型投入有限。2023 年初,字節 Seed 團隊只有一兩百人,在內部是一個探索性項目;在騰訊,混元大模型團隊分散在 TEG 和各 BG,管理層的態度是 “不必沖在最前面”;而阿里云 2023 年換帥,通義千問團隊在達摩院和阿里云的組織調整中反復搖擺。這樣的情況下,研究員的薪資也在大廠正常的薪酬序列里,沒有額外的溢價。
以前大多數研究員的心態是,在大廠做研究、發論文、拿一個不錯的薪水,已經是很好的職業狀態了。但從 2023 年底開始,兩個代表性玩家率先攪亂了原本平靜的市場。
首先是成立不久的 DeepSeek。梁文鋒很早就意識到人才的重要性,當時已經在尋找最優秀的研究員,用高于市場的價格挖人,給研究員開更高的現金,不僅能覆蓋之前的總包,甚至部分可以有 30%-50% 的漲幅。但 DeepSeek 社招不多,以應屆生和實習生留任為主,其內部超 7 成的人是本科生和碩士生,對市場的影響有限。
真正讓水溫升高的是字節。2023 年底開始,字節后知后覺模型的重要程度,開始奮起追趕,飽和式投入。2024 年字節對基礎模型研發人才的招聘名額不設上限,從阿里通義、百度文心和月之暗面、智譜等團隊廣泛挖人,經常開出雙倍的薪資漲幅。
一個標志性的跳槽案例是 2024 年下半年周暢離開阿里加盟字節。八位數總包、4-2 職級,字節給的待遇十分優厚,他帶過去的幾個人都一起升職加薪。一位曾在 Seed 的人士告訴我們,周暢到字節后,迅速推動了多模態基模能力的提升。
到了 2025 年,DeepSeek 的爆火讓全行業意識到,極少數對的人能帶來顛覆性的結果。創業公司和騰訊等大廠也加大投入,重整模型團隊,搶人大戰再次升級,普通研究員開始有了八位數的 offer。
新的錨點產生后,行情迎來跳漲,有獵頭說,2025 年上半年,行情是按月在變的,“三月給的價四月就不夠用了”。
獵頭意識到招聘市場在變化的一個細節是,當時字節愿意多花比 2024 年還多出至少 50% 的溢價,吸引人才的加入。2025 年的 TopSeed 計劃(字節面向大模型領域前 5% 人才的 “頂尖 AI 研究人才專項”)可以給應屆生開出 300-500 萬的年包,2024 年只有 150 萬元。此時 DeepSeek 的薪酬仍保持著對人才的吸引,能開出僅現金就 300 萬的年包,還將內推成功一個研究員的獎金提高到 20 萬。
但總有后來者帶著更強的焦慮和更充沛的資金奮起追趕。在海外,這個角色是 Meta,扎克伯格在一個月之內,用 1 億美元從 OpenAI 挖角到了感知技術負責人余家輝;2 億美元從蘋果 AI 挖到了基礎模型團隊(AFM)的負責人龐若鳴;2.5 億美元(四年)挖到了 Vercept 天才創始人 Matt Deitke;給 OpenAI 的高級研究員更是開出了四年 3 億美元的薪酬,部分人第一年總薪酬可以達到 1 億美元。
在國內,這個角色一開始是字節,從阿里和百度挖人,后來又變成騰訊,從字節挖人。
2025 年下半年,騰訊一直大手筆地從字節跳動 AI 大模型團隊挖人,一出手就是高溢價,向頂尖研究人員開出至少雙倍薪資。
騰訊有個實用的策略:找到一些在 Seed 面臨薪資倒掛的老將,向他們開出極具誘惑力的 offer。“這些人在原來公司做了兩三年,但因為市場普遍職級體系膨脹,新來的人的薪資和他們差不了多少,甚至更多。這個口子,是最容易撬開的。” 一位獵頭說。
騰訊吸引到了不少人才。 Seed 視覺 AI 平臺團隊負責人肖學鋒,RL 負責人袁鈺峰,Seed Infra 成員張弛、黃啟——這些人陸續出現在了騰訊混元的組織架構里。
騰訊挖人的標志性事件是姚順雨的加入。入職時,他年僅 27 歲,沒在大廠待過,一畢業就去了 OpenAI,加入騰訊后直接出任大模型負責人,向劉熾平匯報。這不僅打破了大公司傳統的資歷、級別、年限體系,也傳遞出一個信號,中國公司從硅谷搶人,是必要的,也是可行的。盡管過億年薪的傳聞被騰訊官方辟謠,但這變成了一個新的參照。
一位獵頭告訴我們,2025 年下半年,越來越多的研究員愿意出來看看機會。此前他們還會帶著對現東家的 “某種忠心” 拒絕邀請,但騰訊和 Meta 的入場,讓他們不得不重新掂量自己在市場上的價值。
業內人士告訴我們,2025 年下半年 DeepSeek 就有部分人收到過 Meta 的邀請,開出了 “像網絡上傳的(數千萬美元甚至更多)那樣富有誘惑力的 offer”。
2026 年,郭達雅高薪加入字節,再一次打破了人們的預期。姚順雨的成長路徑是標準的精英通道,清華姚班、普林斯頓博士、OpenAI,做出過范式級別的學術貢獻,騰訊需要他的方向判斷力,在頂層重新設計騰訊的模型路徑。
郭達雅是中山大學博士,沒有海外經歷。他是 DeepSeek R1、Coder、Math 的核心貢獻者,他的定價邏輯與姚順雨不同,是按他已經創造的價值倒推出來的。
2025 年之前,“從 Google/OpenAI 出來” 是 AI 人才的最強背書。現在,“從 DeepSeek 出來” 成了同等甚至更強的履歷,因為 DeepSeek 團隊用極少的資源做出了世界級的成果,其 coding、infra、data 等方向的人才,都是各家最急需的。
為了爭搶郭達雅,阿里、騰訊、字節三家大廠先后行動,了解情況的人告訴我們,其中有兩家的老板親自去邀請他。阿里最早,給的現金更多,職權范圍更大;字節的期權部分更有吸引力,更重要的是,字節將重點投入 Coding Agent 方向,與郭達雅的想法更契合,“接下來兩年的發展最符合他預期”。
郭達雅的離開加劇了 DeepSeek 的人才流失壓力,也讓更多參與過大模型訓練的研究員開始重新衡量自己的價值,行業內人心浮動。
社招薪資或許因人而異,校招更能反映市場行情的變化。2023 年,頂級 AI 研究員校招入職字節,年包在百萬左右;到了 2025 屆,字節的頂尖人才招聘計劃 TopSeed 可以開 300 萬-500 萬;2026 屆,字節取消了校招生 TopSeed 的標簽,提高了人才招聘的標準,開出更高的薪資吸引人才,某些崗位核心的校招生可以開到 600 萬,部分人能開更高。同期,Seed、Kimi、騰訊混元少數的實習生也能拿到 300 萬的薪資。
短短三年,研究員的薪資翻了 6 倍不止。
只有幾百人,怎么拉攏都值得
訓練一個大模型的成本,包含幾個部分:算力、數據和人。
訓練投入是最大的。Anthropic CEO Dario Amodei 在 2024 年預測,正在訓練中的模型耗資已接近 10 億美元,2025 到 2027 年將出現 100 億美元級的訓練。
而維持模型運轉同樣昂貴,OpenAI 2024 年僅推理服務就花了近 40 億美元。訓練加推理,OpenAI 一年燒掉約 70 億美元算力費用。在這場 AI 競賽中,算力投入已經膨脹到百億美元量級,而且每年還在以成倍的速度增長。
一位業內人士告訴我們,一個靠譜的 Infra 人才,能提高算力利用率多達 50%。“即便已經開源了,到現在為止很多二級算力提供商,也無法把 DeepSeek V3.2 優化到官方宣稱的水平。”
不止 Infra。在大模型的訓練流程的關鍵節點上,一個足夠聰明、有研究品味(taste)的人,能把整條鏈路的效率拉升一個數量級。關于 Loss 曲線在某個點突然抖動的歸因,不同的人會有不同的判斷。這個判斷引發的決策分歧,可能讓兩個團隊在幾個月拉開巨大差距。
對公司來說,模型率先突破某個能力閾值——比如可靠的代碼生成、穩定的多步推理——它就能率先切入商業場景,一旦成功建立用戶習慣,后來者很難撬動。
模型能力的代際差距在商業端被急劇放大。Anthropic 的 Claude Code 幫助公司 ARR 從 2025 年底的不到 100 億美元飆升到接近 300 億美元;而同期 OpenAI 的 ARR 增速只有約 25%。兩家公司模型能力只差三個月,但商業價值可能差好幾倍。
因此,對大廠來說,時間是比金錢更重要的成本。大廠們能做的,就是把市場上最聰明的這批人,用盡一切手段鎖在自己這里。
全球能真正推動大模型進步的研究員有多少?多位業內人士給出的估算都比較一致,只有幾百人。
他們的畫像是這樣的。首先是天才,市場上公認最值錢的那批人,往往有類似的經歷:高中階段打過數學、信息學競賽,拿過獎項,憑此保送進了清華或北大。DeepSeek 內部有很多奧賽(或者其他競賽)金銀牌,保送清北的學生,有些還沒畢業,甚至放棄讀博,就出來工作。另一條路徑是,各大名校的少年班,保送高校,本科畢業后在 UC 伯克利、CMU 等國際高校進修,之后加入谷歌、OpenAI、Anthropic 等海外大模型公司,參與過模型訓練。
除了天才以外,人才第一梯隊里被反復搶的,還有那些在出身上疊加了研究成果的人。比如,DeepSeek 和 Seed 基模組的核心研究員。對現在的市場來說,從 0 到 1 做過模型訓練,或者在一個成熟團隊里主導過有外界認可度的技術迭代,在圈子里也是 “硬通貨”。
再下一個梯隊的人才,是在中國 C9 院校的本碩博,或者在新加坡國立、港中文這類學校讀 PhD,能拿到 TopSeed 或阿里星這類頂級項目認證的人。他們和有過模型訓練經驗的人才都屬于這個梯隊。
儲備人才方面,整個清華大模型相關專業——計算機系、電子系、自動化系和交叉信息研究院——每年本科生大約 700 人,超過 80% 選擇深造。他們在校招時競爭力最強,是中國大模型研究的人才基本盤。
天才們能拿到的是大幾千萬人民幣甚至過億的薪酬包,各大模型公司的核心研究員們也能拿到千萬,再往下的儲備人才和普通研究員,基本都能拿到幾百萬的 offer。
這些天才在校期間,或者工作初期就有大把的投資人、獵頭建聯。一位關注 AI 的投資人告訴我們,他認識大部分知名 AI 相關實驗室的學生。
大模型領域比較受關注的教授以及實驗室,語言模型有清華大學朱軍、唐杰、劉知遠、黃民烈等老師的學生,北京大學 NLP 實驗室;語音領域有西北工業大學謝磊教授的團隊,香港中文大學的語音大模型實驗室、中國科學院的聲學研究所等團隊;多模態模型是香港中文大學的 MMLab、復旦大學視覺智能實驗室、浙江大學的 CAD&CG 實驗室,以及姜育剛教授的團隊。
他們也會早早被 VC 或者 FA 鎖定,給出類似 “只要你創業我就會給你拿一筆錢” 的承諾。
但天價薪酬有時也會失效。在有限供給下,薪資只是一個起步門檻,業務方向、項目的重視程度、團隊人才密度、算力資源等,同樣在天平上。
2025 年底,OpenAI 首席研究官 Mark Chen 在播客中透露:扎克伯格為了從 OpenAI 挖人,親手煲了湯,親自送到研究員家門口。扎克伯格還建了一個 WhatsApp 群叫 “Recruiting Party”,在群里協調挖人目標名單。對于他認為重要的候選人,他會親自發消息,請求 “聊 15 分鐘”,然后邀請對方到帕洛阿爾托和太浩湖的私人別墅吃飯。僅在 Google DeepMind 一家,他就給數十名研究員發過這種消息。
從 2023 年四季度開始,有投資人發現,字節跳動創始人張一鳴開始頻繁約見 AI 研究者,并循著 AI 方向的論文一對一拜訪作者,其中還有未畢業的博士生。
這個極端稀缺的市場里,CEO 們的行為模式是趨同的:面對一個市場上只有幾百人的群體,傳統的招聘流程、薪酬體系、組織層級全部失效,只剩下人與人之間最原始的說服方式。
激進挖人,讓對手失守
這個極端稀缺的市場里,各家的搶人策略出現了明顯分化。
一位獵頭把這件事說得很直白:“你以為大廠在招人,其實是把對手能用的人,從市場上提前清掉。” 一個明顯的例子是,最近大公司們對天才的渴求不再像以前那樣強烈,但面向 2027 屆的秋招啟動時間,反而比往年同期更早。
在人才金字塔頂端,中國做大模型公司的核心研究員大概有 500 人。除了他們,一線團隊現在想要的是 “打娘胎里就開始做 AI” 的那批人,本科就進實驗室,博士期間參與過訓練流程,或者有明星 paper 的人。有限供給下,有人多自然就會有人少,各家要比拼的是出手的速度和投入的決心。
字節曾是幾家國內公司中行動最快、投入最大的那家。2023 年成立,三年時間,字節負責大模型研發的部門 Seed 就從最開始的一兩百人團隊,到近期 1300 人的規模,膨脹了接近十倍。
字節對人才的爭搶也是系統性的。從張一鳴到技術 leader 再到 HR,整個組織都有計劃地分類招募不同等級的人才。蔣路、黃文灝、周暢,以及近期加入 Seed 的郭達雅,背后都有最高層的直接參與。
多位獵頭告訴我們,字節不只想要對應崗位的人,還想要全世界最聰明的人。這家公司肯為好人選開綠燈,因人設崗常常發生,先把人搶過來,再給他找位置。
搶人大戰中,Seed 和 Deepseek 是出手最果斷的兩家。他們不僅有經驗辨識好的人選,也更清楚一個人選的價值,可以優先出價。而后面出價的人,面臨的是 “我要比上一個高多少才有競爭力”。
騰訊在一段時間內被迫成為后出價的人,要付出更高的溢價爭搶人才。2025 年,意識到模型層面的落后,騰訊的方式是不惜成本地挖人,要在最快時間內建立起一支能打仗的隊伍。
過去一年,字節 Seed 有近 30 名成員加入騰訊。據了解,原 Seed 視覺 AI 平臺團隊負責人肖學鋒,入職后加入 AI Infra 部,負責多模態推理相關工作,向姚順雨匯報。訓練 Infra 組負責人黃啟來自 Seed;RL Infra 組負責人張弛 2025 年底從 Seed 離職后加入騰訊,直接向姚順雨匯報;大語言模型部的 RL 算法組負責人袁鈺峰,同樣從 Seed 挖來。
原 Seed 視覺基礎研究團隊負責人也在 2025 年下半年加入了騰訊 AI Lab,近期隨 AI Lab 組織調整轉入大語言模型部,當前向姚順雨匯報。這位負責人 2021 年從新加坡國立大學加入字節,在多模態領域是全球知名的研究科學家,曾是字節 TopSeed 人才計劃的導師。
騰訊從 Seed 集中挖人的意圖也比較明確:補齊訓練平臺、推理系統和強化學習框架等底層能力。尤其是 Infra 能力,字節 Seed 的 AI Infra 能力曾被其內部高層認為是國內領先水平,騰訊儲備的算力不足,定向挖有經驗的人成了短時間內的最優解。
“騰訊不會錯過誰。” 一位獵頭評價騰訊的招聘策略。為了追趕,騰訊會以廣撒網的方式搶奪人才,對人才的要求最早也沒有 Seed 和 DeepSeek 那么高,一些研究員甚至會在拿到 Seed 的 offer 后,轉頭去跟騰訊要更高的薪酬。
相比之下,阿里 Qwen 在搶人這件事上比較保守,更傾向于通過校招內部培養。過去通義實驗室下屬的 Qwen 團隊,以氛圍好著稱,90% 都是阿里自己培養的校招生,各個環節之間合作緊密。他們和字節一樣,沒有職級、沒有 OKR,研究員可以專注于自己的事情。當時林俊旸領導下的 Qwen 也不過 100 人左右,人少,對研究員來說 Scope 大,且會公開發布技術報告,向外界展示成果。
但阿里嚴格的職級體系也給人才招聘制造了障礙。原 Qwen 負責人林俊旸是 P10,其他負責人 P9、P8,在社招時只能招對應 P6 或者 P7 職級的人才。此時,Qwen 的研究員去 Seed,一般來說職級上至少升 2 級。晉升難,薪資和職級嚴格掛鉤, Qwen 一度面臨人才流失。
2024 年 7 月,周暢從 Qwen 離職并簽署競業協議。兩個月后他加入字節,從事大模型相關工作。阿里遞交了勞動爭議仲裁申請。這是這場人才大戰中最早引起公眾關注的競業糾紛之一。
周暢離職后,阿里高層給 Qwen 大多數成員升了一個職級,附帶提高激勵,但也只是亡羊補牢。Qwen 也一直在向阿里高層爭取和行業同水平的人才激勵。2025 年下半年,林俊旸曾讓 Qwen 研究員主動出去面試,以求到漲薪的機會,避免人才外流。直到 2026 年 3 月,林俊旸本人也離開了阿里。
除了大廠,AI 初創公司同樣是這場博弈中激進的買家。有創業公司愿意為研究員開出高額純現金的薪酬包,來吸引核心人才加入。
目前,這場大戰已經變成了一個混亂的漩渦,幾百人在幾家公司來回流動。
DeepSeek、Kimi 等還沒上市的創業公司失血,研究員流向字節、騰訊、小米等大廠;Seed 內部競爭激烈,過去一年至少流失 70 人,同時又從 DeepSeek 和阿里定向挖人;Qwen 內部經歷人才與組織的摩擦,和管理的陣痛,一部分人去了字節、騰訊和創業公司;而騰訊暫時成為最激進的買家,從國內外同時挖人,想快速趕上大模型第一梯隊。
比搶人更難的是留人
在這場天才的爭奪中,對公司來說,留人的成本和挖人的幾乎一樣高。一貫用純現金薪酬吸引人才的 DeepSeek,在智譜和 MiniMax 上市后,吸引力有些失效了。
智譜和 MiniMax 相繼上市、股價高漲,期權價值膨脹接近 10 倍;階躍星辰、Kimi 的 IPO 也提上了日程。對于創業公司來說,留人的最大籌碼就是上市后手中期權的暴漲,以及上市后長達半年到一年的解禁期。因此目前,智譜和 Minimax 的人才流失壓力不大。
但 DeepSeek 不是。DeepSeek 此前沒有估值,也沒有明確的融資計劃,員工手中的期權無法流通,也沒有可預期的變現方式;且 DeepSeek 期權歸屬期很長。一般公司的期權全部歸屬年限是 4 年。
梁文鋒重新接洽投資方,融資、估值,給員工們更強的確定性。2025 年秋天開始,DeepSeek 開始做更多產品化和商業化方面的布局。梁文鋒多次在全員會上提及上市,和員工同步融資、估值計劃。最近的消息是,DeepSeek 的首輪融資,計劃融 500 億元,梁文鋒個人出資 200 億,投后估值或超 3500 億元,目前這輪融資還沒有最終敲定。
同期,沒有上市計劃的字節也多次提高 Seed 部門成員激勵,避免人才外流。2025 年 9 月,字節為 Seed 部門單獨發了一筆期權津貼:按績效和職級不同,每人每月可獲得價值 9 萬、11 萬或 13.5 萬元的字節期權,首批連續發放 18 個月——按 1300 個正式員工,金額取最低 9 萬,字節投入了超 過 20 億的成本留人。
除此之外還有豆包股。豆包股是去年 10 月字節內部為豆包相關大模型業務建立的一套虛擬股機制,通過為員工發放虛擬股權,激勵、穩定人才。員工入職字節總包有很多部分,現金、期權、豆包股、簽字費,與未來激勵相關的還有項目獎、績效獎、創業激勵等。
入職騰訊的總包雖然沒有這么復雜,包含常規的現金、期權、簽字費,但騰訊一般會用簽字費補全和其他家浮動的金額;阿里也有相應的激勵,且 P9 以下直接發放現金吸引人才。知情人士告訴我們,曾有 P8 向通義高層提出離職,阿里為了挽留人才,當即承諾給人晉升,以及發放接近百萬的現金獎勵。月之暗面也在今年初推出新的頂尖人才校招計劃,直接授予尚未畢業的實習生公司期權股數。
即便如此,還是不斷有人離開,只靠錢有時候也留不住人,還要靠制度和文化。
公司們通過各種協議,層層設卡,讓這些跳槽的研究員付出更高代價。競業協議是最常用的手段。研究員離職后 6 到 24 個月不能加入競對,有些公司雖然會幫忙承擔違約金,但對大部分普通研究員,這還是比較有效的限制手段。從全行業來看,一個顯著的變化是,2023 年,競業協議還未覆蓋基模團隊所有成員;到 2025 年,進入基模訓練流程的每一位入職員工都必須簽署。
近期字節還要求員工簽署脫敏協議,提出離職申請的員工需要繼續待在公司 3 個月才能離開。據了解,這也是行業普遍存在的現象,騰訊也在推行。這在以月為單位變化的模型領域,對員工來說是巨大的機會成本。
除了這些,大模型研究員們在意的還有:和誰一起工作、做的事有沒有意義、有沒有自由。
各家都在調整組織形態來匹配這種需求。大公司取消 KPI/OKR,弱化職級,組成項目制,甚至實習生也能直接與最高層交流。
《海外獨角獸》在文章里統計,研究員入職 Claude Code 母公司 Anthropic 2 年后還在的比例是 80%,是當時頭部 AI labs 里最高的,超過 DeepMind 的 78%。CEO Dario 會花 30% 到 40% 的時間確保 Anthropic 的文化是好的。
DeepSeek 曾用 “不融資、不商業化、只做研究” 的敘事吸引了一波行業內最頂尖的天才。他們人少,每個人的權限足夠大,展現出了少數好的人能帶來 “突破性” 成果的可能性。
隨著人數的變多,“天才的想法” 也成為組織熵增的一大來源。“他們從前是自己領域內的 ‘小霸王’,帶著 ego 來到 Seed,每個人都想成就一番事業。” 一位 Seed 人士說。我們此前提到,Seed 會出現一種情況:幾個研究員決定自發研究一個方向,如果上級不同意、不分配資源,他們可以上升匯報,得到認可后,就可以從上到下推進。
天才們有自己對這個領域走向的判斷,這些嘗試有時候和公司的商業利益完全不相關。過去這是一些大公司能承受的損耗。但行業內明顯的感知是,模型的技術路徑在收斂,很多人擔心行業對創新的需求不那么高了。搶人大戰或許很快會迎來轉折點。
努力變得值錢,同時付出代價
這個行業里的人才,放到任何別的地方都是被仰望的天才。他們聰明、有能力,名校畢業、頂會論文、有扎實的工程能力——這在大多數行業,足以讓他們成為組織里的焦點。
當全世界最頂尖的人同時涌入同一條賽道,天才和天才之間的競爭,就成了神仙打架,天才們需要用更多的努力去證明自己的身價。
對大模型研究員來說,最直接影響自己身價的,是自己的研究成果會不會被看到。一位招聘從業人士告訴我們,研究員的 “定價”,是根據 “AI native” 的程度,學歷背景、論文情況、項目經歷都有影響,面試更多是增量信息和薪資談判。
一個典型例子是,DeepSeek-V4 技術報告公布后,有公司的高招人士、獵頭,連夜根據 V4 列出的核心貢獻者 “按圖索驥”,尋求聯系。去年 3 月,吳永輝剛接管 Seed 基礎研究不久 ,曾在部門全員會上提到,Seed 做了很多不錯的工作,但外界不太了解,他鼓勵研究者以論文和博客的形式發表成果。“他還建議大家 ‘裝修’ 下個人主頁。” 一位曾在 Seed 的人說。
根據我們初步統計,吳永輝加入 Seed 之后的三個月,該團隊發布的論文數量就超過 2024 年全年。但后來由于人才競爭太激烈,對外的展示逐步減少。目前,各家公司都盡可能保護核心研究員的信息,讓他們減少和外界溝通,防止被對手挖角。
但對研究員個人來說,代碼不開源,論文不發表,成果就只存在于公司內網。且技術迭代太快,幾天之前還很新的進展,一周之后就被新的成果淹沒了。
越來越多人主動做起技術 PR,這成為大多數 AI 領域的博士生,和開源模型研究員們工作生活的一部分。2025 年,從 “Ask me Anything”,到技術問題、論文解讀,再到研究困惑、行業見解,越來越多的研究員開始在小紅書、推特等平臺運營自己的賬號,盡管此前他們從不在社交媒體發言。
“技術需要 PR。” 一位研究員告訴我們,“對做開源模型的公司來說,兩個技術實力相差不大,但其中有位自帶流量的技術 Leader,公司會更偏向于要后者。” 頂流研究員能給一家公司帶來更多曝光和機會。
研究員們拿著和流量明星幾乎同水平的工資,工作內容也越來越像流量明星:工作,為自己 “打歌”(做技術 PR);他們接受播客的采訪,發表自己的觀點,甚至 “發瘋”;也像流量明星一樣,花時間思考受眾喜歡看什么樣的內容。學術會議后,研究員們應邀參加大公司的宴會,在米其林菜品前談論技術進展。
甚至他們的日常生活都變得像明星,要隨時保護自己的個人隱私。有些研究員因為競業失去自己的名字,為了避免前公司聘請的私家偵探在他們可能入職的公司門口拿著相機偷拍,他們不得不換上全新的手機號、微信號,帶著口罩、墨鏡出現在公司,有時還會流動辦公,沒有自己的工位。
問題在于,研究員的工作強度更高,甚至職業周期可能還不如流量明星。一位大模型研究員告訴我們,他們的工作常態是 10116(10 點上班,11 點下班,一周工作 6 天),但他只是實習生。正式員工熬夜到兩三點是常態,從前工作比較多的時候也會通宵,“2023 年那會經常三天睡兩覺”。
公司為了留住他們,提供充足的資源,足夠的權限,不設 KPI 和 OKR 。天才天生自驅,他們需要超越同行來證明自己。激烈的競爭中,總有人會被淘汰。“有明星 paper,做過核心項目的,職業周期可能長一些,1 年以上;一般的研究員 3 個月不出成果,可能就要面臨認知過時的質疑了。” 一位研究員說。
xAI 是一個典型樣本。馬斯克給研究員們發足夠多的錢。早期,員工晚入職一天就可能錯過百萬美元的收益。但入職后,員工處于高壓狀態:每兩周匯報一次成果,沒有產出的人隨時會被辭退。
不到一年,聯創出走,團隊核心成員接連離職。xAI 說明一件事,當人們做事的追求,從 “把這件事做好”,悄悄變成了 “我做什么,才能在這兒多待一周,拿到更多的錢”,這對需要長周期積累的基礎研究來說,無疑是一種損傷。
2026 年初,一位一線團隊核心研究員告訴我們,Agent 的能力不斷延伸,他們的團隊正在焦慮未來可能會被 AI 取代,但他們不能停止研究的步伐。另一位研究員也告訴我們,Coding Agent 已經能幫助他做 90% 執行的工作,他每天需要做的事情是給這些 Agent 下達清晰、高質量的指令。
“這個行業最終會變成,前 5% 的人拿著從前 10 倍的工資,干著 100 個人的活。” 一位研究員說。技術正在服務越來越多的人,但獲得高額收入的人卻越來越少。隨著技術路線收斂,創新的需求降低,大多數研究員會回歸普通工作。
窗口不會永遠都開著。
司雯雯、申遠對本文亦有貢獻
題圖來源:Billions
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.