網易首頁 > 網易號 > 正文 申請入駐

姚順雨離職OpenAI,開啟下半場

0
分享至

為大模型開啟“下半場”的姚順雨,也開啟了個人AI的下半場。

就在最近,這位明星OpenAI華人研究員的動態,開始被火熱關注。

之前有人說他出現在小扎的必挖名單上,也有人最近爆料他即將加盟其他的巨頭——而且是中國科技巨頭,“轉會費”也有了驚人傳聞。以及還有一種說法,姚順雨選擇個人創業……(本文轉載自公眾號:量子位,作者:)

姚順雨去哪兒?還不知道。

但姚順雨離職OpenAI,得到了不同渠道的證實,只差個人官宣。

他似乎就此要開啟個人AI的下半場了。

這個剛剛29歲的年輕人,合肥一中畢業、NOI奧賽銀牌、高考704分以安徽探花進入清華姚班,最后在普林斯頓獲得計算機博士(語言和強化學習方向),畢業就加入了OpenAI……

而且更早之前,姚順雨就有著突出而知名的科研成果,比如:

  • 思維樹(Tree of Thoughts):讓LLM反復思考,大幅提高推理能力

  • SWE-bench:一個大模型能力評估數據集。

  • SWE-agent:一個開源AI程序員。

  • ReAct…

甚至還有超越年齡的哲思,一篇“AI下半場”的博文,在AI圈內外洛陽紙貴。

所以姚順雨,究竟是一個怎樣的年輕人?

姚順雨成長之路

在2024年剛加入OpenAI不久,姚順雨在一次采訪中推薦了一本書——《哥德爾、艾舍爾、巴赫:集異璧之大成》。

這部由人工智能先驅侯世達撰寫的經典著作,將哥德爾的不完備定理、艾舍爾的錯覺繪畫和巴赫的復調卡農巧妙融匯,展現了這些看似無關的元素如何在計算機的通用遞歸系統中彼此呼應,并留下了一句意味深長的話:覓之,便有所獲

正如這本書所啟發的那樣,跨學科的眼光與對復雜信息的開放態度,似乎貫穿著姚順雨的整個求學生涯,并逐漸形成一種個人的風格特質。

和所有的學霸一樣,姚順雨初中就讀于合肥最好的學校之一——合肥45中(2009—2012),初中畢業后升入合肥市第一中學

2014 年,他在全國信息學奧林匹克競賽(NOI)中以495分斬獲銀牌;次年高考以理科704分的成績位列安徽省第三,進入清華交叉信息研究院姚班,主修計算機科學。

而這看似“標準學霸”的開局背后,其實孕育著一顆不太一樣,甚至稍有反叛的氣質。

△來自清小華

姚順雨在采訪中透露,相較其他清華姚班的同學專注于一點,不斷深挖的品質,他更愛看很多數學,歷史,乃至種各樣亂七八糟的東西。

而他對嘻哈音樂的熱愛,也早已不是什么新聞。

艾米納姆、蛋堡、熱狗、Jcole等說唱歌手伴隨著他的初高中,而在清華他還是清華大學學生說唱社聯合創始人。

值得一提的是,在清華大學2019年各類型自主選拔復試的開營儀式上,姚順雨就給未來的學弟學妹們甩出了一句堪稱“freestyle”的理由,解釋自己為什么選清華:

但是對于我來說,選擇清華、北大并不是問題,因為北大沒有我姓氏命名的班級。

除了擔任說唱社聯合創始人外,姚順雨還擔任清華的招生志愿者和姚班聯席會主席。在談及姚班對他的影響時,他提到:

姚班很注重理論基礎課程的學習,像操作系統或電路設計相關的課,看上去和科研好像沒有任何關系,但是現在看來還是有些幫助的。它能使你對計算機科學的全貌有基本了解。

△(姚班合影,清華招生公眾號)

這種兼容各類信息、涉獵不同學科并從中尋找樂趣的跨界氣質,在姚順雨身上表現得尤為明顯。用以賽亞·伯林的話來說,他更像是一只“狐貍”,而不是一只“刺猬”,而這也體現在他后續的研究中。

(注:柏林的“刺猬”比喻那些專注于單一核心理念的人,他們把所有經驗都套用到這個中心觀點上;而“狐貍”則指那些涉獵廣泛、善于靈活應對不同問題的人,更依賴多樣化的策略和視角)

讓人頗感驚訝的是,在大三下學期之前,姚順雨既沒有接觸過AI,甚至連科研也沒有做過。

一次交換的機會讓他去了MIT,在此之后,他才開始跟著吳佳俊做一些計算機、視覺以及認知科學的研究。

姚順雨表示,在跟隨吳佳俊和學長Jun-Yan Zhu學習時,他不僅掌握了實驗、匯報等研究入門的基本功,更受到思想上的深刻影響,他由此認識到心理學與人工智能的交叉,學會了從更高維度和整體框架去思考問題。

結束姚班四年的學習后,2019年,他正式前往普林斯頓攻讀博士,跨界氣質再次顯現。

本科階段他主要研究計算機視覺,而博士階段,本來被計算機視覺方向錄取的他,卻因為興趣轉向,自行聯系了自然語言處理(NLP)領域的導師。最終,他因機緣巧合加入了Karthik Narasimhan的團隊,開始從事自然語言處理與強化學習的研究。

這等于是從視覺轉到了語言,但“覓之,便有所獲”。姚順雨在事后回想到,這種跨界也是他的幸運之處,因為彼時正逢GPT-2興起。因此,在博士的第一年,他就已經開始想著如何讓language model變成Agent.

而對(通用)Agent的關注貫穿著他的研究。

姚順雨博士生涯的第一個工作叫CALM(2020),研究如何用語言模型來作為Agent來玩語言游戲。

在CALM 中,語言就像媒介:它把人類經驗和語義模式轉化為可操作的動作候選,同時承載上下文信息,使智能體在龐大的動作空間中高效決策。

姚順雨表示,雖然這篇工作并不像swebench、ReAct或思維樹那么有名,但對他來說具有重要意義。

在張小珺的對談中,我們發現姚順雨對語言的關注早在這篇5年前的論文中就已萌芽。

  • 語言是人為了實現泛化而發明出來的工具,這一點比其他東西更本質。

換句話說,用語言來玩游戲是無限的,Agent可以憑借語言進行推理和組合,在不同的上下文中找到合適的動作,泛化就由此而來。

換句話說,Agent也需要具備“跨界”能力,而語言則是絕佳的媒介。

然而,姚順雨也意識到,如果沒有一個好的任務或環境,即使把“游戲”玩得再高分,也毫無意義。

基于這一思考,他的第二篇工作WebShop構建了一個大規模模擬電商環境,使智能體通過理解復雜文本指令,在網頁中進行導航和操作,從而推動語言理解與決策能力在真實世界任務中的應用與驗證。

同樣的,后來的經典工作SWE-BenchSWE-agent也是針對一個有意義的任務(現實編程)展開對Agent能力的驗證。

而當時間到了2022 年,GPT-3.5的出現改變了一切。

眾所周知,讓一張白紙反復試錯的效率極低,而在傳統強化學習中,這種低效嘗試卻屢見不鮮:智能體通常要么被限制只做單一任務,比如下圍棋,要么在龐大的動作空間中盲目探索。

GPT-3.5 讓人們意識到,之前缺失的是先驗知識:通過強大的語言預訓練,將常識和語言知識融入模型,再通過微調,它才能成為具備跨界氣質、擁有泛化能力的Agent。

正如姚順雨所說:如果你的Pre-Training(預訓練)已經包含了所有事情,那么RL(強化學習)只是激發出這些能力的skill(技能)。

在受到GPT-3.5的啟發后,姚順雨就做了ReAct(ReAct: Synergizing Reasoning and Acting in Language Models),讓大語言模型在與外部環境交互時,同時進行“推理”和“行動”。

姚順雨后來評價到這是他最喜歡的工作(也是他目前被引次數最高的工作)。基于此,他的研究逐漸轉向于兩個核心,一是怎么去做一些有價值、和現實世界更相關的任務和環境;二是怎么去做一些簡單、但又通用的方法。

不過,為了實現通用,泛化,必須學會推理。而語言模型剛好提供了一個足夠強的先驗(prior),這個先驗讓你可以推理,而推理又能在不同的環境間泛化。

于是,在GPT、思維鏈等工作的基礎上,思維樹(Tree of Thoughts, ToT)讓語言模型通過多路徑探索和自我評估,從而實現比傳統左到右推理更高效的復雜問題解決能力。

回顧姚順雨的求學與研究,不難發現,無論是他對通用智能體的追求,還是對語言作為認知與決策媒介的熱忱,都是對跨界思維與泛化能力的持續探索。

28歲的九局下半

相比于熱狗的23歲,28歲博士畢業進入OpenAI的姚順雨,才真正迎來自己的的“九局下半”。

2024年8月1日,姚順雨宣布加入OpenAI,一時間,說是萬眾矚目也毫不為過。

PS:在說到姚順雨與OpenAI的淵源時,一個不太冷的冷知識是姚順雨的導師Karthik Narasimhan是GPT?1第二作者。

在加入OpenAI的一年多時間,姚順雨最出圈的莫過于今年4月發表的博文《The Second Half》,宣告AI主線程的游戲已進入下半場。

(是的,AI也迎來了自己的九局下半)

姚順雨表示:AI發展分為上下兩階段。上半場以模型和方法為中心,核心構建了模型和訓練方法;隨著AI技術成熟,下半場的重點轉向如何定義有現實意義的任務、如何有效評估AI系統的表現。

新的評估應該貼近現實世界任務、優化模型配方解決任務,形成新的正向循環。

在這,我們不難看出姚順雨姿態的轉變:從專注求解的科研工作者,逐漸成長為善于發現需求的“產品經理”。

據剛剛曝光的一次與張小珺的訪談中,姚順雨也談到了創業的底層邏輯:

畢業前我想得多的是,怎么創造一個愛因斯坦?我那時是比較academia(學院派)的人——你在普林斯頓,你的偶像是馮諾依曼、愛因斯坦——很自然,能想到最有意思的任務是,我能不能發現下一個相對論?這毫無疑問能標志,AGI或ASI(超人工智能)實現了。后來,我到了硅谷,到了加州,進入公司之后,我發現人類的組織也是一個有意思的事情。如果能創造一家新的公司,創造一個one trillion dollar(一萬億美元)、基于Agent的公司,是很有意思的。

而當談到是否會出去創業時,姚順雨更是坦率地表示:OpenAI大多數人都會考慮創業。他需要去做更有挑戰的事情,去創業是很自然的。當然,還是應該找到一個好的事情。他喜歡把事情想得清楚一點再去做。

當然,從OpenAI離職也不一定非得創業,比如姚順雨的導師Karthik Narasimhan,就在OpenAI呆了一年后,選擇了離開,并去普林斯頓繼續象牙塔科研了。

如今,姚順雨加入OpenAI也過了整整一個年頭。

有爆料說“姚順雨上億薪資入職騰訊”,但被騰訊官方對外辟謠否認了。

還有一家全新的創業公司剛剛被注冊,法人代表正是“姚順雨”——

但目前依然難以確定這個“姚順雨”是不是就是我們談論的姚順雨,畢竟叫“堯舜禹”這種好名字的,僅僅AI領域,不止一位…

總之,祝福姚順雨開啟下半場。

參考鏈接
[1]https://openreview.net/profile?id=~Shunyu_Yao1&utm_source=chatgpt.com
[2]https://ysymyth.github.io/?utm_source=chatgpt.com
[3]https://x.com/shunyuyao12?lang=en&utm_source=chatgpt.com

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
車圈最卷的時候,有人開始做減法

車圈最卷的時候,有人開始做減法

虎嗅APP
2026-04-25 16:02:28
倆女子大鬧上海地鐵,拳打薅頭滿臉血,攔都攔不住,結局令人舒適

倆女子大鬧上海地鐵,拳打薅頭滿臉血,攔都攔不住,結局令人舒適

奇思妙想草葉君
2026-04-26 02:02:15
37歲男籃傳奇人物:定居廣東,身居要職財富自由,娶嬌妻生雙胞胎

37歲男籃傳奇人物:定居廣東,身居要職財富自由,娶嬌妻生雙胞胎

尋墨閣
2026-04-26 01:21:55
森林狼又傷一人:愛德華茲落地左膝過度伸展受傷 被隊友攙扶離場

森林狼又傷一人:愛德華茲落地左膝過度伸展受傷 被隊友攙扶離場

醉臥浮生
2026-04-26 09:48:54
首組2-2!尼克斯大勝老鷹進天王山 唐斯20+10+10布倫森19分

首組2-2!尼克斯大勝老鷹進天王山 唐斯20+10+10布倫森19分

醉臥浮生
2026-04-26 08:52:23
交警提醒:5月開始全國嚴查,這些行為一律扣分罰款,車主別大意

交警提醒:5月開始全國嚴查,這些行為一律扣分罰款,車主別大意

復轉這些年
2026-04-25 23:39:55
離譜到家!湖人G4故意輸球!?就為了這個...

離譜到家!湖人G4故意輸球!?就為了這個...

柚子說球
2026-04-25 21:20:46
百年品牌底蘊加持:別克至境E7如何填平中國家庭的新能源真空區

百年品牌底蘊加持:別克至境E7如何填平中國家庭的新能源真空區

大眾侃車
2026-04-25 18:32:13
震驚!東方甄選員工集體辭職要挾俞敏洪,被網友直言“蠢出天際”

震驚!東方甄選員工集體辭職要挾俞敏洪,被網友直言“蠢出天際”

火山詩話
2026-04-26 07:09:07
重返WNBA首秀!韓旭替補10中6轟20分全場最高 難阻自由人慘敗

重返WNBA首秀!韓旭替補10中6轟20分全場最高 難阻自由人慘敗

醉臥浮生
2026-04-26 05:35:45
長沙公園驚現 “老年服務圈”!低價剛需服務,姑娘邊服務邊嘮嗑

長沙公園驚現 “老年服務圈”!低價剛需服務,姑娘邊服務邊嘮嗑

社會日日鮮
2026-04-25 19:09:27
色情片并不可怕,但它會偷走你的“勁”,讓你做什么都索然無味

色情片并不可怕,但它會偷走你的“勁”,讓你做什么都索然無味

知識圈
2026-04-26 09:35:01
華晨宇哭了損失大了,在云南投資上億拿下地皮,如今緊急叫停

華晨宇哭了損失大了,在云南投資上億拿下地皮,如今緊急叫停

以茶帶書
2026-04-25 16:22:06
58歲江珊露面,150斤穿西裝腚大腰圓,但臉顯年輕幾乎沒皺紋

58歲江珊露面,150斤穿西裝腚大腰圓,但臉顯年輕幾乎沒皺紋

墨印齋
2026-04-24 16:43:38
誰把東方甄選的主播們逼走了? 俞敏洪一天損失四員大將!主播明明等發公開信直指新管理層“不友好”

誰把東方甄選的主播們逼走了? 俞敏洪一天損失四員大將!主播明明等發公開信直指新管理層“不友好”

新浪財經
2026-04-25 18:08:34
廣場舞噪音亂入!深圳一演唱會現場遭觀眾吐槽,官方回應

廣場舞噪音亂入!深圳一演唱會現場遭觀眾吐槽,官方回應

南方都市報
2026-04-25 15:33:03
因突發事件撤離晚宴后 特朗普發帖:已建議“讓活動繼續進行”

因突發事件撤離晚宴后 特朗普發帖:已建議“讓活動繼續進行”

財聯社
2026-04-26 09:36:05
女子深圳公交站臺勸阻男子抽煙起沖突,當地通報:責令男子改正,并處行政罰款

女子深圳公交站臺勸阻男子抽煙起沖突,當地通報:責令男子改正,并處行政罰款

封面新聞
2026-04-25 22:44:22
約基奇準三雙仍該批:決戰夢游輸殘陣狼隊丟賽點 引沖突慘遭驅逐

約基奇準三雙仍該批:決戰夢游輸殘陣狼隊丟賽點 引沖突慘遭驅逐

醉臥浮生
2026-04-26 11:23:37
補丁老頭掛專家號被嫌臟,次日院長晨檢看清長相瞬間哽咽

補丁老頭掛專家號被嫌臟,次日院長晨檢看清長相瞬間哽咽

星星會墜落
2026-04-25 20:02:10
2026-04-26 11:47:01
申媽的朋友圈 incentive-icons
申媽的朋友圈
關注互聯網大廠+職場
515文章數 39關注度
往期回顧 全部

科技要聞

漲價浪潮下,DeepSeek推動AI“價格戰”

頭條要聞

白宮突發槍擊案 250名記者聯名要求將晚宴變維權現場

頭條要聞

白宮突發槍擊案 250名記者聯名要求將晚宴變維權現場

體育要聞

那一刻開始,兩支球隊的命運悄然改變了

娛樂要聞

《八千里路云和月》大結局意難平

財經要聞

DeepSeek V4背后,梁文鋒的轉身

汽車要聞

預售19.38萬元起 哈弗猛龍PLUS七座版亮相

態度原創

旅游
數碼
教育
健康
公開課

旅游要聞

臺兒莊古城國潮文化季正式啟動 五一“入夢臺城”拉開帷幕

數碼要聞

華為MatePad Mini迭代版:OLED四等邊、5G、NFC全來了,沒短板了

教育要聞

壓軸出場的題目,很多小朋友都失分了

干細胞如何讓燒燙傷皮膚"再生"?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版