![]()
![]()
出品|搜狐科技
作者|常博碩
編輯| 楊 錦
硅谷的AI圈里,有兩個名叫“Yao Shunyu”的年輕人。一個是前OpenAI成員、現(xiàn)騰訊首席AI科學(xué)家姚順雨,執(zhí)掌騰訊混元大模型。另一個,則是本科畢業(yè)于清華基科班、在斯坦福斬獲高能物理博士,從Anthropic的強(qiáng)化學(xué)習(xí)核心團(tuán)隊又去Google DeepMind的姚順宇。
近日,姚順宇接受了一次公開訪談。在將近四小時的訪談中,他解構(gòu)了前沿AI實驗室的技術(shù)泡沫、硅谷大公司的組織架構(gòu),以及那個正在遠(yuǎn)去的個人英雄主義時代。
姚順宇稱自己是一個“著名的悲觀主義者”,在他身上,我們還能看到一種不依附于任何學(xué)術(shù)門閥、隨時準(zhǔn)備自我折磨與自我顛覆的反叛精神。
![]()
“光腳不怕穿鞋”的“Underdog”
姚順宇出生在寧夏一個因煤礦而存在的小城市——大武口。直到小學(xué)后半段,他才隨父母舉家搬遷到了上海。
“我小時候挺菜的。”姚順宇回憶,自己讀的初中上南中學(xué)東校完全是個無名之輩,整個大環(huán)境比較躺平,競賽這類詞匯在當(dāng)時根本不在他的考慮范圍內(nèi)。中考前,上海的高中實行預(yù)錄取制度。面對當(dāng)時高高在上的“四大名校”,他做出了人生中第一個令人費(fèi)解的決定,放棄名校普通班,義無反顧地去稍遜一籌的格致中學(xué)競賽班。
他喜歡當(dāng)一個“光腳不怕穿鞋”的“Underdog(不被看好的弱者)”。
“我這個人的個性就是總是愛干一些自己不太會的事”,他喜歡困難帶給他的興奮感,也喜歡和自己較勁,“我之前從沒搞過競賽,但我覺得沒干過,一定要找機(jī)會干一下,因為它難。”
在競賽保送制度開始銳減的當(dāng)年,他沒能殺入國家集訓(xùn)隊。高三那年,姚順宇陰差陽錯地參加了清華大學(xué)的一個夏令營,偶然得知學(xué)校正在搞針對北京學(xué)生的自主招生。一個上海的高中生,突發(fā)奇想地開始給清華招生辦老師瘋狂發(fā)短信:“你給北京的同學(xué)考,為什么不給上海的考?大家都在一條線上進(jìn)行競爭。”
這種“光腳不怕穿鞋”的精神,竟然撬開了機(jī)會的大門。招生辦老師被說服了,統(tǒng)一組織了考試,姚順宇拿到了降至一本線錄取的自主招生名額,邁進(jìn)了清華大學(xué)的校門。
他回憶道:“人生最重要的道理就是膽子要大。你不爭取是永遠(yuǎn)得不到的,爭取了也有可能得不到,但不爭取就絕對得不到。”
![]()
“為什么要把時間浪費(fèi)在伺候老登身上?”
在清華,姚順宇進(jìn)入了基礎(chǔ)科學(xué)班(基科班)。大二那年,受楊振寧先生創(chuàng)立的高等研究院氛圍影響,他一頭扎進(jìn)了汪忠老師的課題組,開始研究一種被稱為“非厄米系統(tǒng)”的開放量子體系。
那是他科研生涯的第一個巔峰。在這個極其考驗量子力學(xué)和統(tǒng)計力學(xué)理解深度的前沿方向上,他與導(dǎo)師系統(tǒng)性地建立了一套描述方法,顛覆了過去用布洛赫波描述非厄米系統(tǒng)的傳統(tǒng)范式。由于實現(xiàn)了一次“范式級別的更新”,他的工作在國際上引發(fā)了大量的跟進(jìn)研究。
然而,當(dāng)所有人覺得這位物理新星將在凝聚態(tài)理論領(lǐng)域大放異彩時,他又選擇逃跑,去斯坦福讀高能理論物理學(xué)博士。
“抓住一次范式變化確實能讓你名聲大噪,獲得更多引用和好的教職,但對我來說,它已經(jīng)不令人激動了。”
雖然都屬于物理學(xué),但姚順宇本科與博士的兩個方向幾乎沒有任何聯(lián)系。“我覺得說難聽了就是愛折磨自己,說好聽的是挑戰(zhàn)自己。”
他很享受被折磨,他說:“如果一個人是為了學(xué)習(xí)更多的東西,豐富自己的精力和能力而被折磨,我覺得是值得的。”
但斯坦福的五年博士生涯,帶給他的是一場深刻的幻滅。高能理論物理已經(jīng)發(fā)展到了實驗設(shè)備完全追不上的尺度,這導(dǎo)致理論的對錯無法被客觀驗證。
“當(dāng)這個領(lǐng)域完全沒有實驗和客觀標(biāo)準(zhǔn)的時候,誰做的好,誰做的不好,其實就依賴于領(lǐng)域內(nèi)一些老登的主觀判斷。你在那個領(lǐng)域呆的時間越長,就越覺得這件事兒蠢。人這一輩子也沒多長,為什么要把自己的時間浪費(fèi)在伺候老登身上?”
姚順宇對“老登”這個詞有著純粹的學(xué)術(shù)性痛恨。在他眼中,人老了會分裂成兩種狀態(tài):一種是德高望重的長者,甘愿為年輕人鋪路;另一種則是自己不懂、卻偏偏極度渴望指手畫腳。
“我以前可能沒有這么恨老登,可能就是當(dāng)你自己有越來越多判斷的時候,那些蠢的人就顯得更蠢。”姚順宇表示,他覺得自己可能有厭蠢癥。
他說,他花了五年學(xué)了很多知識,買了一個大教訓(xùn),那就是要做有客觀評價標(biāo)準(zhǔn)的事,做對這個世界能產(chǎn)生影響的事。
目前的AI領(lǐng)域?qū)σ樣顏碚f是客觀的:“你其實不用太擔(dān)心,因為自己的觀點惹到什么人,只要你的觀點是自洽的,最終你在這個領(lǐng)域做的怎么樣,是有客觀的評價標(biāo)準(zhǔn)的。”
![]()
從Anthropic到Google,做AI“不需要腦子”
2024年秋天,在伯克利做博士后僅僅兩個星期的姚順宇向校方遞交了辭呈,他決定去和硅谷最炙手可熱的AI獨(dú)角獸Anthropic談?wù)劇?/p>
他踩中了大規(guī)模強(qiáng)化學(xué)習(xí)(RL)爆發(fā)的末班車尾巴,作為Horizon團(tuán)隊的核心研究員,完整地參與了Claude 3.7乃至后續(xù)模型的后訓(xùn)練(Post-training)過程,親手用代碼將Claude的Agent能力推上了神壇。
后來,在政治糾紛鬧的沸沸揚(yáng)揚(yáng)的時候,他選擇了離開。“你看到文化的稀釋以及一些不干活的人的激增是非常明顯的。而且在一些非技術(shù)層面的公共立場上,CEO達(dá)里奧(Dario Amodei)個人的一些情緒和傾向,甚至影響到了整個公司的戰(zhàn)略風(fēng)向。”
從Anthropic離職后,他并沒有選擇回國,“那時候我離開了Anthropic,之后決定要去哪的時候,最大的動機(jī)是我想學(xué)一些不一樣的東西。對我來說,我可能就沒有更著重的去考慮說能夠我去領(lǐng)導(dǎo)一個項目之類的。我更多的是在那個時候優(yōu)先去學(xué)習(xí)一些東西,所以那個時候我選擇去了(Google DeepMind旗下的)Gemini。”
目前,業(yè)內(nèi)流傳著Scaling Law已經(jīng)撞墻的說法,但姚順宇表示:“預(yù)訓(xùn)練依然在過去的幾個月里瘋狂變強(qiáng),未來四個月我看不到任何到頭的跡象。那些說撞墻的人,多半是因為自己工作里有 Bug 沒找出來。”
在DeepMind,姚順宇正在推進(jìn)的兩個方向是ML Coding(讓AI自動做AI研究)和Long Horizon(長周期任務(wù)執(zhí)行)。
ML Coding的目的是讓AI能夠自己研究自己,能自己跑實驗、分析結(jié)果、提出新假設(shè),完成全鏈路閉環(huán)。長周期任務(wù)執(zhí)行是讓模型學(xué)會像人一樣選擇性遺忘,能夠在有限的上下文窗口里,處理近乎無限的任務(wù)。這是Agent走向?qū)嶋H應(yīng)用的必經(jīng)之路。
在他看來,目前AI的原生場景只有Coding,聊天框本質(zhì)上是搜索的延伸。
為什么AI能夠在Coding上率先實現(xiàn)突破,在他看來第一是因為在這個場景下反饋信號非常清晰。代碼能不能跑通、輸入輸出對不對,是非常容易量化和測試的事情。這對強(qiáng)化學(xué)習(xí)來說,是最理想的訓(xùn)練土壤。其次是數(shù)據(jù)底座得天獨(dú)厚。在GitHub等平臺上沉淀了過去幾十年人類最優(yōu)秀程序員留下的高質(zhì)量代碼,這是任何其他領(lǐng)域都難以企及的先發(fā)優(yōu)勢。
姚順宇是一個悲觀的人,即使在AI風(fēng)暴中心,他依然認(rèn)為未來AI會替代掉軟件工程師。“AI會讓少部分人變得更強(qiáng),但會讓大部分人失去他們的獨(dú)特價值。所以說我覺得對于傳統(tǒng)的軟件工程來說,最后的結(jié)果可能就是現(xiàn)在千分之一的人干了過去所有人的工作,拿著現(xiàn)在100倍的工資。”
現(xiàn)在,一個頂級AI研究員的薪水已經(jīng)十分高昂,整個行業(yè)不斷把技術(shù)突破,敘述為天才推動歷史。但姚順宇卻說:AI這個事兒本來也不太需要腦子。“我覺得這個行業(yè)最重要的特質(zhì)就是靠譜,就是做事細(xì),然后對自己做的事負(fù)責(zé)任。那些東西我覺得都是一些本科生就能干的活。”
他不斷強(qiáng)調(diào):“AI本身才是那個浪。”他說,任何一個項目,少了自己都不會停止。“大家現(xiàn)在每個人都是沖浪的人,而不是那個浪本身。”在他看來,真正推動一切的,其實是整個時代性的技術(shù)浪潮。
個體只是站上了浪尖,而浪本身,不會因為任何一個人的缺席而停止。
![]()
![]()
運(yùn)營編輯 |曹倩審核|孟莎莎
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.