无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

現(xiàn)場實(shí)錄|湯道生對話姚順雨:騰訊AI的下半場

0
分享至



在這場對話中,騰訊釋放出的信號是:AI競爭已經(jīng)從單純的模型能力競賽,進(jìn)入模型、產(chǎn)品、真實(shí)場景、上下文和組織協(xié)同共同決定勝負(fù)的新階段

整理|吳俊宇

2026年,智能體成為AI產(chǎn)業(yè)應(yīng)用的核心關(guān)鍵詞。外界長期關(guān)注騰訊這類大型科技公司在模型、產(chǎn)品和組織層面的進(jìn)展。

6月5日,在騰訊AI產(chǎn)業(yè)應(yīng)用大會上,騰訊集團(tuán)高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生與騰訊AI首席科學(xué)家姚順雨同臺對話,系統(tǒng)闡釋騰訊對“AI下半場”的思考。

姚順雨出生于1998年,本科畢業(yè)于清華大學(xué)姚班,后獲普林斯頓大學(xué)計(jì)算機(jī)科學(xué)博士學(xué)位,曾在OpenAI從事語言智能體相關(guān)研究。2025年下半年加入騰訊后,他向騰訊總辦匯報(bào),并與團(tuán)隊(duì)在今年上半年推出Hy3 Preview(混元3預(yù)覽版)模型。

姚順雨認(rèn)為,AI下半場最重要的問題,不再只是找到更好的方法,而是找到真正值得解決的問題。湯道生則強(qiáng)調(diào),AI時(shí)代做產(chǎn)品,那種開放式的服務(wù)形態(tài)會帶來大量新的挑戰(zhàn)。

在這場對話中,騰訊釋放出的信號是:AI競爭已經(jīng)從單純的模型能力競賽,進(jìn)入模型、產(chǎn)品、真實(shí)場景、組織協(xié)同共同決定勝負(fù)的新階段。

以下為對話實(shí)錄:

一、為什么加入騰訊?AI下半場最重要是什么?

姚順雨大家好。我平時(shí)都是在海淀區(qū),很少來朝陽區(qū),很高興。

湯道生今天我們兩個(gè)對話,可能是一個(gè)比較新的形態(tài),如果有什么出乎意料的,我想也是給大家一個(gè)驚喜。

順雨,你加入騰訊前,我記得我當(dāng)時(shí)問過你一些問題,為什么下半場會選擇來騰訊?而且你認(rèn)為AI下半場最重要的是什么?

姚順雨首先解釋一下什么叫做下半場,我最近感覺這個(gè)詞有點(diǎn)被濫用,這個(gè)概念是我去年的一個(gè)博客提出來的,什么意思?其實(shí)我覺得在去年之前AI已經(jīng)發(fā)展幾十年,但是更加重要的是怎么去解決問題,去尋找好的方法,最近我覺得很明顯就是說,方法論已經(jīng)變得非常成熟,但尋找問題變得更加困難。

舉個(gè)例子,比如說過去我們發(fā)明AIphaGo(備注:谷歌旗下DeepMind 團(tuán)隊(duì)開發(fā)的AI圍棋)這樣的方法去下圍棋,但是這個(gè)方法只適合用來下圍棋或者下各種棋類。你會為了翻譯做一個(gè)特別的模型,但是它只能做翻譯,不能做其他事情。

但是有了預(yù)訓(xùn)練和后訓(xùn)練之后我們發(fā)現(xiàn),我們像有一個(gè)萬能錘子,它可以砸任何釘子,它是一個(gè)通用方法論,可以解決各種各樣的問題,反而更困難的是怎么尋找好的問題去解決。

其實(shí)我覺得加入騰訊很重要一點(diǎn),就是說這里有很多好問題有很多產(chǎn)品我覺得這一點(diǎn)在接下來變得越來越重要。

一方面,好的產(chǎn)品能夠解決第一個(gè)問題:我們做預(yù)訓(xùn)練和后訓(xùn)練之后到底要把它應(yīng)用在什么地方產(chǎn)生價(jià)值。第二個(gè)是環(huán)境是非常重要的,如果沒有好的環(huán)境,那Agent(智能體)沒有辦法做各種各樣的事情,比如說如果沒有一個(gè)點(diǎn)外賣的tool的話,就沒有辦法點(diǎn)外賣,很多事情做不到,我覺得最重要的是context(可翻為上下文或語境),無論是企業(yè)還是個(gè)人。

就像我上一次在AGI-Next(備注:2026年1月清華大學(xué)基礎(chǔ)模型北京市重點(diǎn)實(shí)驗(yàn)室與智譜AI聯(lián)合發(fā)起的AGI-Next前沿峰會上)說的一樣,我覺得越來越重要的事情是context。

因?yàn)槟P驮絹碓缴瞄L把一個(gè)非常復(fù)雜的輸入變成輸出,很多時(shí)候你的競爭壁壘就在于你有沒有最原始的輸入,你知不知道這個(gè)人他到底在干什么,你知不知道這個(gè)企業(yè)各種各樣的信息,這一點(diǎn)我覺得騰訊有非常強(qiáng)的優(yōu)勢。但其實(shí)我覺得這只是第二大的原因,最重要的原因是文化,我記得我第一次跟你聊天,包括和其他總辦老板聊天的時(shí)候,我第一印象大家都非常誠實(shí),哪里做的好哪里做的不好,非常直白不會掩蓋,我覺得這種坦誠是我第一印象。

第二個(gè)就是說騰訊總體是一個(gè)基于trust(信任),而不是基于metric(監(jiān)控)去運(yùn)轉(zhuǎn)的公司,我覺得這一點(diǎn)對于做AI是非常重要的,包括我覺得我們的文化有非常low ego(低自我中心度),有非常solid的這一面,我覺得這些文化對于長期做一個(gè)AI的組織是非常重要的,包括我們對長期主義的堅(jiān)持。

所以AI下半場最重要是什么?我個(gè)人覺得就是,我們應(yīng)該在中國建立一個(gè)長期的基于AGI的組織,今天的AI主要有三部分:

首先是foundation(基礎(chǔ))的部分,我們怎么樣把預(yù)訓(xùn)練和后訓(xùn)練最基礎(chǔ)的東西做非常solid(備注:軟件工程領(lǐng)域的一個(gè)詞匯,形容高內(nèi)聚、低耦合、易于維護(hù)與擴(kuò)展

第二部分是產(chǎn)品,我們怎么樣把這樣的技術(shù),真的為人和社會產(chǎn)生價(jià)值。

第三個(gè)是frontier(前沿),我們怎么樣探索新的研究范式,探索新的機(jī)會。

我覺得最重要的是我們構(gòu)建一個(gè)非常均衡的三角形一樣的組織。

我覺得對于做foundation來說:

第一最重要的是有充足資源。

第二就是需要正確的做事的方式,這些和我剛才說的文化也是吻合的。對于產(chǎn)品來說,有好的產(chǎn)品的sense,有這種做產(chǎn)品的人是至關(guān)重要的。

第三個(gè),在中國我們今天所做的前沿探索不夠多,所以我希望能把frontier exploration(前沿探索)的精神能更多地注入到我們組織中。

湯道生你提到的聊的過程中感受到的真誠或者務(wù)實(shí)的氛圍,也是我經(jīng)常跟客戶交流得到的反饋,我覺得我們的做事方式,做產(chǎn)品的理念,其實(shí)也是比較實(shí)事求是的,畢竟AI賽道是長跑。

我覺得有時(shí)候認(rèn)知也很重要,我們做的好的和不好的也得認(rèn),但關(guān)鍵是一個(gè)多維度的競賽,我們看到現(xiàn)在模型有很多進(jìn)步,我們做產(chǎn)品其實(shí)也是有越來越多的形態(tài),不同的場景有不同的需求,我覺得未來還是非常可期的。

你剛剛提到模型跟產(chǎn)品,產(chǎn)品可以說提供一個(gè)環(huán)境,里面要給模型提供context上下文,我想問一個(gè)問題,我們平時(shí)開會提的有一個(gè)詞比較多是Co-Design(協(xié)同設(shè)計(jì)),怎么把產(chǎn)品關(guān)模型能夠比較緊密底結(jié)合起來。

尤其今天有這么多豐富的產(chǎn)品,從我們合作非常緊密的像元寶這樣的一個(gè)聊天機(jī)器人,包括AI搜索,企業(yè)里面也有部署智能客服、智能營銷,另外最近非常火的類龍蝦像CodeBuddy、Workbuddy(CodeBuddy、Workbuddy都是騰訊旗下的Agent產(chǎn)品)這樣的產(chǎn)品,其實(shí)對于模型依賴很深,你怎么思考Co-Design這個(gè)方式?

姚順雨有三點(diǎn)。

首先,CoDesign的前提就是說模型本身要做的很solid,有很多foundational的work(工作)要做好。首先我覺得預(yù)訓(xùn)練是一個(gè)相對就是產(chǎn)品agnostic(不可知)的事情,它做的非常solid可以提供非常強(qiáng)的foundation,而且預(yù)訓(xùn)練它最大的特點(diǎn)就是它是一個(gè)可泛化學(xué)習(xí)過程,它的進(jìn)步可以帶給各種各樣下游任務(wù)持續(xù)的價(jià)值提升。后訓(xùn)練我覺得最重要一點(diǎn)是要設(shè)立好正確的Eval(評測和評估),中國大家有個(gè)不好的傾向是大家喜歡刷榜,但是我覺得更重要的是如何實(shí)事求是的基于產(chǎn)品,基于真正的應(yīng)用,構(gòu)造更加真實(shí)的Eval。

第二,要意識到可能“實(shí)用性”價(jià)值是大于刷榜價(jià)值,這一點(diǎn)我們做大量工作,跟各種各樣產(chǎn)品進(jìn)行了深度Co-Design,Co-Design很關(guān)鍵一點(diǎn)就是要產(chǎn)生相互信任,這一點(diǎn)我們做了大量工作,取得互信,怎么把產(chǎn)品數(shù)據(jù)用好,怎么把回流,怎么把Eval做好,有很多細(xì)節(jié),我就不贅述。

第三點(diǎn)我想說,LLM(大語言模型)時(shí)代和過去的AI最本質(zhì)的區(qū)別就是泛化性,在LLM之前比如說做翻譯產(chǎn)品,只要把翻譯數(shù)據(jù)做的特別好就行了。你做一個(gè)圍棋的程序,你只需要把圍棋的數(shù)據(jù)準(zhǔn)備特別好就行。但是今天即使你想只做一個(gè)Coding Agent(代碼智能體),你會發(fā)現(xiàn)其實(shí)需要的不僅是Coding Agent的數(shù)據(jù),你需要非常好的聊天能力,非常強(qiáng)的搜索能力,非常強(qiáng)的指令遵循能力,非常強(qiáng)的推理能力,它其實(shí)是非常復(fù)合的data(數(shù)據(jù))的taxonomy(分類學(xué)),我覺得需要對這個(gè)事情有一個(gè)taste(品位)。

這個(gè)事情的推論就是說有很多產(chǎn)品的體系化地方,會有比較大的優(yōu)勢,比如說我們和元寶的Co-Design使我們模型產(chǎn)生很強(qiáng)的聊天和搜索能力,這樣的能力又可以被遷移到ima和Workbuddy其他的產(chǎn)品,所以這些產(chǎn)品能夠提供不同的數(shù)據(jù),但是這些數(shù)據(jù)之間又可以相互泛化,它形成一個(gè)像網(wǎng)絡(luò)一樣的體系,我覺得這一點(diǎn)的價(jià)值越來越重要。

湯道生對,外部的榜也屬于Eval的一種,所以我們內(nèi)部做Eval跟外部的這種榜有什么區(qū)別?

姚順雨首先benchmark(基準(zhǔn)測試)還是有它的價(jià)值的,不是完全沒有價(jià)值,只是說這些榜非常容易 overfitting(備注:過擬合,指機(jī)器學(xué)習(xí)模型在訓(xùn)練集上表現(xiàn)極度完美,但在處理未見過的測試集或新數(shù)據(jù)時(shí),預(yù)測準(zhǔn)確率和表現(xiàn)卻大幅下降的現(xiàn)象)。基于真實(shí)世界的數(shù)據(jù)會對模型的研發(fā)有幫助:首先就是你能發(fā)現(xiàn)模型很多底線問題,實(shí)際上我們先發(fā)一個(gè)Preview(預(yù)覽版)模型最主要的目的之一是希望能夠獲得真實(shí)世界反饋,能修復(fù)各種各樣榜單中沒有發(fā)現(xiàn)的問題,這個(gè)會在正式版上面有很大的改進(jìn)。

第二點(diǎn),你對真實(shí)的Prompt distribution(提示詞分布)會有一個(gè)更深的了解。我舉個(gè)例子,比如說benchmark上面的這些題目可能它都是非常精確的,有非常長的concrete description(具象描述),它可能一般來說是一個(gè)單純的問題,但是我們知道在現(xiàn)實(shí)場景中可能大家問的問題都是比較模糊的,可能就一兩句話,它會不停追問,這些場景可以啟發(fā)我們怎么去更好做這樣的訓(xùn)練。

第三點(diǎn),我覺得甚至我們可以在這些產(chǎn)品上面獲得一些靈感去推進(jìn)現(xiàn)在還沒有的榜單或者是沒有領(lǐng)域的推進(jìn),比如說我們最近做了很多Context learning(上下文學(xué)習(xí))的工作,包括元寶的反饋也給我們很大的啟發(fā)和幫助。所以我覺得產(chǎn)品和模型的互相成就是越來越重要的一個(gè)AI的話題。

湯道生我記得我們早期做元寶的時(shí)候還碰到多輪遵循的問題,好像在使用產(chǎn)品,大家這種迭代Prompt(提示詞)的方式跟benchmark還有差異,真正在產(chǎn)品里面大家使用所需要的能力確實(shí)好像跟benchmark還有蠻大的差異的。

二、騰訊做產(chǎn)品第一性原理AI應(yīng)用和過去有何區(qū)別?

姚順雨你問我這么多問題,我也問你一個(gè)問題。

湯道生歡迎。

姚順雨其實(shí)我記得我第一次跟您聊的時(shí)候,你跟我講了很多你過去的經(jīng)歷,從QQ空間、QQ秀的時(shí)代,一直到我小學(xué)時(shí)候最喜歡的產(chǎn)品。

到QQ音樂,到云到現(xiàn)在的元寶,其實(shí)跟你聊天很有意思,因?yàn)槟阕鲞^各種各樣的產(chǎn)品,To C(面向消費(fèi)者)也有,To B(面向企業(yè)客戶)也有,遠(yuǎn)古時(shí)代的也有,最近AI時(shí)代的產(chǎn)品也有。我比較好奇,你覺得你做產(chǎn)品的第一性原理是什么,你覺得哪些經(jīng)驗(yàn)和價(jià)值是不變的?哪些東西是變的?

湯道生我覺得其實(shí)最終做產(chǎn)品還是本著用戶到底有什么需求,我到底怎么去解決他的痛點(diǎn),怎么去給用戶或者客戶創(chuàng)造價(jià)值。在不同的時(shí)代,甚至不同的行業(yè),你做一個(gè)產(chǎn)品還是需要能夠給用戶帶來價(jià)值,他才會買單,才會使用。所以我倒覺得從PC互聯(lián)網(wǎng)時(shí)代我們做空間、移動的時(shí)代做各種各樣的產(chǎn)品、內(nèi)容的產(chǎn)品,到產(chǎn)業(yè)互聯(lián)網(wǎng)做云,其實(shí)我們也要花好多的時(shí)間、精力去聽客戶的聲音,嘗試去幫助他們?nèi)ソ鉀Q他的問題。底層的邏輯其實(shí)沒有這么大的變化。

但確實(shí)我覺得在PC互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)時(shí)代做產(chǎn)品跟今天在AI時(shí)代做產(chǎn)品還是有蠻多不一樣的地方。首先從范式的角度來看,在AI時(shí)代以前我們做產(chǎn)品很多時(shí)候想的是通過功能來滿足用戶的需求,你作為一個(gè)產(chǎn)品提供方、服務(wù)提供方,你想清楚我提供怎么樣的一個(gè)能力,讓用戶可能通過某些菜單去選,好像是一些“預(yù)制菜”,你只能在里面去點(diǎn)一樣。

但在AI時(shí)代做產(chǎn)品,它的那種開放式的服務(wù)形態(tài)就會帶來很不一樣的要求跟挑戰(zhàn),用簡單的交互方式可能是自然語言,可能是語音,其實(shí)作為產(chǎn)品方你也不知道用戶會問什么。所以要充分利用模型能力去理解用戶的需求,然后通過比如說今天大模型的這種邏輯推理,能去調(diào)用工具的能力,產(chǎn)品去給模型提供各種各樣可以用的工具,來應(yīng)對這種開放式的需求,這個(gè)是我覺得跟我們過去做產(chǎn)品很不一樣的地方。

甚至也包括你剛剛提到的Eval,以前我們做產(chǎn)品有很清晰很具體的產(chǎn)品的細(xì)節(jié)功能的描述,怎么去做設(shè)計(jì)、做研發(fā)、做測試,我覺得那個(gè)瀑布式的流程也比較清晰。

但是做AI產(chǎn)品,我發(fā)現(xiàn)最大的變化是我們整個(gè)流程可能都要重新設(shè)計(jì),尤其今年大部分的代碼都由AI生成,我們的工程師可能會花更多的時(shí)間去做設(shè)計(jì),架構(gòu)的設(shè)計(jì),把寫代碼的工作都交給AI了,然后定期去指導(dǎo)一下、修正一下。

然后測試也要左移,更前置去想清楚針對我們各種案例Eval、環(huán)境,我們對于開放式答案的要求,甚至alignment怎么對齊,我們用戶所需要的那種風(fēng)格,我感覺今天時(shí)代做產(chǎn)品其實(shí)要求的能力更全面。

姚順雨更難了。

湯道生更難了。我問你一下混元3,大家都在說Hy3 preview(混元3預(yù)覽版)是你騰訊的首秀,具體混元3做什么改變,你能給大家介紹一下嗎?

姚順雨其實(shí)我覺得沒有什么秘密,今天做大模型從某種程度來說比較Trivial(微不足道且瑣碎)的事情,我們應(yīng)該把Infrastructure(AI基礎(chǔ)設(shè)施)做好,我們應(yīng)該把數(shù)據(jù)做好,算法的部分反而是比較簡單的。其實(shí)我覺得主要幾個(gè)點(diǎn)吧。

第一,我們把Infrastructure重建了,無論是預(yù)訓(xùn)練還是強(qiáng)化學(xué)習(xí)。第二是我們把數(shù)據(jù)和Eval做了很大的改變,如何去定義更真實(shí)的問題,如何豐富數(shù)據(jù)的 taxonomy,如何去提高數(shù)據(jù)的質(zhì)量,這是一個(gè)永無止境的追求。

第三,我覺得很重要的很多決策其實(shí)包括怎么去招人,怎么去設(shè)立模型的節(jié)奏,怎么去每天有很多的Decision (決定)要考慮很多Trade off(權(quán)衡),我覺得可能沒有一個(gè)很清晰的公式,我覺得是一個(gè)很Taste driven(品味驅(qū)動)的事情。所以我其實(shí)挺好奇問你一個(gè)問題的,因?yàn)槟鷦倓偢矣懻揅o-Design這個(gè)概念,我很好奇您對Co-Design這件事情是怎么想的,你覺得哪些事情是應(yīng)該模型做的,哪些是產(chǎn)品應(yīng)該做的?

湯道生我覺得Co-Design在不同階段,過去這兩年其實(shí)是一直在變化的,我覺得這個(gè)變化某種程度來講是隨著模型能力的升級而變化,當(dāng)然整個(gè)行業(yè)、市場、用戶的需求他在變化的過程中也會帶來我們兩邊模型跟產(chǎn)品需要更好去滿足。

給我一個(gè)比較深的感受是怎么去對齊,因?yàn)樵谖覀円黄鹑プ霎a(chǎn)品,去做對齊會的時(shí)候,我們有很多不同的決策,產(chǎn)品可能要針對某個(gè)方向去解決一些問題,模型到底怎么做去滿足這個(gè)需求,但是你要回到模型需要數(shù)據(jù),數(shù)據(jù)應(yīng)該怎么標(biāo)注,到什么顆粒度,到底什么是好的標(biāo)注,什么是不好的標(biāo)注,因?yàn)橛幸恍┑胤揭剟?lì),有一些地方要懲罰。

然后還有Eval,還有評測,因?yàn)槿绻a(chǎn)品認(rèn)為好的產(chǎn)品體驗(yàn),評測是不認(rèn)同的話,大家其實(shí)做出來的產(chǎn)品就會不一致了。所以Co-Design給我的感覺更多是在項(xiàng)目組里面不同的角色參與到產(chǎn)品的設(shè)計(jì),定了一些產(chǎn)品的目標(biāo)方向,怎么讓多個(gè)角色能夠?qū)τ谝恍╅_放式問題有比較好的對齊。

如果沒有做到這樣一個(gè)對齊的話,你會發(fā)現(xiàn)產(chǎn)品的行為會不可預(yù)測。甚至有時(shí)候會有一些隨機(jī)性,因?yàn)槟P陀?xùn)練的過程可能也被混淆了。

所以這是我這兩年跟做產(chǎn)品跟模型團(tuán)隊(duì)做Co-Design的一個(gè)比較深的感受。您覺得呢?

姚順雨其實(shí)我是覺得,就像我剛剛說的,首先最難的一點(diǎn)是要建立Trust(信任),畢竟我覺得同理心很重要,因?yàn)檎f到底做模型的目標(biāo)和做產(chǎn)品的目標(biāo)有很多align(對齊)的部分,也有很多不align的部分。就是模型人希望我能力越強(qiáng)越好,但是產(chǎn)品的人覺得用戶需求越滿足越好。所以天然有很多不align的部分,我覺得很重要的一點(diǎn)是要有換位思考的能力。

其實(shí)就是你剛剛問我元寶我們是怎么一步一步Co-Design的,其實(shí)一個(gè)很重要的細(xì)節(jié)是,我們當(dāng)時(shí)是派了后訓(xùn)練最強(qiáng)的骨干力量,去幫助元寶把后訓(xùn)練做好。當(dāng)時(shí)我們自己的預(yù)訓(xùn)練還沒有準(zhǔn)備好,但是我們知道維護(hù)元寶這樣的產(chǎn)品以及它的DAU(日活躍用戶)會對我們接下來做模型也非常非常重要,而且對于創(chuàng)新的合作非常重要。

所以當(dāng)時(shí)其實(shí)很多算法同學(xué)不理解,我需要去很努力解釋,但是現(xiàn)在看起來這些努力都是Trade off,我覺得這樣一個(gè)動作讓產(chǎn)品意識到模型的同學(xué)是真的在為產(chǎn)品著想,我覺得這個(gè)其實(shí)對于我們之后的合作,包括Hy3 preview在元寶上成功上線起到了非常重要的作用。當(dāng)然有很多技術(shù)的部分可以探討,但是最難的部分反而是怎么樣建立信任,怎么樣換位思考。

湯道生對,非常認(rèn)同。我換一個(gè)話題,你是ReAct架構(gòu)(ReAct方法,Reasoning+Acting是由姚順雨在2020年提出的一種AI決策框架)的提出者,博士研究也是圍繞著語言智能體展開的,你幾年前的一些觀點(diǎn)到今天兌現(xiàn)了嗎?比如有哪些?

姚順雨那天我挺感慨的,我重新讀了自己的博士論文,感覺又回到一個(gè)很遠(yuǎn)古時(shí)代,我的博士論文的標(biāo)題叫做《Language Agents: From Next-Token Prediction to Digital Automation》(《語言智能體:從下一詞元預(yù)測到數(shù)字自動化》),是2019年。

湯道生7年前。

姚順雨那個(gè)時(shí)候Literally(字面意思)就是我們的GPT-2(備注:姚順雨當(dāng)時(shí)在OpenAI工作),那個(gè)時(shí)候它只能做Next token prediction(下一個(gè)詞預(yù)測),而且它產(chǎn)生一段話不太連續(xù),或者有很多毛刺,所以當(dāng)時(shí)人們很難想象到它有一天成為一個(gè)改變世界的力量。

當(dāng)時(shí)我覺得可能大家做的研究,稍微有想像力做一些研究。比如說,中國首都是,如果做Next token prediction它會回答北京,somehow(一些時(shí)候)它是一個(gè)有Knowledge(知識)的事情,能做到這一點(diǎn)大家當(dāng)時(shí)非常開心,覺得這個(gè)技術(shù)很有意思。

當(dāng)時(shí)我的想象力比較狂野,我覺得GPT是一個(gè)非常優(yōu)美的東西,吐下一個(gè)Token(詞元)是一個(gè)非常極簡且非常通用的事情,我覺得它有一天潛力不僅僅是在于吐出下一個(gè)Token,而在于把這個(gè)世界上所有的事情全部automate(自動化)。我當(dāng)時(shí)想的還不夠大,我想的是digital automation(數(shù)字化自動化),但是現(xiàn)在看起來也有可能是digital and physical automation(數(shù)字和物理世界自動化)。

我覺得其實(shí)我博士期間主要做兩部分,第一部分就是如何建立一個(gè)Agent方法論,如何把一個(gè)Next Token prediction的機(jī)器變成一個(gè)Agent,變成一個(gè)自動化的機(jī)器,最重要的工作可能是你說的react。

我記得2022年7月份的時(shí)候某一天晚上,當(dāng)我第一次把Pump two的API(應(yīng)用接口)和當(dāng)時(shí)手寫的一個(gè)Wikipedia (維基百科)API連在一起,它第一次可以基于這個(gè)網(wǎng)頁回答問題,并且多輪交互的時(shí)候,我當(dāng)時(shí)感覺就像微弱電燈燈突然亮的感覺一樣。我感覺據(jù)我所知,人類第一次把LLM和互聯(lián)網(wǎng)連在一起并且做多輪交互,我當(dāng)時(shí)的感覺是,這個(gè)感覺可能在5年或者10年會改變這個(gè)事情,但是可能比我想象中還要更快。

我記得當(dāng)時(shí)我們第一次提出SWE-bench(備注:目前全球軟件工程領(lǐng)域最主流、最具挑戰(zhàn)性的大型語言模型基準(zhǔn)測試之一)的時(shí)候,我覺得OK,如果這個(gè)事情能做到,那很顯然它會帶來巨大價(jià)值,當(dāng)時(shí)可能是幾百億、上千億,但現(xiàn)在可能是數(shù)萬億,數(shù)是萬億,可能我想的還是太小了。

另一部分我做的工作就是怎么定義Digital automation的任務(wù),比如說WebShop(電商)是第一個(gè)基于互聯(lián)網(wǎng)的Web Agent task(互聯(lián)網(wǎng)智能體任務(wù)),包括InterCode(備注:一個(gè)用于評估大型語言模型在交互式編程任務(wù)中表現(xiàn)的標(biāo)準(zhǔn)評估測試)和SWE-bench是最早的Coding Agent(代碼智能體)這樣的任務(wù)。現(xiàn)在看起來Agent技術(shù)最重要兩個(gè)部分確實(shí)是外部Agent和Coding Agent。

那天我在群里跟大家聊天,我看我博士論文結(jié)尾,就是我在2024年寫我的future work(未來工作),第一個(gè)是train models for Agent(為智能體訓(xùn)練模型),第二個(gè)是shift and robust deployment,第三個(gè)是scientific discovery(偏移與魯棒部署),第四個(gè)是怎么樣去help human(幫助人類),我很感慨,我說我現(xiàn)在很幸運(yùn)確實(shí)在做當(dāng)時(shí)列的future direction(未來的決定)。

湯道生太厲害了,都一一看到整個(gè)行業(yè)這些方向在推進(jìn)。

姚順雨可能想的還是不夠大,我覺得已經(jīng)覺得自己想的夠大了,但是可能還是不夠大,我覺得。

湯道生技術(shù)的發(fā)展往往超乎我們的預(yù)期。智能體今天大家都說需要消耗很多的Token,Token的調(diào)用,這對于混元做下一代模型研發(fā),你覺得什么是你的側(cè)重,有哪些地方比較重要?

姚順雨毫無疑問今天Agent或者Coding Agent有點(diǎn)像預(yù)訓(xùn)練一樣,是不得不做的事情,是最基礎(chǔ)能力。我個(gè)人覺得Coding Agent非常本質(zhì)有很多原因。還有一個(gè)重要原因就是說它是一個(gè)優(yōu)點(diǎn)像圖靈完備的事情,當(dāng)你有能力去控制自己的file system(文件系統(tǒng)),當(dāng)你有一個(gè)container(容器)的時(shí)候,其實(shí)你是一個(gè)complete(完成)這樣一個(gè)system(系統(tǒng)),今天我覺得Agent毫無疑問是每一家模型所發(fā)力的重點(diǎn),我覺得我們做的方法可能會有幾個(gè)區(qū)別:

第一,即使今天Coding已經(jīng)是最重要的事情,但是我們還是會強(qiáng)調(diào)體系的全面化,我始終認(rèn)為要把Coding做好,其實(shí)需要遠(yuǎn)遠(yuǎn)不止Coding的數(shù)據(jù),也需要聊天、推理,各種各樣不同的東西,因?yàn)榇竽P妥钪匾狞c(diǎn)是泛化性。

第二,很顯然產(chǎn)品作用越來越重要,如何利用好線上回流,我覺得是一個(gè)每個(gè)模型廠商都在應(yīng)對和思考的問題。這里剛剛積累很多CoDesign經(jīng)驗(yàn)變得非常重要。

第三,我覺得還需要更多想像力,無論是技術(shù)演進(jìn),還是產(chǎn)品演進(jìn),甚至下一個(gè)范式演進(jìn),我們需要做探索性甚至不確定性的工作。

湯道生從產(chǎn)品側(cè),因?yàn)榇蠹以絹碓蕉嘤蠺oken焦慮的聲音,Token成本爆發(fā)式增長,我也聽到很多客戶甚至用戶身邊的同事們也在緊盯著積分消耗或者Token消耗。怎么可以讓我們的模型在解決某個(gè)問題,或者完成某個(gè)任務(wù),Token效率高?

我之前做過一些任務(wù)可能是不同方向,有些方向也都知道肯定走不下去的,但可能模型還會試,試完之后走不下去再試下一個(gè),里面有什么可以optimize的地方讓Token整體使用效率更高?

姚順雨我覺得在中國討論性價(jià)比更多討論模型架構(gòu),但其實(shí)它是很復(fù)雜的體系,我覺得最重要的是首先是你的performance(性能)。

很多人跟我說,他最后發(fā)現(xiàn)用Opus(Claude旗下的旗艦?zāi)P停┻@樣的模型比用更差的模型更省錢,因?yàn)楦斓陌堰@個(gè)事情做對了,也省得人的精力,最重要的事情是performance,如果你的performance好,性價(jià)比是最關(guān)鍵的事情。

尤其我覺得今年可能很多簡單任務(wù)的robustness(穩(wěn)健性、健壯性或魯棒性)會變得更加重要,一次把相對簡單任務(wù)做對,這可能是性價(jià)比更關(guān)鍵的部分,不僅是模型架構(gòu)。

第二部分就是成本它本身,性價(jià)比第一是性能,如果性能不好性價(jià)比無從談起。第二點(diǎn)是成本,中國是領(lǐng)先于世界的,就是我們做大量工作優(yōu)化我們的成本,成本可能最重要的事情是怎么用一個(gè)更小的模型把更高的價(jià)值任務(wù)做好,在這基礎(chǔ)上架構(gòu)創(chuàng)新,包括長文管理,腳手架有很多需要做的事情。

如果我們做一個(gè)相對較小的模型,但是它比肩大模型性能,而且在大部分任務(wù)上做很強(qiáng)的robustness,這可能在很多長程的上面提升一兩個(gè)點(diǎn)的提升,可能在今天的中國更有價(jià)值。

我很好奇,您覺得Agent,你是什么時(shí)候意識到它是一個(gè)什么新的產(chǎn)品的機(jī)會,以及你現(xiàn)在認(rèn)知是什么,你覺得現(xiàn)在我們離一個(gè)好用的Agent bottlenck(智能體瓶頸)在哪里呢?

湯道生我們做的Agent,針對不同場景有不同的產(chǎn)品形態(tài),在Agent設(shè)計(jì)上面,很大程度是發(fā)揮好模型能力,當(dāng)然模型在迭代它能力越強(qiáng)Agent需要做的工作越來越少。

我看我們好幾個(gè)產(chǎn)品在過去這段時(shí)間是隨著模型能力加強(qiáng)。我們可以把產(chǎn)品,把Agent做的更簡化,更多的給模型提供更多不同的工具,創(chuàng)造更多的skills,來讓模型能夠更高效的去完成任務(wù),給模型提供更多的我們叫記憶,用戶過去使用一些習(xí)慣。

我們能提取出來的一些用戶preference的信息作為上下文,在Coding環(huán)境有相關(guān)的context給到模型,在Workbuddy里邊辦公協(xié)作,做個(gè)PPT,可能大家關(guān)注的內(nèi)容或者該給到模型的context也會不一樣。

所以在我們做不同的Agent,我覺得更重要是了解場景下什么內(nèi)容,什么信息,是重要的,比較relevant的,能夠跟模型配合好,讓模型有它需要的信息,同時(shí)也發(fā)揮它的能力。

姚順雨最近我們確實(shí)推出一些像Workbuddy口碑不錯(cuò)的產(chǎn)品,背后很多小團(tuán)隊(duì)在快速迭代產(chǎn)品,我其實(shí)挺好奇,相對于傳統(tǒng)的產(chǎn)品研發(fā),你覺得在新的Agent時(shí)代的研發(fā)和組織管理上,產(chǎn)品團(tuán)隊(duì)發(fā)生什么變化,你的思考是什么?

湯道生我前陣子在幫Workbuddy做一個(gè)組織發(fā)文,我看了一下他們那個(gè)非常扁平化的組織,跟我們過去的其他產(chǎn)品組織架構(gòu)有很大差異。

更多小團(tuán)隊(duì)三個(gè)人五個(gè)人,可能圍繞某一個(gè)領(lǐng)域來做攻堅(jiān),而且有很多試驗(yàn)在里面,還要支持Infra(基礎(chǔ)設(shè)施)做實(shí)驗(yàn),讓不同的小分隊(duì)可以去探索然后再驗(yàn)證

因?yàn)樵囼?yàn)大部分拿不到正向反饋,我們也要包容團(tuán)隊(duì)去試錯(cuò),這種通過大量試驗(yàn)去提煉出對于用戶流程這對于我們想要的這個(gè)結(jié)果有正向幫助,這個(gè)是我覺得今天做Agent,做原生AI產(chǎn)品,這個(gè)組織形態(tài)要能夠比較好去支撐。

另外,原來可能有很多工程師有很多時(shí)間花寫代碼,但是今天毫無疑問他們這些工作可以交給AI了,所以我們會看到更多角色的融合,大家都是產(chǎn)品經(jīng)理,都要去了解透徹用戶需求,以及設(shè)計(jì)出我們想要的產(chǎn)品形態(tài)。

每一個(gè)工程師更像一個(gè)有想法的leader(領(lǐng)導(dǎo)者),驅(qū)動多個(gè)Coding Agent,針對我們想要的產(chǎn)品需求去做研發(fā)、開發(fā)。同時(shí)要參與評測、測試,比較前置,也用好AI能力,把這些質(zhì)量保證工作,對齊工作要做到前面來。

我也想再問一下一個(gè)可能大家比較多討論的一個(gè)問題,很多人都會提到騰訊慢,AI上面我們沒有及時(shí)抓住一些機(jī)會,你覺得我們真的慢了嗎?到底下半場是什么?你能再多說一下嗎?

三、騰訊AI真的慢了么?

姚順雨感覺應(yīng)該是我問你的問題。

湯道生哈哈。

姚順雨我覺得首先AI其實(shí)今天有兩個(gè)重要判斷,第一個(gè)就是說我們認(rèn)為AI是一個(gè)短期的游戲還是長期游戲?在硅谷大家蔓延很多情緒。哎呀,一兩年后所有人都要失業(yè),AI要取代所有人的工作,我們要趕快賺兩年錢退休。

很顯然我們的判斷AI是一個(gè)長期游戲,其實(shí)我覺得AI剛開始,下半場才剛剛開始,我不認(rèn)為ChatGPT和ClaudeCode會是唯一的superApp(超級應(yīng)用),我覺得那是一個(gè)非常灰暗的世界,我覺得肯定會有源源不斷新的機(jī)會誕生。

可能今天就像是70年代PC(個(gè)人電腦)剛剛產(chǎn)生的時(shí)候,我覺得還有很多很多事情需要做。

第二個(gè)判斷,它會是個(gè)更線性還是多元游戲?因?yàn)榇_實(shí)過去幾年大家能看到的是Pre-training(預(yù)訓(xùn)練)、post training(后訓(xùn)練),然后Agent,Coding Agent,似乎有一個(gè)非常清晰的主線,這個(gè)主線是所有人都在做一樣的事情,都在copy(抄襲),這也是非常灰暗的事情。

但到底未來變得更單一還是更多元?我個(gè)人看法會變得更多元,毫無疑問Coding Agent生產(chǎn)力會變得更加重要,我覺得它是剛剛開始的事情,這個(gè)世界還有很多空間沒有被填滿,多模態(tài)、具身智能,很多很多新的事情都在發(fā)生,或者剛剛發(fā)生,所以從這個(gè)角度來說,如果我們認(rèn)為下半場剛剛開始,可能確實(shí)不是完了。

過去模型、產(chǎn)品做了很多探索,走很多彎路,我覺得這是正常的,你如果沒有做過一個(gè)事情,第一次做肯定有曲折,但是我覺得可能更重要的事情是能不能誠實(shí)面對自己,能不能Be Real,能不能夠去看到feedback然后去改變,能不能夠保持耐心,這個(gè)事情是下半場最重要的事情。

湯道生大家對于騰訊經(jīng)常喜歡挑某一個(gè)點(diǎn)來批評,當(dāng)然我覺得我們也很歡迎大家給我們提更高的要求。

我們是一個(gè)非常多業(yè)態(tài)的公司,有很多產(chǎn)品分布在很多的賽道,同時(shí)也有很多的團(tuán)隊(duì)在推進(jìn)不同的項(xiàng)目、事情。所以毫無疑問,在這樣一個(gè)復(fù)雜的組織里面有一些地方可能我們做得快了,有的地方做得慢了,有一些地方可能會做失敗,在探索。

所以我覺得這些提醒都非常好,我覺得確實(shí)有一些地方我們是可以做得更好,但是就像你說的,這是一個(gè)長跑,這是一個(gè)馬拉松,騰訊還是有非常豐富的場景。

就你一開始提到選擇騰訊,因?yàn)锳I需要Context,模型需要很多的這些上下文,其實(shí)騰訊在過去多年不同產(chǎn)品,在不同賽道的這些積累,其實(shí)都是可以針對每一個(gè)場景去為模型提供有用的信息,提供這些Context來發(fā)揮價(jià)值。

在這樣一個(gè)長跑,我相信模型會不斷迭代,用戶的需求也在不斷變化,也會有新的產(chǎn)品形態(tài)出現(xiàn),我覺得我們比如說今年年初對Agent這一波熱潮也反應(yīng)比較快。同時(shí)也有像WorkBuddy這樣的智能體產(chǎn)品,其實(shí)也是幾年前開始做的產(chǎn)品,沿著原來做Coding、CodeBuddy,慢慢看到非程序員也有很強(qiáng)的需求,我們也能比較快去應(yīng)對,今天也聽到很多客戶對于我們的不同產(chǎn)品怎么去組合起來有非常高的期待。

所以我們正在長跑中,也請各位多給我們提醒,給我們建議,也多用我們的產(chǎn)品來給我們正向的反饋。

我看時(shí)間其實(shí)都超時(shí)了,我想我來首先感謝順雨今天的分享,我們剛才其實(shí)圍繞了做模型、做產(chǎn)品,談到了Co-Design,談到了Agent的演進(jìn),也提到了組織變革,行業(yè)的一些機(jī)會,在過去一年其實(shí)我們看到非常多企業(yè)也有共同的困惑或者面臨同樣的挑戰(zhàn)。產(chǎn)品如果用不好,企業(yè)不能持續(xù)去投入,或者ROI(投資回報(bào)率)不夠,這都會影響AI在企業(yè)里面普及的進(jìn)度。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
張家齊退役一個(gè)月能拿多少工資?你可能想不到

張家齊退役一個(gè)月能拿多少工資?你可能想不到

呂醿極限手工
2026-06-11 19:43:45
泰國法院判處兩名中國籍男子死刑,外交部:中方支持泰方依法審判

泰國法院判處兩名中國籍男子死刑,外交部:中方支持泰方依法審判

第一財(cái)經(jīng)資訊
2026-06-11 16:18:12
美軍開始空襲伊朗

美軍開始空襲伊朗

財(cái)聯(lián)社
2026-06-11 05:42:11
于東來坦言“員工其實(shí)不值這么多錢”,正式啟動薪酬體系改革

于東來坦言“員工其實(shí)不值這么多錢”,正式啟動薪酬體系改革

大廠編外實(shí)習(xí)生
2026-06-11 19:26:10
外交部發(fā)言人宣布中方對菲律賓國防部長特奧多羅及其親屬實(shí)施制裁

外交部發(fā)言人宣布中方對菲律賓國防部長特奧多羅及其親屬實(shí)施制裁

界面新聞
2026-06-11 20:07:10
自費(fèi)也被追責(zé)?多省開始查自費(fèi)項(xiàng)目

自費(fèi)也被追責(zé)?多省開始查自費(fèi)項(xiàng)目

醫(yī)脈圈
2026-06-10 20:25:59
北京退衣姐被刑拘!警方上門逮捕仍囂張,勢力大不差錢,疑有靠山

北京退衣姐被刑拘!警方上門逮捕仍囂張,勢力大不差錢,疑有靠山

奇思妙想草葉君
2026-06-11 17:29:38
世界杯揭幕戰(zhàn),央視直播有變!墨西哥優(yōu)勢明顯,韓國迎戰(zhàn)歐洲勁旅

世界杯揭幕戰(zhàn),央視直播有變!墨西哥優(yōu)勢明顯,韓國迎戰(zhàn)歐洲勁旅

十點(diǎn)街球體育
2026-06-11 21:24:20
人大附中“體制內(nèi)考生”刷屏全網(wǎng),高考成績是他們最不值一提的優(yōu)勢

人大附中“體制內(nèi)考生”刷屏全網(wǎng),高考成績是他們最不值一提的優(yōu)勢

桌子的生活觀
2026-06-11 12:29:43
她是我見過最漂亮,身材最好的大學(xué)老師,上她的課絕對不會遲到!

她是我見過最漂亮,身材最好的大學(xué)老師,上她的課絕對不會遲到!

阿廢冷眼觀察所
2026-06-11 19:41:16
于東來稱薪資上太溺愛員工,其實(shí)不值這么多錢

于東來稱薪資上太溺愛員工,其實(shí)不值這么多錢

界面新聞
2026-06-11 17:55:06
24小時(shí)內(nèi),菲律賓對華態(tài)度大變!馬科斯說:我們不能像日本那樣

24小時(shí)內(nèi),菲律賓對華態(tài)度大變!馬科斯說:我們不能像日本那樣

阿器談史
2026-06-11 12:33:52
網(wǎng)傳武漢大學(xué)7000多退休職工,月均領(lǐng)10000,每年需9億社保供應(yīng)…

網(wǎng)傳武漢大學(xué)7000多退休職工,月均領(lǐng)10000,每年需9億社保供應(yīng)…

慧翔百科
2026-06-09 12:21:35
上映16天被觀眾趕出院線!網(wǎng)播也救不了它,事實(shí)證明爛片已無市場

上映16天被觀眾趕出院線!網(wǎng)播也救不了它,事實(shí)證明爛片已無市場

星宿影視鴨
2026-06-11 14:45:57
北京的男男女女為什么一直不結(jié)婚?原來有這樣一個(gè)完美的閉環(huán)

北京的男男女女為什么一直不結(jié)婚?原來有這樣一個(gè)完美的閉環(huán)

回旋鏢
2026-06-11 19:45:32
1美元養(yǎng)個(gè)美國號?NordVPN的eSIM讓你全球收驗(yàn)證碼

1美元養(yǎng)個(gè)美國號?NordVPN的eSIM讓你全球收驗(yàn)證碼

字節(jié)漫游指南
2026-06-11 04:15:53
中紀(jì)委怒批:公務(wù)員也是人,正常生活不應(yīng)問責(zé)處理

中紀(jì)委怒批:公務(wù)員也是人,正常生活不應(yīng)問責(zé)處理

細(xì)說職場
2026-06-10 18:51:23
63歲阿湯哥被曝“越老越瘋”,同行都看不下去了

63歲阿湯哥被曝“越老越瘋”,同行都看不下去了

生活觀察員啊
2026-06-11 01:22:03
24歲女子做正頜手術(shù)后臉部歪斜“地包天”加劇!主刀醫(yī)師:我喜歡這種面型;二次修復(fù)費(fèi)用超30萬元;當(dāng)?shù)匦l(wèi)健委介入

24歲女子做正頜手術(shù)后臉部歪斜“地包天”加劇!主刀醫(yī)師:我喜歡這種面型;二次修復(fù)費(fèi)用超30萬元;當(dāng)?shù)匦l(wèi)健委介入

新民晚報(bào)
2026-06-11 12:25:16
歐洲的六代機(jī),還有戲嗎

歐洲的六代機(jī),還有戲嗎

樞密院十號
2026-06-11 18:29:06
2026-06-11 23:00:49
財(cái)經(jīng)AI湃 incentive-icons
財(cái)經(jīng)AI湃
聚焦AI和產(chǎn)業(yè)AI化
674文章數(shù) 650關(guān)注度
往期回顧 全部

科技要聞

淘寶、京東、拼多多、抖音、小紅書被約談

頭條要聞

特朗普:美國將重創(chuàng)伊朗 并在不久的將來占領(lǐng)哈爾克島

頭條要聞

特朗普:美國將重創(chuàng)伊朗 并在不久的將來占領(lǐng)哈爾克島

體育要聞

比起總冠軍,更大的懸念成了FMVP?

娛樂要聞

《花少8》陣容大揭秘!秒殺前一季

財(cái)經(jīng)要聞

干細(xì)胞生意:17萬一針的希望

汽車要聞

激光雷達(dá)+自研芯片 新樂道L60上市租電13.58萬起

態(tài)度原創(chuàng)

教育
家居
房產(chǎn)
本地
公開課

教育要聞

志愿填報(bào)全丟給機(jī)構(gòu)?它們只想賺你的錢!

家居要聞

空間微調(diào) 移形換境

房產(chǎn)要聞

科城·美林學(xué)筑5月領(lǐng)跑崖州灣:成交價(jià)、銷售套數(shù)、轉(zhuǎn)化率三項(xiàng)第一

本地新聞

世界杯還沒開始,蘇超已經(jīng)火到爆梗

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版