![]()
作者|畫畫
兩年前,所有AI公司都在搶同一樣東西:模型。兩年后,騰訊開始搶另一種東西:問題。
如果接下來比拼的是誰更了解真實世界,那么騰訊手里最大的資產,可能不是混元。而是微信、企業微信、騰訊會議、騰訊文檔每天產生的那些問題。
就在今天的騰訊AI產業應用峰會上,騰訊集團高級執行副總裁湯道生,和騰訊AI首席科學家姚順雨進行了一場罕見的公開對談。
一個是做了二十年產品的老兵,一個是ReAct架構提出者、去年剛加入騰訊的AI科學家。這場對談,本質上講的就是一件事:騰訊為什么開始把問題當成戰略資產?
![]()
一、錘子夠多了,釘子在哪
過去幾年前沿行業形成了一個共識,預訓練、后訓練、強化學習,不斷提高模型能力。模型更強,產品就更好。這是一條清晰的主線。
但姚順雨提出了一個不一樣的判斷。他認為,AI已經發展幾十年,過去最難的是尋找好的方法。但最近方法論已經變得非常成熟,反而尋找問題變得更加困難。
為什么?
一個直接的原因是,模型正在快速趨同。今天最先進的大模型之間的能力差距,已經不像兩年前那么夸張。大家都能寫代碼、都能推理、都能搜索、都能調用工具。
姚順雨用了一個比喻,有了預訓練和后訓練之后我們發現,我們像有一個萬能錘子,它可以砸任何釘子。它是一個通用方法論,可以解決各種各樣的問題。
當錘子變成標配的時候,真正的問題就變成了,去哪里找到值得砸的釘子?
當底層通用能力的水位線被抹平之后,新的壁壘就浮出來了。姚順雨把這個壁壘叫做Context。模型越來越擅長把復雜輸入變成輸出,競爭壁壘在于你有沒有最原始的輸入。你知不知道這個人在干什么,知不知道這個企業各種各樣的信息。
簡單來說,誰更了解真實世界,誰就擁有更多模型進化的機會。
二、用戶的十萬個為什么
騰訊并沒有試圖把自己包裝成一家純模型公司。它在強調另一件事,騰訊擁有中國互聯網最大的真實問題集合。
微信有問題。企業微信有問題。騰訊會議有問題。騰訊文檔有問題。游戲有問題。廣告有問題。客服有問題。企業數字化有問題。
這些問題每天都在發生。每天都在產生數據。每天都在形成反饋。對于AI來說,這些問題本身就是最好的訓練場。
姚順雨展開了這個邏輯,他說LLM時代最本質的區別是泛化性。即使你只想做好一個Coding Agent,你需要的遠不止Coding數據,你需要聊天、搜索、指令遵循、推理,它是非常復合的數據分類學體系。產品體系化的公司,會有比較大的優勢。
他進一步講道,我們和元寶的Co-Design使模型產生很強的聊天和搜索能力,這些能力又可以遷移到ima和WorkBuddy。不同產品提供不同數據,但數據之間可以相互泛化,形成一個網絡一樣的體系。
產品矩陣不只是商業版圖。它是模型的訓練場網絡。每一個產品場景背后,都是一個獨特的問題發生器,不斷產生模型最需要的真實反饋。
湯道生整場對談提到最多的是用戶、客戶、需求、業務流。他說做產品的第一性原理從來沒變,還是解決用戶的問題。
混元最新模型Hy3 preview在OpenRouter連續數周登頂周榜,不是因為參數最大,而是因為它在十幾個產品里被真實用戶反復打磨,接入后首字響應速度提升54%,任務平均完成時間縮短47%,任務成功率維持在99.99%。
模型的性能是被場景訓練和喂出來的。
湯道生還提到一個很具體的感受,做AI產品跟過去最大的不同是開放式的服務形態。
過去做產品,需求是有限的,交互是確定的,產品經理可以提前設計好所有路徑。但AI時代,用戶的問題是無限的、開放的。
“你不知道用戶會問什么。”
這意味著產品方必須給模型提供各種各樣的工具和上下文,來應對這種不可預測性。
而這種不可預測性本身就是問題的來源。越多人用、越多問題出現、越多數據回流,模型就越強。越強的模型又能處理越開放的問題,引來更多用戶。
三、模型決定下限,組織決定上限
相比模型和產品,整場對談最值得反復讀的部分,其實是組織。
AI已經進入一個特別依賴組織能力的階段。產品和模型開始互相定義,模型影響產品,產品反過來訓練模型,兩者變成閉環。這就是他們反復提到的Co-Design。
而Co-Design本質上不是技術問題,是組織問題。
模型團隊和產品團隊天然目標不一樣。模型想追求能力上限,產品想追求用戶價值。雙方經常沖突。
姚順雨說了一句很重要的話:Co-Design最難的不是技術,最難的是建立Trust。
他講了一個細節,當時預訓練還沒準備好,派了后訓練最強的骨干力量去幫元寶把后訓練做好。很多算法同學不理解,我需要很努力解釋。但這個動作讓產品團隊意識到模型的同學是真的在為產品著想,對之后的合作起了非常重要的作用。
不是靠KPI對齊,而是靠一次主動的資源讓渡。
姚順雨說選擇加入騰訊最重要的原因是文化:Trust、Low Ego、Long-term、Be Real。
今天,很多公司在討論Agent、模型、算力。但騰訊內部在討論另一個問題,模型團隊和產品團隊怎么在一起工作。組織能力這件事,恰恰是最難被復制的。
這種組織思維已經在騰訊內部產生了具體結果。過去兩年AI行業最火的敘事是超級個體,一個人可以是一個團隊。
但騰訊正在實踐的是另一種形態:超級團隊。
CodeBuddy已經覆蓋騰訊超過90%的工程師,AI生成代碼占比超過50%。CodeBuddy Code 2.0,4個人、58天、79個版本、90%代碼由AI生成。WorkBuddy幾個人的小團隊,兩天完成0到1,不到三個月發布43個版本。
湯道生描述這種組織形態用了一個詞:非常扁平。三個人五個人的小分隊。大量試驗,允許失敗。每一個工程師更像一個有想法的leader,驅動多個Coding Agent。
這些團隊已經不是人使用AI,而是人管理AI。企業最大的成本從來不是執行成本,而是協作成本,讓每個員工快20%容易,讓組織快200%才是真正難的事。
騰訊內部這些小團隊正在驗證的就是后一種可能性。
四、產品喂問題,問題養模型
縱觀大模型的發展趨勢,幾乎所有AI公司一度在做同一件事,先訓練模型,再尋找產品。
模型→產品,這是絕大多數公司的路徑。
騰訊正在走反方向:產品→模型→產品。
先從產品里發現問題。再讓模型解決問題。然后把模型重新放回產品。繼續產生新的問題,形成新的反饋
姚順雨在對談里提到一個很關鍵的技術細節來解釋為什么這條路徑跑得通:
Benchmark非常容易overfitting。但基于真實世界的數據會對模型研發有幫助,你能發現很多底線問題,你對真實的Prompt distribution會有更深的了解。
比如benchmark里的題目都是精確的、有很長的concrete description,但現實中用戶的問題往往模糊、簡短,會不停追問。這些場景可以啟發我們怎么更好做訓練。
這段話的意思是,真實產品里跑出來的數據,比任何人工構造的基準測試都更接近模型真正需要學習的東西。這是產品→模型這條路徑行得通的底層技術邏輯。
如果說大多數AI公司的核心資產是模型,那么騰訊真正在積累的是一條閉環:
問題→數據→Context→模型→產品→新問題。
這是一個不斷自我強化的循環。姚順雨自己的話說,不同產品提供不同數據,數據之間可以相互泛化,形成網絡。
這個飛輪一旦轉起來,轉得越久優勢越大,它不依賴于某一次模型的突破,而是依賴于整個系統的累積效應。
這條路徑有一個前提,你得有足夠多的產品、足夠多的用戶、足夠多的真實場景。而這恰恰是騰訊20多年來積累下來的東西。
過去它叫產品矩陣,今天它有了一個新的名字:問題供給網絡。
【版面之外】的話:
姚順雨在對談里提到一個細節,他重新讀了自己2019年的博士論文,結尾的future work列了四個方向:train models for Agent、safe and robust deployment、scientific discovery、help human。
七年后的今天,他說自己確實在做當時列的方向。
“但可能想得還是不夠大。”
我覺得這句話適用于整個行業。
今天所有人都在想AI怎么替代人、服務人。但也許更大的問題是,AI最終會催生出什么樣的組織、什么樣的公司、什么樣的協作方式。
誰先開始,認真去問這些問題,誰就已經走在了前面。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.