![]()
「金山銀山前路有」
「同志們朋友們,版本回調了!
搞AI應用的家人們沒活了。勝利女神的天平又一次傾向了大模型公司一邊。有鑒于此,我們將復刻致敬葬AI一年前的系列——把模型公司挨個寫一遍。
之前已經寫過了Kimi、智譜和豆包,其他模型公司敬請期待」
阿里巴巴是一家很神奇的公司。
現在AI火成這個樣子。GLM 5.2達到Opus 4.8水平,智譜徹底擺脫2G公司老教授組團爆金幣的刻板印象,市值突破萬億港元,約等于1/2阿里。
我在做完第一期后,立即發現了GLM 5.2牛逼,同時發現的還有Qwen 3.7 Max也很牛逼,只比GLM差一點點,達到了Opus 4.7水平。
阿里的牛逼之處就在這里。Qwen 3.7 Max是當之無愧的國模第二,顯著領先字節的Seed 2.1 Pro。
但是大伙就是認為阿里是一家老登公司。在模型牛逼的情況下,我們親愛的阿里巴巴,股價就這么夢回十二年前,美美跌破發行價。
![]()
https://funeralai.cc/test/
這是因果啊家人們。
阿里往死里干美團小王,雖然小王一頭白發,下罪己詔說股價崩了自己有很大責任,但阿里也沒好日子啊。中高P年包直接縮水小一半好吧。
所以啊,到底干外賣還是AI,這是阿里兩條路線的斗爭,不是外賣壓倒AI,就是AI壓倒外賣。
道理很簡單,全球科技巨頭都All in AI,但阿里還在干外賣,那空頭不干你干誰。
好了,扯淡結束。讓我們來正經論述一下阿里的AI業務。
阿里是一家喜歡搞組織改革的公司,它的AI業務也處在非常激烈的組織變動中。
首先是林俊旸出走,催化阿里搞出Token事業群(ATH),合并所有AI業務,將原屬于阿里云、淘天等的AI業務劃到新事業群里。
然后是在ATH事業群中成立Token Foundry事業部,合并了所有模型團隊,由吳媽直接領導,老板直管大模型。
最近是文筆非常優美的《置身釘內》,催化了阿里合并Agent產品,釘釘老大換人,Mulerun和悟空合并。
所以阿里目前的AI業務是這個情況。
ATH事業群,下轄Token Foundry事業部、MaaS事業部、千問APP事業部、悟空事業部和創新事業部。
Token Foundry事業部,包含了Qwen、Wan、Happy horse等系列模型;
MaaS事業部,最近把難用的百煉后臺套殼為簡潔的千問云;
千問APP事業部,主要是夸克團隊在做的千問APP;
悟空事業部,包含了釘釘和2B Agent悟空;
創新事業部,目前主要剩個Qoder,之前在這的MuleRun剛和釘釘合并。
![]()
一目了然,阿里在大整合AI業務。
從組織、模型再到產品,逐步進行大整合。目標是實現一家公司、一個模型、一個產品。「阿里-Qwen-千問」三軸心。
問題要從千問APP說起。
眾所周知,豆包APP斷檔式領先,其中最重要的因素可能是多模態。
大伙在聊天框里打字,那各個Chatbot就是沒什么區別。考慮到Qwen模型好很多,千問APP理論上應該更聰明。但家人們用豆包也不需要多聰明啊。
我印象最深刻的兩個豆包使用場景是:年初葬愛家族去通化滑雪,出租車司機一直開著豆包語音聊天,從俄烏戰場一路聊到縣城房價;
我家裝修漏水,裝修公司扯皮,我媽給豆包打電話,豆包找出了裝修公司老板的聯系方式,我媽電話打給老板,問題解決了。
這么好的功能,不抄真是可惜了。
令我震撼的是,千問APP其實是有語音視頻功能的。但是藏在輸入框上的工具欄里,你得猛猛左滑才能找出來。
![]()
藏這么深,說明不是千問APP想不到,更不是沒能力搞多模態。單純是堅信非共識,在給Chatbot加Agent能力上一路狂奔
除了做辦公三件套這些基礎能力外,還有打通淘寶、高德,讓Agent幫你點奶茶、訂餐館、打車等一系列能力aka千問辦事。
首先,這是創新,要肯定的。像前兩天熱炒的豆包謊稱可以打電話訂餐館,其實千問APP幾個月前就有這功能,真可以讓AI打電話訂餐。
但問題是,涉及到跨APP的工具調用會帶來嚴重的任務成功率低的問題。更重要的是,Chatbot是一階能力,Agent是二階能力,之間的漏斗可能篩掉90%的人。
一階能力都沒補全,想靠未經驗證的二階能力彎道超車,著實平地干拔。
當然也有可能,千問產品經理在大氣層。賭的是大模型Agentic能力快速上漲,這些復雜任務越來越流暢。
這些都是產品細節問題。最重要的是,千問APP推出得太晚了。
豆包APP從23年開始干,25年中上線了視頻通話功能。等到25年底,豆包表情包、二創視頻滿天飛了,千問APP才上線。之前的通義和夸克這倆APP,約等于合并后從頭再來。
所以,從錯過豆包的經驗教訓,你可以理解阿里今天干的所有事——要合并,要力出一孔,要集中力量做AI。
不過好消息是,AI行業整體版本更新了。大伙發現豆包也不掙錢,或者說2C的AI應用就是不掙錢。
唯一的由邪惡的Anthropic驗證出來的AI掙錢路徑是,卷編程能力,面向生產力場景。只要模型能力足夠牛逼,自然有大把人求著送錢。
最鮮活的例子就是智譜,收入多少完全不重要,只要GLM能打穿編程場景,追上Opus 4.8,那它就值得半個阿里。
就像是智譜老板唐杰說的那樣,「AI時代的本質就是技術的快速進步——當你停下來打磨產品,可能第二天就發現底層技術已經落后、產品已經沒人用;當你停下來思考商業模式,AI世界已經再次被顛覆。」
所以,一切還是回到模型能力上。
只要Qwen模型能夠持續領先,那它的生產力Agent如Qoder work等,做好是很自然的事情。
如智譜故事。因為GLM會員難搶,所以很多人下載智譜的Agent產品Zcode。這里要表揚智譜一句,抄Codex是對的,不像Kimi work抄都抄錯對象,抄了產品一坨的Claude cowork。
![]()
如Seedance故事。只要模型能力夠強,自然有冕神和LibTV這樣的分銷商,竭盡全力自己補貼,幫火山引擎沖業績。小云雀、即夢的視頻Agent做得怎么樣,根本不重要好吧。
所以,問題回到了如何評價Qwen上。
好消息是,Qwen確實是領先的。壞消息是,總差那么一點點。
你從Qwen的模型發布上都能看出來,阿里老板對Qwen最重要的期待就是打穿一個點,徹底破圈,讓人民群眾覺得Qwen牛逼。
為此,Qwen 3.7 Max和GLM一樣舍棄了多模態能力,專注編程和長程任務場景。
但就差一點點。你從智譜自己跑的Benchmark都能看出來,Qwen在好幾項測試得分是持平或超越GLM、Opus的。兩者實際能力差距可能不到一個百分點。
![]()
但就是這一點點差距,決定了GLM是國模第一。在Fable 5被限制的這一個月里,GLM也是世界人民能自由用上的最強大模型。
第一的獎賞遠遠大于第二名。這段時期所有人都在討論智譜,沒有人討論Qwen。
所以啊,存在一個國模臨界點。
當一個大模型的能力能夠持平A畜O社的旗艦模型,或者開源出類似CoT那樣超乎絕倫的產品形態時,整個世界的注意力都會集中到這個模型上,它會被賦予挑戰邪惡科技巨頭壟斷的騎士大戰惡龍一樣的角色。
我問一個炒股老哥,要是年底Qwen率先超越Fable 5,阿里股價能拉20個點嗎?老哥第一反應是,別說20個點,100個點問題不大。
我對Qwen還是非常樂觀的。因為兩者最新模型能力非常接近,而Qwen 3.7 Max比GLM 5.2早發布了一個月,并且Qwen的更新頻率比GLM略快。
所以,下一代Qwen模型大概率能夠領先GLM,成為國模第一。
但問題就出在這里。
Qwen現在就很牛逼,短期內大概率突破臨界點,但這代表阿里巴巴集團會遵循一種線性關系變得偉大起來嗎?
所以問題又回到了,Qwen牛逼不代表阿里股價要漲。因為大伙心中阿里不是一家純粹的AI公司,它還在打爛仗。
順便插一句,作為阿里股東,這里我要點名批評Happy horse。
成天刷榜騙哥們可以,別把自己騙了。視頻模型刷榜是沒用的,因為視頻好壞大伙一眼能看出來。Happy horse生成的畫面油成那樣,你說自己超過Seedance是沒人信的。
這是一個常識問題,不要成天考驗大伙的常識。
最后抽象地總結一下吧。
ChatBot是第一階段的競爭。第二階段的競爭,生產力Agent,才剛剛開始。
你能明顯發現,阿里和字節兩家的Agent產品,都還在賽馬。字節有豆包專業版、Trae work、Coze和飛書的一堆Agent。阿里有千問桌面版、Qoder work,Mulerun剛和釘釘悟空合并。
顯然,這種狀態不可能持續多久。之后的情況一定是BAT各自合并出一個Agent產品。
這方面,騰訊吃了元寶和模型不行的紅利,不用糾結,主推Workbuddy就行。
相比起ChatBot,Agent產品更加考驗模型的長程任務能力。字節的基模能力不行會成為一個更大的問題。
大伙的潛意識會因為豆包產品強而濾鏡Seed模型。但Seed 2.1 Pro事實上是二流國模水平,落后GLM、Qwen和Kimi,和我們親愛的MiniMax M3水平接近。
這也是一個很好玩的問題,為什么字節產品和視頻模型無敵,而Seed基模一直沒做起來?
經過我的一番思考,原因很可能是:Seed團隊太火了,外界預期太高,總有人攛掇研究員出去創業,動搖軍心。
反觀做出大結果的Deepseek、Seedance和GLM,都是之前沒什么人關心,團隊可以專注地猥瑣發育aka邊緣創新,模型能力逐步突破臨界點,外界后知后覺猛然意識到這團隊憋了個大的。
這是一個組織問題。
即便Seed工資很高,豆包股猛猛發。但總不能讓研究員們人均開上法拉利。而創業bro真有人開上法拉利。投資人拿這些誘惑你,確實難頂。
歸根結底還是,大模型是一個工程問題,依靠整個團隊都純粹專注努力,那些可惡的投資人(特指兩家盯著字節的VC和FA)和競對成天挖人干擾軍心可不行。
另一個原因是,C端產品做得好,對模型的編程能力不一定是促進。你看掌握了充足C端數據的公司,谷歌、Grok、Meta,模型一個比一個拉。
眾所周知,豆包產品團隊自己做了很多后訓練,音視頻功能背后也不止一個模型。產品做得好,團隊話語權大,模型團隊自然多一個爹。爹強兒弱很合理。
所以啊,阿里外界形象拖累人民群眾對Qwen的預期,這真的是福報,要珍惜。
(本文封面由ChatGPT 生成,純人工寫作,順便點一首歌)
??
歡迎訂閱我們的Substack
funeralai.substack.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.