1
Anthropic禁止訂閱用戶通過龍蝦等第三方工具接入后,小米大模型團隊負責人羅福莉凌晨發了篇帖子討論這事。
![]()
主要內容可以概括為兩點。
第一,A社的做法雖然會短期推高使用成本,如果用戶繼續使用Claude模型,但長期來看會帶來很好的工程紀律。
工程紀律的意思是,社區會因為模型成本上升,在開發產品時做更合理的工程優化來提升token的使用效率。
這里她點名批評了龍蝦,上下文管理做得很拉胯,一個用戶請求會觸發多輪工具調用,每次都是攜帶長上下文的獨立API請求。
第二,她呼吁模型廠商不要打價格戰,不要靠低價吸引用戶入坑后,又用縮水的模型和不穩定的服務去損害體驗。
我們前兩天寫了篇文章,《小米這次也沒把價格打下來》,其中提到MiMo Token Plan目前價格相對其他廠商同等套餐偏貴。
羅福莉沒有直接承認這點,但間接回答了這個問題:小米的目標是“長期穩定地交付高質量的模型和服務 —— 而不是讓你沖動付款,然后棄船。”
我們之前文章里提到,MiMo套餐偏貴的事實其實跟小米給大眾的主流印象是有差距的,畢竟觀眾更熟悉性價比敘事。
但這也不是小米搞AI后就變了,小米這個定價肯定也談不上賺錢,只是在其他選手虧損搞token傾銷的時候,選擇了更貼近成本的定價策略。
token傾銷這個詞可能有點重,因為要是以低于成本售賣AI服務這個標準看,目前行業里基本沒誰能逃得過。
但有些玩家定價的確相當激進,低價吸引用戶過來后保證不了體驗,比如我就遇到過某家套餐服務卡頓甚至不可用的情況。
大模型跟其他傳統互聯網產品不同。傳統互聯網產品邊際成本可以不計,用戶翻倍成本增加很少。大模型產品成本跟用戶規模比例擴張。
而且還因為是非標品,廠商很容易在背后做手腳,稍微降點智用戶不容易察覺,察覺到也沒有實際證據。
當然,即便存在這些一些問題,我仍然認為模型廠商價格戰是利大于弊的,是雙贏的局面。
用戶客觀上因為價格戰得到了便宜,這是加速新技術采納的決定性因素。
DeepSeek去年的模型并沒有在能力上超過GPT或者Claude,但R1的意義仍然沒有被高估,因為把成本降低幾十倍對技術普及的促進必然強于某個增量SOTA模型。
至于虧錢賣token不可持續,我只能說不是現階段二線廠商配考慮的問題。
Anthropic模型能力頂尖,產品體驗差異化,所以哪怕經常封號拔網線也一堆用戶求著交錢。
彭博上個月報道,Anthropic當時年化收入已經達到200億美元,相比去年底翻倍還多,這個夸張的增長速度隱隱有取OpenAI而代之的意思了。
但二線廠商之間模型能力并沒有拉開差距,不同廠商輪流領先,性價比是不得不走的路子。
羅福莉評價是對的,龍蝦就是vibe coding出來的一堆屎山。
因為是屎山,所以它沒有架構設計,沒有工程優化,天生就浪費效率。
但它能火起來,能讓一堆專業的非專業的用戶愿意用,就已經算是功德無量了。
所有二線廠商都應該給龍蝦磕一個,我很難想象沒有龍蝦他們得多努力才能證明自己的價值。
這是OpenRouter上不同模型的使用統計
![]()
在龍蝦火爆之前,你在這個排行里根本看不到二線模型廠商,除了硅谷御四家,其余全是others。
但現在排行榜前幾名,已經被阿里、小米、階躍星辰的模型占滿了。
![]()
話說新模型出來,免費放OpenRouter上吸引大家用一用,已經成為國內廠商的慣例。OpenRouter現在已經淪為PR前沿陣地。
這兩天阿里發布Qwen3.6,宣傳登上OpenRouter排行榜首。小米MiMo之前也宣傳登頂了OpenRouter。都是免費試用。
某種程度上說,龍蝦耗token甚至可以理解成是feature。
大模型研發門檻很高,但大模型供給一直以來都是不稀缺的,因為用戶不需要那么多模型。龍蝦把性價比放大成了真正的競爭力。
簡單拉下數據。MiniMax去年總收入7900萬美元,龍蝦爆火后2月ARR已超1.5億美元。月之暗面發布K2.5模型后,不到20天收入超去年全年,且海外收入首次超過國內。
AI的確在推動各個產業發生變革,不過就AI自身而言,至今為止都還沒有跑通獨立的盈利模式。OpenAI和Anthropic收入在快速增長,但能否覆蓋巨額研發和資本支出仍有疑問。
至于智譜、MiniMax和月之暗面們,距離閉環的商業模式就更為遙遠了。
這種情況下,敘事成為生存的要義。敘事不能只靠畫餅,模型廠商的第一性原理就是模型得有人用。
沒人用,敘事就崩塌了。有人用,越來越多人用,敘事才會變得圓滿。
去年底,月之暗面估值43億美元,現在正以180億美元尋求融資,翻了四倍不止。智譜今天收盤780港幣,是1月份IPO發行價116港幣的6.7倍。MiniMax的IPO發行價是165港幣,現在股價是950,也是翻了快6倍。
不能只算token賬。
2
二線模型廠商在成本和規模壓力下,已經有提價動作。但這暫時不會達到擺脫價格戰的地步。
小米的處境比較特殊,它有自己完整的產品矩陣和硬件生態,MiMo的第一使命是融入并改造這個現有生態。哪怕不對外賣token,小愛同學、智能手機、小米汽車、IoT設備生態,MiMo都能有大有作為的空間。
智譜、MiniMax、月之暗面們則處在另一個處境。它們有C端產品,但這個賽道競爭極其慘烈。目前看來獨立的AI產品,無論是通用助手,還是細分賽道,字節、騰訊和阿里都有碾壓性的優勢,也有爭奪的意志。
相較之下,API賣token的生意看起來好一些,雖然好得有限。因為這只關乎模型質量,而騰訊和Meta的經驗表明,模型研發不只是錢和資源的因素。
但龍蝦窗口期不會無限延續。
如果龍蝦只是一陣風,過段時間隨風而逝,那自然二線廠商也就不能指望這個出貨渠道了。
如果龍蝦代表的不是一個工具的短暫流行,而是C端AI產品的一種范式,那大科技公司一定會出手。
這些公司有流量、有分發、有用戶信任,它們會以自己的競品收割市場,并且會優先使用自己訓練的模型,而不是采購二線廠商的API。
模型跟產品的結合是大趨勢。阿里打通千問App跟通義模型研發團隊,搞出了組織調整和人事出走風波。姚順雨入職騰訊,也是首先做團隊整合,不同研發部門之間的整合以及研發跟產品的整合。
羅福莉批評龍蝦耗token,提到Claude Code更節省上下文的工程設計,這是另一個產品需要跟模型打通的案例。
龍蝦架構上的天然缺陷,意味著每次工具調用都攜帶完整的長上下文發起獨立請求,用戶的一個操作可能在后臺觸發十幾輪API調用。這不僅燒token,也制造延遲,制造不穩定。
Claude Code對上下文做精細管理,知道什么時候該壓縮歷史,什么時候該截斷,怎么在保留任務狀態的同時減少冗余信息的傳遞。
這背后是Anthropic對自己模型能力邊界的深刻理解。只有模型研發者,才能把產品和模型調優成渾然一體的東西。
AI產品的第一代范式是,模型作為通用API,產品套在外面。這個范式催生了龍蝦,也催生了無數套殼應用。它降低了創業門檻,但也帶來了巨大的效率浪費。產品不理解模型,模型不適配產品,兩邊都在用蠻力彌補彼此的信息差。
如今第二代范式正在浮現:模型與產品深度整合,從架構層面共同設計。Claude Code是一個樣本:模型不再是被調用的服務,而是產品本身的一部分。
這個趨勢下,純粹的模型API廠商面臨的壓力會越來越大,沒有產品可能成為它們的致命缺陷。如果競爭力來自模型與應用層的深度整合,那API層的價格競爭就是一場慢性消耗。
行業一直喜歡說模型即產品,用這句話強調模型的基礎作用和重要性沒問題。但除非你的商業模式是只賣API,否則模型始終是產品的組成部分,而不是產品的全部。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.