![]()
智譜股價暴漲之后,唐杰深夜在X上發了一條很長的思考。
這件事我建議大家不要只當成“創始人出來講觀點”,放在資本市場里看,它更像一次沒有PPT的戰略路演。
前一天,智譜股價暴漲36.9%,收在1150港元,創下歷史新高。從1月8日116.20港元發行價算起,四個多月漲了900%。這時候創始人出來談AI產業下一步,市場一定會聽。
唐杰講的核心詞,叫Long-Horizon Tasks,長周期任務。
聽起來有點學術,但翻譯一下:AI不能只會回答問題了,它得開始替人把事辦完。
過去兩年,我們看大模型,基本都在看“智商”。誰回答更準,誰寫代碼更快,誰上下文更長,誰榜單分數更高。這個階段,AI像一個聰明助理,你問一句,它答一句;你給一個任務,它做一小步。
但長周期任務不是這個邏輯,它要求AI在幾個小時、幾天,甚至更長時間里,持續推進一個復雜目標。它要自己拆任務,自己查資料,自己調用工具,自己試錯,自己判斷結果對不對。中間遇到問題,還要知道換路線,而不是卡在那里等人救。
這就不是“會聊天”的AI了,這是開始像一個“承包商”的AI。助手需要你告訴它每一步怎么干,承包商只需要你告訴它最后要什么結果。這個差別非常大。前者提高效率,后者改變組織成本。
這也是我覺得唐杰這條推文真正有價值的地方,它不是在講一個新概念,而是在告訴市場:AI行業的估值錨可能要變了。
以前模型公司講故事,講的是參數、榜單、API調用、模型能力。現在市場已經有點聽累了。因為模型越來越多,發布會越來越密,大家都在說自己更強,但投資者會問一句很現實的話:然后呢?能不能賺錢?能不能進企業流程?能不能替客戶省錢?能不能形成訂單?
長周期任務給了一個新的答案,如果一個模型真的能連續工作8小時,穩定執行上千步操作,不需要人工盯著,它沖擊的就不只是程序員效率,而是整個執行層。
程序員、數據分析師、法務助理、投研助理、運營執行、客服質檢,這些崗位的共同點是什么?不是每個人都在做頂級創造,很多工作都是把任務推進到結果。
查資料,整理文件,讀代碼,跑測試,改報告,復盤數據,驗證方案,跟進流程。
過去這些事情需要一層一層人來做。以后可能變成:人給目標,AI跑流程,人最后審核。
這才是真正讓企業愿意付錢的地方,企業不一定愿意為“AI回答得很漂亮”付高價,但一定愿意為“AI幫我少招一組人、少花一半時間、少走一堆流程”付錢,這就是從工具訂閱,走向執行替代。
唐杰舉了一個很好的例子:漏洞挖掘。找漏洞不是簡單寫幾行代碼。你要讀大量代碼,理解系統架構,搭測試環境,構造攻擊輸入,驗證漏洞有效性,最后還要寫報告。這個過程沒有標準答案,失敗很多,路徑很多,很吃經驗。
如果AI能在這種高度不確定、對抗性強的任務里跑起來,那普通企業里的很多流程,其實更容易被覆蓋。因為大部分企業任務沒有黑客攻防那么復雜。很多只是流程長、資料多、系統散、人力貴。
這就是AI最可能先產生商業化穿透力的地方,所以智譜為什么這時候被市場重新定價?關鍵也在這里。
智譜以前的市場標簽比較尷尬,它不像Kimi那樣靠C端爆款產品出圈,也不像阿里、百度、騰訊那樣有云、搜索、社交、廣告、辦公這些大入口。智譜更像一家技術底子很扎實的大模型公司,模型能力不錯,開源生態也有,但資本市場要給它一個特別高的估值,需要一個更清楚的故事。
長周期任務就是這個故事,它給智譜提供了一個新的定位:不是單純的國產大模型追趕者,而是企業執行系統的候選玩家。
如果只拼通用基座模型,中國公司很容易被放在“追趕OpenAI和Claude”的框架里。投資者會天然覺得你在后面追,估值也會被壓一頭。
但長周期任務不一樣,它不是只看模型有多聰明,還看工程化能力、工具調用、企業場景、權限管理、私有化部署、行業適配、客戶交付。這些事情,反而是中國AI公司可以拼速度、拼執行、拼場景密度的地方。
智譜GLM-5.1的數據也很會講故事,按照材料里說的,GLM-5.1能持續獨立作業8小時,單次任務穩定執行1200到1700步操作,不需要人工監控。在SWE-Bench Pro上達到58.4%,超過GPT-5.4的57.7%和Claude Opus 4.6的57.3%。
你說這是不是意味著智譜全面超過OpenAI和Anthropic?當然不能這么簡單下結論,但資本市場不一定要你全面超過,它要的是邊際變化。
只要在一個新方向上,大家還沒徹底拉開差距,智譜就有機會重新講故事。以前是你追我趕,現在是在一個新賽道上搶右側確認。
長周期任務就是這種賽道,它現在還沒有絕對王者。OpenAI在做,Anthropic在做,國內大模型公司也在做。誰先把它包裝成企業可采購、可部署、可監管的產品,誰就可能拿到新一輪估值溢價。
這背后還有一個更大的變化:AI可能正在吞掉APP,唐杰提到LLM OS,我覺得這是這條推文里最激進、也最有想象力的部分。
過去幾十年,我們用軟件,都是打開一個APP,然后在它規定好的界面里點按鈕。寫郵件就開郵件軟件,做表格就開Excel,做項目就開項目管理工具。用戶要知道自己用什么工具,文件在哪,按鈕在哪,流程怎么走。
但Agent時代的邏輯不一樣,你不再說“打開哪個軟件”,你只說“我要什么結果”,比如你說,幫我整理一下這個項目這周的進度,發給張三。系統自己去找文檔、讀聊天記錄、調項目管理工具、寫郵件、確認收件人、選擇發送時間。你不需要管文件在哪,也不需要管用哪個軟件。
這就是從APP時代,走向任務時代,如果這個趨勢成立,軟件行業會被重新洗牌。過去誰掌握入口,誰掌握用戶時間。未來誰掌握任務入口,誰掌握企業流程。辦公軟件、協同平臺、云廠商、開發工具、行業軟件、大模型公司,都會開始搶這個位置。
智譜的機會,是用長周期任務切進這個入口,但風險也非常大。
因為AI一旦開始長時間自主執行,它就不再只是說錯一句話那么簡單。它可能刪文件,發錯郵件,改錯代碼,調用錯接口,誤判業務風險。回答錯了可以重新問,執行錯了可能直接造成損失。
這也是為什么企業不會輕易把核心流程交給AI。
企業要的不只是強模型,還要權限系統、審計系統、回滾機制、風控機制。AI每一步做了什么,為什么這么做,出了問題怎么追責,都要講清楚。
否則,越強越危險,這會成為長周期Agent最大的估值折扣。
資本市場會喜歡“AI替代執行層”的故事,因為它對應利潤彈性、人力成本下降、效率提升。但資本市場也會擔心安全事故、監管壓力和責任邊界。一旦出現大的失控案例,整個板塊都會被殺估值。
所以唐杰這條路,最難的不是把模型做強,而是把模型變成企業敢用的系統。
智譜如果能做到這一點,估值邏輯就不一樣了。
它不再只是賣API,不只是賣私有化模型,也不只是給企業做解決方案。它可以往更高一層走,變成企業任務執行系統的基礎設施。
那時候,智譜講的就不是“國產大模型”,而是“AI執行層”。
這個故事比單純模型故事更值錢。
因為模型層很卷,價格會被打下來,推理成本也會不斷下降。企業真正愿意付溢價的,是結果,是可靠性,是和業務流程綁定之后的遷移成本。
誰能把AI嵌進企業核心流程,誰就有訂單能見度。誰能讓企業少花錢、多辦事,誰就有利潤彈性。誰能在安全和監管上讓客戶放心,誰就能拿到長期估值。
當然,現在還不能直接說智譜已經跑出來了。
股價四個月漲900%,這里面肯定有情緒,也有資金博弈。市場正在給國產AI重新定價,但一部分預期已經打進去了。接下來真正考驗智譜的,不是唐杰的觀點夠不夠漂亮,而是三件事能不能兌現。
第一,GLM-5.1的長周期能力能不能在真實企業場景里穩定跑。
實驗室里跑8小時,和企業系統里跑8小時,不是一個難度。真實環境有臟數據、舊接口、權限限制、突發錯誤、模糊需求。模型能不能扛住,才是關鍵。
第二,智譜能不能把長周期任務打包成產品。
企業不會自己從零搭Agent系統。它需要工具箱,需要模板,需要行業方案,需要安全機制。智譜要賣的不能只是“模型能力”,而是可直接部署的任務系統。
第三,客戶愿不愿意為結果交付付高價。
AI公司最怕只有熱度,沒有付費;只有試點,沒有規模化。長周期任務聽起來很有價值,但最后要變成收入、毛利和現金流,才會真正支撐市值。
所以我的判斷是,唐杰這條深夜推文,對中國AI產業的意義很大,但它不是終點,是一個新坐標。
它告訴我們,AI競爭正在從“誰更會聊天”,進入“誰更能辦事”。
以前模型像知識型員工,負責回答問題。以后模型像執行型團隊,負責把事做完。這個變化一旦成立,中國AI產業的機會就不只是追趕海外模型,而是用工程化、場景化、行業化,去搶企業執行層的重構紅利。
這條線很大,也很危險。
兌現了,就是資產重估。
兌現不了,就是概念退潮。
智譜現在站在一個很關鍵的位置上。它不是最大的大廠,也不是最熱的C端應用,但它抓住了一個很可能改變AI定價邏輯的詞:長周期任務。
資本市場最喜歡的不是熱鬧,是真正的估值切換。
唐杰這條推文最大的價值,就是把智譜從“模型能力競爭”里往外拽了一步,推到“結果交付競爭”這張桌子上。
接下來要看的,就是智譜能不能把這句話變成訂單,把訂單變成收入,把收入變成市場愿意持續定價的長期邏輯。
如果能,中國AI的下一輪主線,可能就不再是大模型排行榜。
而是:誰先讓AI替企業把事情干完。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.