大模型行業長期沉浸在一種近乎默認正確的共識。
要大參數,模型才強;要足夠長的上下文,能力才會全面;要有足夠復雜的推理鏈條,才能顯示其智能水平。
所以過去幾年,從千億參數到萬億參數,從幾十萬token上下文到百萬token,從單次回答到越來越長的reasoning,大模型公司不斷刷新技術上限,資本市場也樂于為這種更強的想象買單。模型排行榜頻繁更替,訓練成本被不斷推高,GPU成為最昂貴的生產資料之一。
然而,當盲目堆砌參數的激情退去,行業開始面臨一個無法回避的尷尬現實:動輒數千億乃至上萬億參數的稠密模型,同步推高了天文數字般的訓練與推理成本,筑起了極高的部署門檻。
無論對高舉高打的企業還是極客個人而言,理想中的“智能涌現”與現實中的“用不起、用不好”之間,正割裂出巨大的落差。
上半場有多瘋狂,下半場就有多骨感。
此刻,一些更有遠見的玩家已經意識到范式轉移正在發生,generative AI(生成式AI)正在全面跨越成為productive AI(生產力AI)。
要將足夠硬核的智能能力,以更低的綜合成本、更穩定的交付方式,絲滑地融入真實的產業毛細血管中。
在這個關乎行業潮水走向的節點上,有一家AI老兵用一次硬核的基座升級,給出了重構效率的解法。
今天,云知聲正式發布新一代通用大語言模型底座——U2。
![]()
這不僅是云知聲上市以來最重要的一場基座模型技術迭代,更是其全面轉向“原生智能體(Agentic)大模型公司”的關鍵里程碑。
當行業還在追逐生成式AI的聊天炫技時,云知聲便已前瞻性地提出了“生產力AI”這一全新概念,其背后的意義也非常明晰:AI的終極價值不是生成內容,而是解決真實世界的復雜任務。
這一概念的提出,讓云知聲成為當之無愧的先鋒派:在同行還在談論“涌現”時,云知聲已經開始思考“干活”;在別人比拼參數規模時,它已經看穿了智能密度與token價值的商業本質。正是這種超前的認知站位,讓云知聲在大模型正賽開打之前,已經拿到了定義規則的話語權。
這家在AI長河里摸爬滾打十余年的企業,沒有選擇加入盲目的參數消耗戰,而是選擇在這個節點,用U2代表的全新底層邏輯,向行業宣告大模型商業價值的重新計算。云知聲用十余年垂直場景的know-how,構建了一條幾乎無法復制的護城河,這也正是它能夠穩居國產大模型第一梯隊核心位置的根本底氣。
是聲,又不止于聲
要理解大模型的下半場,必須先看清牌桌上的玩家。
在群雄逐鹿的國產大模型陣營中,2012年成立的云知聲是一個頗為獨特的存在。最早從語音識別切入,一度活躍于智慧醫療、智能家居、車載座艙等場景。過去十多年,它經歷了統計學習、深度學習,再到大模型時代的完整技術周期,也因此常常被看作一個有些“老派”的AI玩家。
在過去很長一段時間里,因為名字里自帶一個“聲”字,外界習慣性地給它貼上語音識別的標簽。在大模型熱潮最洶涌的階段,外界的目光被動輒融資數十億美金、活躍于鎂光燈下的互聯網新貴和“六小虎”吸引時,正處于港股上市靜默期的云知聲顯得有些低調。
好在,會聊天的生成式AI的時代在2025年就結束了,所有人都意識到能干活的生產力AI才是重要的。此刻行業驀然發現,云知聲過去被低估的老本行,反而成了它征戰智能體(Agent)時代最寬闊的護城河。
“聲音的背后是語言,語言的背后是意圖。我們聽的不是聲音,是聲音背后的意識。”云知聲創始人黃偉這樣解釋云知聲名字中的“聲”。
在他的理解里,人機交互始終有三個層次:第一層是“聽懂”,也就是語音識別,把聲音轉化成文字;第二層是“理解意圖”,用戶說“我冷了”,不是想得到一句回應,而是希望空調自動調溫、窗簾自動關閉;第三層,則是理解更深層的意識與場景——一個獨居老人輕描淡寫地說“今天沒什么事”,AI能否從語氣和停頓中識別出孤獨,并主動觸發陪伴或提醒。
從語音識別、自然語言理解,到今天的大模型與Agent,云知聲做的始終是一件事:讓機器真正理解人,并幫人把事情做完。
在人機交互的真實物理世界里,要讓機器真正為人服務,必須解決多輪交互、長鏈路任務、復雜環境噪聲、人機協同等一系列工程化難題。
這種在嚴肅、復雜垂直場景中摸爬滾打出來的場景know-how和多輪交互工程經驗,正是原生Agent生存的天然土壤。
基于這一深刻洞察,云知聲最新發布的通用大底座U2,內部對其定位是,原生智能體大模型(Agent-NativeModel),它的尺寸、訓練目標和優化方向,都圍繞“執行任務”而設計。
在技術路徑上,云知聲也沒有沿著行業普遍采用的“模型訓練完成,再外掛Agent框架”的路線走,而是提出了一套更激進的思路:
首先,是原生Agent模型+ Harness協同演進機制。過去,大部分智能體系統更像是在通用聊天模型外面套了一層殼——模型只管說話,規劃、調用工具、執行任務這些事情都交給外部框架來做,模型本身其實并不真正"懂"這些。而U2在訓練階段就將如何規劃、如何執行、如何驗收結果的完整能力直接內化到了模型層。在訓練過程中,模型與Harness(任務執行腳手架)持續協同演進:模型的主體結構越建越復雜,腳手架的支撐節點與驗證精度也隨之延伸、越發精細;而更精密、更嚴苛的腳手架,又反過來確保了模型每一層邏輯的堅固,形成一個不斷自我強化的循環。
其次,是過程監督與課程學習的系統性應用。為了讓Agent像做事干凈利落的人一樣高效,U2在訓練環節引入了“課程學習”方法,讓模型從易到難、上下文從短到長、工具調用從簡單到復雜逐步進階。在長程任務的軌跡中,U2引入了先進的過程監督方法,用更優的模型對任務執行的每一個關鍵節點拆解評估與糾錯。U2不僅能看到最后的結果,更能優化中間的每一步執行路徑,實現學習的快速收斂。
再者,更偏向服務實體經濟與硬核產業的產業級數據配比。當很多大模型仍高度依賴互聯網通用語料進行泛化訓練時,云知聲選擇主動降低娛樂等低價值場景語料比例,將更多數據資源傾斜向醫療、醫保、保險、政務、工業等高價值行業場景,并結合多年業務落地積累的真實場景脫敏數據進行訓練。值得一提的是,云知聲用多年業務長期沉淀、難以復制的真實場景脫敏數據進行合成與訓練,直接服務于實體經濟和硬核產業。
底層能力重構之后,云知聲U2在不盲目堆砌參數的前提下,展現出了較強的性能競爭力。在IFBench等指令遵循評測中,U2的表現穩居行業前列;在Claw相關評測中,其Agent與工具調用能力體現出較強優勢;在GPQA等硬核知識推理和長上下文任務上,U2同樣展現出挑戰全球頂尖大模型的能力;在面向真實辦公與知識工作交付能力的GDPval上,U2取得72.5分,展現出扎實的專業辦公能力。
![]()
最重要的是,U2徹底打破了“一流性能必須綁定超大參數”的魔咒。它拒絕參數虛胖,通過極致的MoE(混合專家)架構和算法優化,致力于將對標全球一流的能力壓縮進更小的參數規模中,追求強而小、強而省。
低調克制的AI老兵,以領跑者的姿態,躋身國產大模型的第一梯隊。
商業邏輯如何閉環?
作為有十余年行業經驗的科技公司,云知聲比剛入局幾年的“小朋友”要清楚,技術的代際躍遷固然要爭,商業邏輯也不能忽視。
過去,大模型行業習慣了用硬件和算力的單一視角來討論token。當全行業都在比拼誰生成的token數量多、誰的計算效率高時,云知聲創始人黃偉卻算了一筆更有穿透力的商業賬:“同樣的100萬個token被生產出來,如果它承載的都是閑聊和廢話,那計算效率再高也沒有任何商業價值。”
基于這樣的認知,云知聲在行業內首次提出了一個極具顛覆性的商業公式:
AI商業價值=智能密度 × token價值。
拆解來看,智能密度意味著用更小的參數、更低的綜合資源投入,去達到足夠高的智能水平。token價值則強調模型的每一次調用,都必須能直接轉化為可衡量的業務結果——要么降低風險,要么提升生產力。
今天發布的U2模型,正是這一認知和思考的終極落地載體。為了讓客戶的每一分錢都花在刀刃上,U2在底層技術上做到了近乎嚴苛的壓榨。
前文提到的原生Agent + Harness協同演進機制,正是在解決這個問題。通過模型與駕馭工具鏈共同進化,U2能以更少的交互輪次完成任務規劃、工具調用、執行與驗收,減少大量來回試錯帶來的token浪費,并進一步提升任務完成率。
與此同時,U2底層采用稀疏混合專家(MoE)架構,相比傳統稠密模型需要激活全部參數,MoE面對不同任務,只激活最相關的一部分專家模型。根據云知聲披露的信息,U2每次處理任務時只激活約十分之一的參數參與計算,其余參數"按需休眠"。這意味著模型在運行時的實際計算量遠小于其完整規模,在保持高性能的同時,顯著降低了推理所需的算力成本。
更特別的一點,則來自U2對思考過程的重新設計。一些大模型在復雜推理時往往會展開冗長的reasoning作為思考過程——一步一步把中間過程完整寫出來。雖然這種方式提高了可解釋性,但也帶來了另一種問題:用戶正在為大量并不產生最終價值的Token成本買單。U2優先在隱空間中進行高效探索,避免把每一步中間思考都解碼為可見Token;當任務進入關鍵階段,模型則切換到顯式推理,通過可讀、可校驗的推理過程完成邏輯校準、過程驗證與最終決策。云知聲稱其為“隱式思考推理+顯示思考驗證”。
“如果這100萬token都是閑聊廢話,效率再高也沒什么商業價值。”黃偉曾說到。
這種“用高智能密度追求高價值token”的策略,很快在商業化戰場上迎來了真金白銀的反饋,并在結果上論證了新公式帶來的無限天花板。
最新數據顯示,受益于高質量場景token需求的暴增,云知聲5月token調用收入的ARR環比增長600%,且根據目前的訂單勢頭,6月份將繼續保持強勁的高增長態勢,預計ARR可達1500萬美金。
大模型的下半場,云知聲的業務規模天花板已被全面、徹底地打開。
背后是云知聲商業模式發生的一場本質躍遷。
長期以來,傳統ToB公司都深陷項目制的泥潭——交付周期長、定制化程度高、賺的是一錘子買賣的辛苦錢。但大模型U2的發布,通過高價值token的持續輸出,云知聲的收入模型成功與客戶的AI使用強度實現了深度綁定。只要客戶在真實的業務流程中源源不斷地調用AI,收入就會像打開的水龍頭一樣,產生高頻、高毛利的自來水式復購。
如今,這套高效的商業閉環正通過云知聲獨特的雙輪驅動版圖加速落地:
在To B端(獸牙智能體平臺),云知聲以U2為核心底座,在垂直產業攻城略地。憑借極高的任務完成率,公司近期連續中標了醫療、醫保、交通、客服、工牌等一系列對準確率有著硬核要求的行業場景。這些高價值行業不僅持續貢獻著高客單價,更用場景中沉淀的真實、高質業務數據,源源不斷地反哺模型基座,形成了越用越聰明、智能密度越高的良性循環。
在To C與開發者端(公有云MaaS),云知聲則依托OPC生態全面鋪開。通過更低門檻、更高性價比的模型API調用能力,面向廣泛的獨立開發者與C端應用生態,持續、穩定地收割高頻的token流量與收入。
不盲從Scaling Law的極限,而是找到與自身資源、稟賦完美匹配的生態位。云知聲用單月ARR暴漲6倍的硬核技術造血能力證明,在大模型下半場里,算得清效率賬、握得住商業閉環的玩家,才擁有真正的無限未來。
正賽剛剛開始
回看港股上市這一年,云知聲交出的是一份不盲從、不懸空,用技術重構效率、用商業結果自證的硬核答卷。在全行業深陷參數通脹、為高昂的算力實驗買單時,這家AI老兵憑借清醒的戰略定調與十余年的產業深耕,實現了技術前瞻,也找到了商業價值。
大模型底座U2的發布,更是一次打破格局的宣言。它以“高智能密度”與“高價值token”的雙高解法,正式確立了云知聲作為國產通用大模型核心廠商與第一梯隊的穩固地位。在全面開啟的原生智能體時代,大模型不再是高不可攀的奢侈品,而是干凈利落的生產力。
“2023到2025年是大模型的熱身賽,2026年正賽才剛開始。”黃偉曾這樣說。在黃偉看來,AI的價值不在于生成更多內容,而在于進入真實業務流程,提升生產效率、優化決策質量,并創造可衡量的商業結果。某種程度上,這也是云知聲對于“生產力AI”的理解:讓模型真正參與工作,而不只是參與對話。
正賽才剛剛開始,AI對人類社會的改造還有很長的路要走,而大模型的底層價值,也正在被云知聲這樣既有長期積累、又保持技術前瞻性的公司重新定義。從率先喊出“生產力AI”的第一聲號角,到U2落地成為原生智能體的標桿之作,云知聲用行動詮釋了什么是真正的先鋒派,那便是搶在風口來臨之前,自己去創造風口。
當行業終于意識到生成式AI的泡沫退去、生產力AI的黃金時代剛剛到來時,人們會發現,云知聲早已站在賽道的最前沿,手握U2這張王牌,云知聲駛入大模型正賽的深海。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.