无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

養“蝦”要用“腦”:萬億參數之后,行業終于開始關心“參數含金量”

0
分享至


撰文 | 懂懂

編輯 | 秦言

來源:懂懂筆記

「 用更少的算力開銷,產生更大的智能價值,已成為破解AI落地成本困局的核心密碼。」

2026年開年,整個AI圈最熱的話題莫過于“養蝦”。

這里說的“蝦”,是因其Logo酷似龍蝦鉗而戲稱的OpenClaw——一個現象級的開源AI智能體框架。


在短短數月內,其GitHub星標數突破28萬,超越React、Linux等老牌項目登頂全球第一,被業界視為AI從聊天走向干活的范式轉移標志。

這股熱潮不僅席卷了個人開發者和極客社區,更實實在在地點燃了企業用戶的熱情。從科技巨頭到傳統企業,無數團隊摩拳擦掌,希望利用OpenClaw打造自己的數字員工,自動化處理繁瑣工作,開啟效率革命。

然而,許多興致勃勃開養的企業發現,自己的“蝦”(這里泛指智能體)經常翻車:處理一份稍復雜的財報就直接宕機,任務鏈條超過五步大腦就斷片兒,更別說在長文檔分析、跨系統查詢等真實業務場景中穩定輸出了。

熱鬧是真熱鬧,但真用起來也是很崩潰。這背后揭示了一個核心命題:當AI的手腳(智能體)已經備好,我們究竟需要一個什么樣的大腦(大模型),才能讓它真正在企業中穩定、高效地跑起來?

熱潮與痛點:當AI落地遭遇不可能三角

2025年,已被廣泛視為企業智能體(Agent)元年。企業對AI的期待,從對話、生文等單一功能,全面轉向能夠自主執行復雜工作流的數字員工。

今年OpenClaw的引爆,將這一期待推向了前所未有的高潮。在YuanLab.ai團隊看來,OpenClaw作為一個現象級產品,對于AI落地推動的意義在于兩方面:

一方面,OpenClaw讓智能體的價值變得具象化,每個人都有可能快速搭建一個能上網、能操作軟件、能處理文件的AI助手。

另一方面,其開源和共創模式,吸引了全球開發者涌入,在社區中分享插件、交流經驗,形成了強大的生態合力,加速了整個智能體能力的進化。“以前是煙囪形式升級,沒有產生合力,而未來大家可以在社區里分享,就能更快、更好地幫助企業解決大模型落地難的問題。”YuanLab ai團隊的Allen博士說。


企業對AI的熱情因OpenClaw再添一把火。然而,當熱情照進現實,落地之路卻荊棘密布,企業普遍面臨幾個揮之不去的核心痛點:

首先,是精準的困境。

許多智能體在處理企業核心業務,如財報分析、合同審閱、技術文檔解析時,輸出的內容夾雜幻覺,數據不準確,邏輯經不起推敲,企業根本“不敢放心用”。在YuanLab ai團隊看來, AI落地的第一大痛點就是模型的準確性。


其次,是高效的挑戰。

智能體的任務往往是多步驟、長鏈路的。當前許多模型存在嚴重的“過度思考(Overthinking)”問題,在得到答案后仍會進行大量無效的反思和驗證。在長任務鏈中,單步的冗余會被指數級放大,導致響應慢、成本高,最終可能因延遲累積而任務失敗。

第三,是成本的焦慮。

想要高智能,似乎就必須承擔更高算力開銷(Token消耗)。這使得企業陷入兩難:用能力強的大模型,成本高不可攀;為控制成本選用小模型,復雜任務又根本無法勝任。

以上痛點恰恰構成了當前企業AI落地的一個“不可能三角”:精準、高效、低成本,難以兼得。

要破解這個三角,必須認清一個根本關系:在“大模型是大腦,Agent是手腳”的范式中,智能體框架(如OpenClaw)決定了AI能做什么,而底層大模型才決定了AI能做成什么樣。手腳再靈活,如果大腦不夠聰明、不夠穩定,一切皆是空談。

因此,解決AI落地痛點的關鍵,不僅在于擁有好用的智能體框架,更在于底層大模型的持續進化與務實優化。也就是說,要想把蝦養好,關鍵是要有好的大腦。

破解之道:用智能密度擊穿“不可能三角”

要想AI更精準,大模型的參數也就要更大。伴隨大模型參數越來越大而來的,就是行業陷入了“規模與效率”的悖論之中。YuanLab.ai團隊最近發布的Yuan 3.0 Ultra,提供了一條不同的思路。


「 開源地址 」

GitHub項目

https://github.com/Yuan-lab-LLM/Yuan3.0-Ultra

「 論文鏈接 」

https://arxiv.org/abs/2601.14327

作為全球三個萬億級開源多模態大模型之一,其所有技術創新都指向一個目標——提升智能密度,即用更少的算力開銷,產生更大、更確定的智能價值,“這么多年我們團隊一直在干一件事,就是如何用更少算力去產生更多的智能。“Allen表示,在這個思路下,團隊很早就提出了模算效率的概念,現在這已經被行業普遍認同。隨著對大模型落地的認知加深,智能密度的概念逐漸浮出水面,而這恰恰是針對“不可能三角”的精準破局。

總結Yuan 3.0 Ultra的創新邏輯,可以分為三個維度:

首先,訓練端團隊優化,裁掉“摸魚”的專家,拒絕參數虛高。

Yuan3.0 Ultra采用主流的高效架構——混合專家模型(MoE),這好比組建一個百人專家團隊。但研發團隊發現,在訓練穩定后,這個百人團隊嚴重不均衡:少數幾個專家干了絕大部分的活,而大量專家長期低負載、幾乎不產生價值。實測中,負載最高與最低的專家工作量相差近500倍。企業卻要為所有專家支付算力工資,這是巨大的浪費。

為此,YuanLab.ai團隊發明了LAEP(自適應專家裁剪算法)。它就像一個聰明的人力資源優化系統,在訓練過程中動態監測,精準識別并裁掉那些長期“摸魚”、貢獻極低的冗余專家,并對剩下的高效專家進行重組,讓他們協同更流暢。


(MoE模型訓練過程中存在專家訓練不均衡問題)

效果是驚人的:模型參數從1515B(1.515萬億)優化至1010B(1.010萬億),裁剪掉33.3%的冗余參數,整體預訓練算力效率反而提升49%。最終,用戶用一個1010B參數的模型,單次推理僅激活68.8B參數,就能享受到萬億級模型的智能。這直接破解了成本焦慮,讓企業用得起旗艦模型。


(Yuan3.0 Ultra采用LAEP顯著提升預訓練效率)

其次,在推理端高效思考,抑制過度反思,讓AI想對就停。

模型越大,容易患上強迫癥,在已經得出正確答案后,還會反復糾結、自我驗證,生成大量無效內容。這在單輪對話中只是多花點錢,但在智能體的長任務鏈中,每一步的冗余都會疊加,導致成本爆炸和延遲激增。

Yuan3.0 Ultra引入了RIRM(反思抑制獎勵機制)。這就像在模型訓練時設立一套新的獎勵規則:不僅獎勵“答對”,更獎勵“在答對后及時停止無效思考”。通過強化學習,模型學會了在復雜任務中進行深度推理,在簡單任務中快速響應,在獲得可靠答案后主動收斂。


(RIRM優化下的推理效率提升與 Token 消耗對比)

實測數據表明,改進后的RIRM讓模型在相關任務上訓練精度提升16.33%的同時,輸出Token長度降低了14.38%。這意味著更準、且更快。在長鏈條的企業Agent任務中,這種效率提升會被層層放大,根本性緩解“高效”挑戰。

第三,在理解端精準聚焦,過濾無效信息,讓AI看得更準。

成本降了、速度快了,但如果模型看不懂企業復雜的業務文檔,一切仍是空談。現實中的技術方案、財報、合同往往是圖文混排的長文檔,信息分散、結構復雜,傳統模型容易迷失在大量細節中,抓不住重點。

Yuan3.0 Ultra 引入了LFA(局域過濾注意力機制),強化長上下文語義關聯能力。可以把它理解為給模型的注意力加裝了一個智能濾鏡。在閱讀長文檔時,這個機制能幫助模型自動過濾掉無關的、干擾性的信息,將注意力精準聚焦在關鍵語義和邏輯關聯上。

這就像一位經驗豐富的分析師,能快速掠過文檔中格式化的套話和冗余描述,一眼鎖定核心數據、結論以及跨頁面的因果聯系。得益于LFA機制,模型對長上下文、復雜語義關系的建模能力得到顯著增強,在處理企業級圖文混排文檔、進行跨頁信息檢索與推理時,準確性大幅提升。這直接攻克了“精準”難題,讓AI產出的結果更可靠、更可用,真正“用得好”。

總結來看,LAEP決定了模型用多少有效參數去學,從源頭削減成本;RIRM決定了模型推理到何時該停,在過程中提升效率;LFA決定了模型如何精準捕捉信息,在結果上保障精準。三者協同,從訓練、推理到理解,構成了破解“不可能三角”的完整技術閉環。

產業之變:從參數競賽到價值深耕

Yuan3.0 Ultra的技術路徑,背后是YuanLab.ai團隊一以貫之的“有效智能”核心理念,“我們的目標是死磕有效智能,解決企業客戶在落地中真金白銀的成本和效率問題。”Allen表示。

Yuan3.0 Ultra的創新邏輯,也映射出中國大模型產業正在發生的深刻轉向:從早期的參數規模競賽,進入務實的智能密度競爭與產業價值深耕階段。


早期,行業追逐更大參數、更長上下文、更高Benchmark分數。但當技術走向產業深水區,企業客戶關心的是解決實際業務問題、控制真金白銀的成本、獲得可驗證且穩定的輸出。

單純的規模堆砌,使得邊際效益加速遞減。智能密度概念的提出恰逢其時,智能不是追求模型無限變大,而是追求單位算力所能產生的有效智能最大化。這要求模型在架構(如MoE優化)、訓練(如LAEP)、推理(如RIRM)全鏈條上進行精細化的效率革命。

所以,企業在選擇AI大腦時,不應再被單純的參數規模或評測分數迷惑,而應重點考察:它是否針對我的業務場景(如文檔、表格、數據庫)做了深度優化?它的訓練和推理效率如何,總擁有成本(TCO)是否可控?它能否提供穩定、可審計、可解釋的輸出結果?

在今年兩會期間,全國人大代表、華中科技大學副校長馮丹在接受媒體采訪時也提到了這一概念:“當前,全球人工智能競爭已進入以大模型為核心的智能密度比拼階段。加快大模型推理能力應用落地,是搶占產業智能化制高點的戰略需求。”

OpenClaw的火熱與大模型的效率革命,正推動大模型與智能體(Agent)進入一個協同演進、互相定義的新階段。當底層大模型的基礎能力越來越強、且越來越高效,上層的智能體框架就能從繁重的任務拆解中解放出來,更專注于多智能體協同、業務流程編排和結果校驗,進化成企業內部的AI操作系統。對于企業而言,這意味著AI真正成為更高效的生產力。

“我感覺AI真的要落地了。以前大家都當作一個玩具,一個陪伴,現在各個層面的能力都實現了躍遷,我感覺離AGI真的不遠了。”Allen很興奮,因為AI不再停留于表面的熱鬧,而是正在真正轉化生產力,為各行各業的提質增效。

(更多詳盡信息請瀏覽yuanlab.ai 視頻號內容)

冷眼旁觀 麻辣點評 深入分析


個人觀點,僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
這4個行業,已經發不出工資了!真的很嚴重了

這4個行業,已經發不出工資了!真的很嚴重了

細說職場
2026-06-13 14:08:51
世界杯預測:巴西 VS 摩洛哥,老對手相見,防平無冷門

世界杯預測:巴西 VS 摩洛哥,老對手相見,防平無冷門

旅行小狂徒
2026-06-13 16:53:31
特朗普:美軍打死委內瑞拉黑幫團伙“阿拉瓜火車”組織頭目;委內瑞拉代總統:“特朗普視我們為朋友”

特朗普:美軍打死委內瑞拉黑幫團伙“阿拉瓜火車”組織頭目;委內瑞拉代總統:“特朗普視我們為朋友”

大風新聞
2026-06-13 10:06:04
女子被婆婆和小姑子打住院,娘家人算賬,丈夫:誰讓她和我媽頂嘴

女子被婆婆和小姑子打住院,娘家人算賬,丈夫:誰讓她和我媽頂嘴

易玄
2026-06-12 11:05:19
貝克漢姆14歲女兒被曝,獨自去見哥嫂卻未如愿,“家庭矛盾難休”

貝克漢姆14歲女兒被曝,獨自去見哥嫂卻未如愿,“家庭矛盾難休”

譯言
2026-06-13 12:07:02
一場全民狂歡的背后,世界杯“走光”視頻瘋傳實為烏龍

一場全民狂歡的背后,世界杯“走光”視頻瘋傳實為烏龍

樂道足球C
2026-06-13 09:25:17
全網熱議的“弟弟要錢買800多的鼠標”事件,炸出多少精神貴族!

全網熱議的“弟弟要錢買800多的鼠標”事件,炸出多少精神貴族!

北緯的咖啡豆
2026-06-09 09:35:13
張鎮麟想幫上海男籃建立王朝,新疆欲續約勞森,張慶鵬重返天津

張鎮麟想幫上海男籃建立王朝,新疆欲續約勞森,張慶鵬重返天津

中國籃壇快訊
2026-06-13 19:24:41
齊達內力挺C羅:他說世界杯只有7場比賽,因為他就瞄準了決賽!

齊達內力挺C羅:他說世界杯只有7場比賽,因為他就瞄準了決賽!

體育閑話說
2026-06-13 11:53:49
不愧為前世界第一,朱雨玲火力全開3:0橫掃對手,強勢晉級八強

不愧為前世界第一,朱雨玲火力全開3:0橫掃對手,強勢晉級八強

楊哥乒乓
2026-06-13 06:39:26
主教練安切洛蒂確認:內馬爾無緣巴西隊世界杯首戰,預計下周恢復訓練

主教練安切洛蒂確認:內馬爾無緣巴西隊世界杯首戰,預計下周恢復訓練

環球網資訊
2026-06-13 08:56:16
要收網了?中方態度很明確,日本緊急赴華求和,突發變故高市傻眼

要收網了?中方態度很明確,日本緊急赴華求和,突發變故高市傻眼

健身狂人
2026-06-14 01:57:58
快訊!認了,菲律賓喊話中國了!

快訊!認了,菲律賓喊話中國了!

故事終將光明磊落
2026-06-13 09:07:31
梅西最后一場世界杯?阿足協主席打太極:不確定,真希望不是

梅西最后一場世界杯?阿足協主席打太極:不確定,真希望不是

徐觳解說
2026-06-13 10:17:49
來了,斯科特·福斯特被任命為尼克斯對陣馬刺NBA總決賽G5裁判長

來了,斯科特·福斯特被任命為尼克斯對陣馬刺NBA總決賽G5裁判長

好火子
2026-06-14 04:13:34
“沒腦子,但有錢”,男生考上川大火了,網友:這專業我無法支持

“沒腦子,但有錢”,男生考上川大火了,網友:這專業我無法支持

澤澤先生
2026-06-01 19:36:41
北京辦退休一句話|醫保要繳滿30年|延遲退休已動真格

北京辦退休一句話|醫保要繳滿30年|延遲退休已動真格

右耳遠聞
2026-06-11 17:07:38
丘天和嬌妻近照,最成功混血球員,打了9年CBA,妻子是中國人

丘天和嬌妻近照,最成功混血球員,打了9年CBA,妻子是中國人

大西體育
2026-06-13 08:38:12
王朝落幕!0-5慘案擊碎武漢五連冠神話,21歲上海青年軍神話!

王朝落幕!0-5慘案擊碎武漢五連冠神話,21歲上海青年軍神話!

童叔不飆車
2026-06-14 01:01:32
我敢打賭99%的男人會選綠衣服女孩做老婆,看腿型就知道

我敢打賭99%的男人會選綠衣服女孩做老婆,看腿型就知道

娛樂洞察點點
2026-04-21 00:47:32
2026-06-14 04:56:49
懂懂筆記 incentive-icons
懂懂筆記
TMT深度分析
3676文章數 11697關注度
往期回顧 全部

科技要聞

SpaceX上市首日破2萬億美元,馬斯克再封神

頭條要聞

特朗普:美伊協議計劃周日簽署 霍爾木茲海峽立即開放

頭條要聞

特朗普:美伊協議計劃周日簽署 霍爾木茲海峽立即開放

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋全網!

財經要聞

梁文鋒向左,楊植麟向右

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

本地
手機
數碼
旅游
健康

本地新聞

AK劉彰邂逅河北南大港濕地

手機要聞

比華為三折疊還稀缺!iPhone Ultra國行備貨量不足:博主直言搶到賺到

數碼要聞

綠聯推出DXP 6800/8800 Ultra NAS:雙萬兆雙雷電4,PCIe擴展

旅游要聞

夏天就該這樣過!大別山的夏天,從霍山大峽谷漂流的第一聲尖叫開始。

老人、小孩、孕婦,吃粽子有啥風險

無障礙瀏覽 進入關懷版