无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

月之暗面給出新答案,把更多詞元轉化為有效智能

0
分享至



當外界還在討論詞元價格時,競爭的核心已經轉向詞元本身的價值密度。


文|胡嘉琦

ID | BMR2004

4月20日晚,月之暗面(Moonshot AI)正式發布并開源Kimi K2.6大模型。官方表示,該模型是其迄今能力最強的代碼模型,長程編碼能力顯著提升,測試中可實現13小時不間斷編碼,編寫或修改代碼超4000行,能夠支撐復雜系統的開發與優化;同時模型大幅增強了Agent自主化執行能力。

這是Kimi大模型應市場需求的快速迭代。隨著強化學習和Agent范式逐漸進入主流,模型的工作方式發生了變化。它不再追求“一次性給出答案”,而是通過多輪交互逐步逼近結果;即使在單輪內部,也會展開更長的推理過程。

在大模型發展的早期,詞元更像一種“文本計量單位”。一次提問對應一次輸出,生成多長內容,就消耗多少詞元,成本幾乎等同于文本長度本身。如今,詞元開始出現在中間環節,參與判斷、計算,而不僅僅是最后的表達。這也讓詞元變成了生產資料和智能效率競爭的載體。

《商學院》記者從月之暗面處獲悉,公司正在尋求把詞元轉化為智能的最優解,通過基礎設施與模型訓練深度耦合,每一項改進都以“復利”方式體現在智能效率上。同時,在這場詞元效率的博弈中,商業世界也將面臨分水嶺。

01

詞元:從資源變為持續消耗的生產資料

真正拉開差距的,已經不是某一個模型參數多大,而是這一整套系統,能不能把詞元用在有效路徑上。

詞元開始進入“過程”。它既不只是結果,也不只是載體,而是構成推理路徑的一部分。過去模型輸出的是結果,現在輸出的是一段“被計算出來的過程”。對應地,成本結構也在變化。此前詞元主要消耗在訓練階段,推理成本相對可控;但當推理變成長鏈條、持續展開的過程之后,每一步“思考”都會產生新的詞元。

結果是,成本從一次性投入,變成了隨調用不斷發生的支出。包括英偉達在內的基礎設施廠商,已經把推理側算力視為下一階段的重點增長方向。詞元也隨之從“訓練資源”,轉變為一種持續消耗的生產資料。

再往下看,問題就不只是模型本身了。進入推理時代之后,真正的瓶頸開始轉向系統層面:數據、模型結構、工程體系以及產品能力,需要一起協同工作。

數據質量決定方向是否走對。如果數據噪聲高,模型就容易在錯誤路徑上反復消耗詞元;模型與服務結構影響執行效率,比如上下文管理是否合理、是否支持中斷與重啟,都會直接影響計算是否浪費;工程層面的能力,如路由、緩存、工具調用、評估,本質上是在“精細化使用詞元”,避免重復計算、減少無效生成;而更高一層,組織能否把這些能力做成穩定的產品,并持續優化,決定了效率能否長期維持。

真正拉開差距的,已經不是某一個模型參數多大,而是這一整套系統,能不能把詞元用在有效路徑上。

工業和信息化部信息通信經濟專家委員會委員盤和林的看法更為直接。他認為,精準調度是否能替代規模提升,關鍵還是看效果:同樣的算力,能不能多產出內容,或者同樣內容,能不能更省算力。至于技術路線,本質上還是兩條路徑并行,哪條更容易落地,就先用哪條。在實際操作中,算力效率和規模往往需要權衡,很難同時做到極致。

從更底層的角度看,中國社會科學院研究生院特聘導師柏文喜提出的“詞元全過程參與”,可以理解為對計算單位的一次重新定義。在傳統模式中,詞元只是最終輸出的一部分,現在,它被前移到推理過程中,成為每一步計算的基本單元。

這會帶來幾個變化。首先,原本像黑箱一樣的計算過程開始被拆開,每一步都可以被追蹤和優化;其次,注意力機制不再只是輸入和輸出之間的映射,而是貫穿理解、拆解、推理、驗證的全過程;最后,詞元成為統一的度量單位后,算力和內存的分配可以細化到具體步驟,從而實現更精細地調度。

成本結構也因此被改寫。算力不再平均分配,而是集中到關鍵節點;詞元級別的調度可以減少大量無效計算,尤其是在長文本生成中,避免資源消耗在重復或低信息內容上。同時,模型完成任務也不再依賴簡單堆詞元,而是依賴更有效的推理路徑。

結果很直接:要么在同樣預算下得到更好的結果,要么用更低成本完成同樣復雜的任務。在這個階段,真正稀缺的能力,不是有沒有模型,而是能不能把模型穩定、低成本地跑起來。

02

Token Efficiency:從算力競爭到“智能密度”競爭

算力決定產能,數據決定供給,而效率決定最終產出。

當詞元成為核心之后,競爭的焦點也在移動。

行業大致經歷了三個階段:先拼算力,再拼數據,現在開始拼效率。月之暗面創始人兼CEO楊植麟提出的“Token Efficiency”,主要看每一個詞元到底值不值。

在總量有限的情況下,單位價值越高,模型就越有競爭力。這也帶來一個有點反直覺的結論:訓練更快,并不會直接提高能力上限。只要詞元總量不變,上限基本不會變。速度解決的是時間問題,而效率決定的是能力本身。行業里常說的“30T高質量詞元等效60T”,本質就是這個邏輯。

在這個框架下,詞元逐漸具備了生產要素的屬性:算力決定產能,數據決定供給,而效率決定最終產出。

《商學院》記者從月之暗面處獲悉,公司通過多種方式尋求把能源轉化為智能。首先,Muon優化器取得突破。所謂“優化器”,可以理解為在訓練模型時用來調整參數、讓模型不斷變好的方法;首次在萬億參數模型上驗證二階優化器Muon的可行性,而“二階優化器”相比常見方法,會額外利用“觀測趨勢的變化”來更新參數,理論上更精準但也更難實現。Muon還帶來了至少2倍的Token Efficiency提升。

與此同時,Day-0 Co-Design成為另一條關鍵路徑。從項目一開始,就讓基礎設施(如算力系統、訓練框架)和模型算法一起設計、一起優化,而不是先做模型、再去適配算力。這種“同時設計”的優勢在于,每一個環節的小優化,都會在整體系統中被放大,形成類似“復利”的效果,讓效率持續累積提升。

在這樣的技術路徑下,Kimi加快了迭代節奏:從K2,到更強調推理的K2 Thinking,再到K2.5和K2.6,模型能力在多個基準測試中不斷提升,逐步逼近甚至超過一些頂尖閉源模型。

這些變化放在一起,其實都在回答同一個問題:算力有沒有被浪費。相比“用了多少詞元”,“詞元用得好不好”變得更重要。當外界還在討論詞元價格時,競爭的核心已經轉向詞元本身的價值密度。

03

從“生成內容”到“完成任務”

重點不再是單輪輸出的質量,而是能否把“思考、檢索、工具調用、任務拆分、結果交付”連接成一個可以閉環運行的過程。

這種變化,最終體現在商業層面。

過去,大模型之間的較量,更多停留在“誰的回答更流暢、更像人”;而現在,競爭正在轉向另一件更直接的事:誰能把事情真正做完。

以Kimi的演進為例,其路徑已經從強調思考能力,逐步過渡到引入agentic(智能體化)與swarm(集群/多智能體)結構。其重點不再是單輪輸出的質量,而是能否把“思考、檢索、工具調用、任務拆分、結果交付”連接成一個可以閉環運行的過程。

當系統能夠同時調度多個Agent、進行多輪工具調用時,競爭的核心也隨之改變:從“答案好不好”,轉為“完成一件事要付出多大成本”。計費方式也在發生對應變化,底層依然按照詞元消耗計量,但在應用層,已經開始向“按任務、按結果”過渡。

匯生國際資本總裁黃立沖把這一變化歸結為ROI邏輯的轉移。在他看來,關鍵不再是單純壓低詞元使用量,而是把詞元投入到更有價值的環節中。由此,分層調度成為一項基礎能力:簡單請求即時響應,復雜問題才進入推理流程,而更高價值的任務,再調用工具或多Agent協同完成。

他的判斷也把問題拉回到更具體的商業現實中。在大量真實場景里,競爭力并不直接來自通用大模型本身,而取決于企業是否擁有自己的數據體系和Agent系統。無論是股票分析、投研平臺,還是對沖基金管理,真正的能力體現在系統如何調用數據、如何拆解問題、如何組織決策路徑。這些能力與大模型有關,但并不完全依賴大模型;與算力相關,但更關鍵的,是整個系統是否能夠被有效調度。

柏文喜則從商業化角度進一步拆解了這一路徑的意義。在他看來,以詞元為核心的技術路線,并不只是性能優化,而是在多個關鍵場景中形成了可以直接轉化為商業價值的優勢。

柏文喜指出,Kimi在這方面具有優勢。首先,是長上下文場景中的效率優勢。Kimi在超長文本處理上的積累,使其在文檔分析、代碼理解、多輪復雜對話等任務中,可以對詞元進行更細致地分配與控制。當不少模型仍通過增加算力來支撐上下文長度時,這種結構上的優化路徑,能夠在相同效果下降低成本,或者在相同成本下提升效果,這種差異在企業級復雜任務中會被不斷放大。

其次,是對Agent生態的適配能力。由于詞元貫穿推理全過程,在多步推理、工具調用和結果驗證等環節中,可以維持一致的計算框架,更容易支持復雜任務的拆解與執行。當Agent開始進入真實業務流程,這種從底層機制到應用形態的匹配,會更直接地轉化為產品能力。

最后,是企業級API的經濟性。對B端客戶來說,詞元成本往往直接決定一項應用能否跑通商業閉環。更高效的調度意味著,要么可以以更低價格提供同等能力,要么在相同價格下提供更高穩定性和服務質量,這在采購決策中具有非?,F實的影響。

在這一基礎上,詞元的角色還在繼續變化。柏文喜認為,隨著詞元逐漸成為AI系統中的核心生產要素,行業可能圍繞它建立新的標準體系。定價方式不再只是簡單按數量計費,而可能轉向強調有效性的計量,例如只計算真正帶來信息增益的部分;在流通層面,高質量的推理路徑、經過驗證的思維過程,可能沉淀為可復用的資源,甚至具備交易屬性;而在評價體系上,關注點也會從參數規模與訓練算力,轉向單位詞元所帶來的信息增益、推理準確率以及任務完成度。

從更長周期看,詞元效率很可能成為未來2—3年的關鍵分水嶺,但這種差異,并不會簡單演化為“強者通吃”。

柏文喜提出,對于頭部公司來說,效率優化會放大其既有優勢,通過算法、硬件與數據的協同形成正循環,把效率轉化為成本與價格優勢;而對于中小團隊而言,雖然開源模型降低了門檻,但真正的效率提升依賴全棧能力,難度更高,機會更多集中在垂直場景中的局部突破。

這種變化也在重塑產業結構。算力層的競爭,將從比拼資源規模,轉向比拼單位詞元的性價比;模型層可能出現分化,一類追求極致性能,另一類強調效率與成本;應用層則會因為詞元成本下降,催生出更多原本難以成立的高消耗場景;而工具鏈層,圍繞壓縮、蒸餾與調度的優化能力,也可能逐步發展為獨立賽道。

最終改變的,并不是規模本身,而是規模的含義。未來的“領先”,不再只是參數更大、算力更強,而是能否在相同資源下,把更多詞元轉化為有效智能。行業也由依賴資源堆疊的階段,進入強調精細化計算與系統效率的階段。

如今,行業的競爭邏輯正在變化。領先不再只是規模問題,而是效率問題。模型提供潛力,系統決定結果,而詞元像一把統一的刻度,貫穿其中,它既衡量成本,也決定效率,最終影響誰能在同樣資源下完成更多真實世界的任務。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
耗時5小時57分鐘,J-塞倫德洛贏下法網歷史第三長戰晉級16強

耗時5小時57分鐘,J-塞倫德洛贏下法網歷史第三長戰晉級16強

懂球帝
2026-05-31 14:45:26
禽獸都不會這么干!巴西亞馬遜雨林發生嚴重挑戰人類倫理的事情

禽獸都不會這么干!巴西亞馬遜雨林發生嚴重挑戰人類倫理的事情

科普大世界
2026-05-30 21:04:03
宇宙真的是大爆炸產生的嗎?還是無始無終一直存在著?

宇宙真的是大爆炸產生的嗎?還是無始無終一直存在著?

宇宙時空
2026-05-30 22:20:03
新冠后遺癥的長期侵襲,無數人在不知不覺中深陷困境

新冠后遺癥的長期侵襲,無數人在不知不覺中深陷困境

律法刑道
2026-04-01 10:15:47
阿斯頓維拉與馬德里競技爭奪曼城6000萬英鎊球星

阿斯頓維拉與馬德里競技爭奪曼城6000萬英鎊球星

綠茵情報局
2026-05-31 18:23:06
黃仁勛公開放話,華為韜定律要比臺積電落后10年,結果成國際笑話

黃仁勛公開放話,華為韜定律要比臺積電落后10年,結果成國際笑話

胖福的小木屋
2026-05-31 13:26:25
03年毒殺案:蘇州白衣屠夫,用2年把妻子毒成心臟病后,實施滅口

03年毒殺案:蘇州白衣屠夫,用2年把妻子毒成心臟病后,實施滅口

墨策史
2026-05-29 10:47:10
反轉!姜洪濤被判賠堂哥36萬,前妻花堂哥不少錢,姜洪濤也要退還

反轉!姜洪濤被判賠堂哥36萬,前妻花堂哥不少錢,姜洪濤也要退還

漢史趣聞
2026-05-30 13:05:27
這跟不穿有啥區別!北京這一夜,31歲徐璐穿透視禮服,屬實辣眼睛

這跟不穿有啥區別!北京這一夜,31歲徐璐穿透視禮服,屬實辣眼睛

八斗小先生
2026-05-29 19:24:16
“榴蓮僅退款”商家受死亡威脅!女孩哥哥揚言要滅門,已刑事立案

“榴蓮僅退款”商家受死亡威脅!女孩哥哥揚言要滅門,已刑事立案

風月得自難尋
2026-05-30 21:04:17
老婆出軌后,我去找對方老婆,誰料他老婆:給你套房,但有個條件

老婆出軌后,我去找對方老婆,誰料他老婆:給你套房,但有個條件

千秋文化
2026-05-29 19:56:40
3-0,世界第3擊敗26歲荷蘭黑馬,茲維列夫晉級法網男單8強

3-0,世界第3擊敗26歲荷蘭黑馬,茲維列夫晉級法網男單8強

側身凌空斬
2026-06-01 00:08:04
26歲10球前鋒鬧翻全隊!自曝今夏離隊首選曼聯,1個致命軟肋讓紅魔猶豫了

26歲10球前鋒鬧翻全隊!自曝今夏離隊首選曼聯,1個致命軟肋讓紅魔猶豫了

甜份超標的我
2026-05-31 00:06:36
直到伊朗下令轟炸美空軍基地,全世界才驚醒:中國有句話說得很對

直到伊朗下令轟炸美空軍基地,全世界才驚醒:中國有句話說得很對

夢史
2026-06-01 00:17:19
普京首次宣稱俄烏戰爭接近結束!承認烏克蘭更容易打擊俄本土

普京首次宣稱俄烏戰爭接近結束!承認烏克蘭更容易打擊俄本土

項鵬飛
2026-05-30 16:12:33
一懶毀一生!姆巴佩19歲奪世界杯 現27歲0歐冠0金球獎 淪為失意人

一懶毀一生!姆巴佩19歲奪世界杯 現27歲0歐冠0金球獎 淪為失意人

智道足球
2026-05-31 16:30:16
劉少奇之子劉源身陷困境求助宋慶齡,九字回復令他動容

劉少奇之子劉源身陷困境求助宋慶齡,九字回復令他動容

嘮叨說歷史
2026-05-29 14:16:53
特斯拉國產 Model Y 周邊新品真火了,海外車主:請在全球上架售賣!

特斯拉國產 Model Y 周邊新品真火了,海外車主:請在全球上架售賣!

新浪財經
2026-05-31 10:31:03
“耿同學”永久限流后,南開大學、中山大學趁周末接連通報:多人遭免職

“耿同學”永久限流后,南開大學、中山大學趁周末接連通報:多人遭免職

藥識局
2026-05-30 21:11:23
樓市王炸大招原來是收購二手房?終于明白最近各地開始加速收購了

樓市王炸大招原來是收購二手房?終于明白最近各地開始加速收購了

專業聊房君
2026-05-31 12:17:34
2026-06-01 00:59:00
商學院雜志 incentive-icons
商學院雜志
本號由《中國經營報》社有限公司主辦,為商業領袖提供管理實踐與方法
7147文章數 22746關注度
往期回顧 全部

科技要聞

戴爾諾基亞又回來了!AI重估老牌科技公司

頭條要聞

媒體:印度多個領域面臨嚴重問題 莫迪發出罕見的號召

頭條要聞

媒體:印度多個領域面臨嚴重問題 莫迪發出罕見的號召

體育要聞

阿森納用最悲壯的方式,成就了巴黎王朝

娛樂要聞

朱軍退休,正義雖遲但到,女方受懲

財經要聞

醫學首席轉崗搞科技,A股科技股遭遇巨震

汽車要聞

900V+3.2秒破百 領克10+&領克10上市16.99萬元起

態度原創

教育
健康
親子
公開課
軍事航空

教育要聞

“根本夸不出口”,女同學展示初學的拉丁舞,服裝成了最大減分項

嘗試干細胞療法如何避免踩坑?

親子要聞

青少年哪個品牌DHA好?藻油組合易吸收,純凈配方無負擔,學習狀態更穩定

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

解放軍代表質問日防衛大臣:日本何時道歉

無障礙瀏覽 進入關懷版