![]()
當詞元成為“新石油”,大廠開始從“燒錢換流量”轉向“按詞元計費”,競爭焦點也從參數競賽轉向了詞元經濟體系構建。
文|王雅迪
ID | BMR2004
隨著OpenClaw(小龍蝦)等智能體掀起的熱潮,詞元(Token)消耗從人機對話升級為機器自循環,其角色從模型訓練的技術副產品,一躍成為可計量、可交易的戰略資產。詞元被業界比作AI時代的“新石油”和“新集裝箱”,大廠開始從“燒錢換流量”轉向“按詞元計費”,競爭焦點也從參數競賽轉向了詞元經濟體系構建。
截至2026年2月,百度千帆最新成績單顯示,其已累計支持企業構建超130萬個智能體,工具日均調用次數達到數千萬級,沉淀出獲客營銷、錯題批改等100多個高頻場景,支撐智能硬件、制造、交通、能源等主流行業創新。
百度千帆的解題思路比較務實,其平臺上主流模型的價格已降至每百萬詞元幾毛錢的水平,1塊錢可以讓AI寫大約1000篇800字作文。同時,百度千帆通過主動Cache模式等技術創新,為企業降低高達80%的推理成本。百度千帆平臺產品負責人張婷用樂高積木形象地比喻詞元,她認為,大模型的訓練,本質上就是在學習:什么樣的詞元序列,在什么樣的上下文里,應該接什么樣的下一個詞元。這是一個極其龐大的“樂高拼法手冊”。
01
詞元如何定價?
對價格最敏感的是高頻調用的ToC產品團隊,詞元成本直接決定了他們的商業模式能否跑通;而大企業則更關注穩定性、安全性和合規性。
從定義上看,詞元是大模型處理語言時最小的處理單位,但它既不完全等于一個字,也不完全等于一個詞,而是介于兩者之間的一種“語言碎片”。
張婷舉例表示,漢字“我”是一個詞元,“今天”可能是一個詞元,但“標記化”這個詞可能被拆成“標記”和“化”兩個詞元。英文就更直觀了,“Tokenization”這個單詞可能被拆成“Token”+“ization”兩部分,大模型面對的語言是全球性的,不可能給每一種語言單獨設計一套處理規則。詞元是一種通用的“最大公約數”,讓模型可以用統一的方式處理所有語言和符號。
之所以拆詞元是由計算機處理語言的底層原理決定的,計算機本質上只能處理數字,它并不認識“字”,為了讓AI理解,大模型會先給每個詞元分配一個數字編號,再將這個編號轉化為一組數字坐標(向量),這決定了AI如何“理解”這個詞。詞元計量的是生成答案所需的全部計算資源。
據張婷介紹,百度千帆平臺服務了大量企業客戶,他們的數據里有行業術語、專有名詞,詞元機制的靈活性讓模型可以“見到新詞也不慌”,這一點在工業、金融、醫療等垂直領域尤為重要。
那么企業要為詞元付多少錢呢?收費模式是怎樣的?
黃仁勛曾在演講中首次公開了詞元的分層定價體系。免費層:高吞吐量、低速度,用于吸引用戶;基礎層:每百萬詞元3美元,服務普通用戶;進階層:每百萬詞元6美元,更大模型、更快速度;高速層:每百萬詞元45美元,支持長上下文、深度推理;頂級層:每百萬詞元150美元,面向超長研究任務、關鍵路徑實時響應。
詞元是一種持續性消耗,只要AI還在跑,詞元就在燒。對價格最敏感的是高頻調用的To C產品團隊,詞元成本直接決定了他們的商業模式能否跑通;而大企業則更關注穩定性、安全性和合規性。
張婷表示,定價是一道多元方程,變量很多。首先是硬件成本,GPU芯片是大模型推理最核心的成本,一張高端GPU動輒幾十萬元,運行一個大模型需要幾十甚至幾百張GPU同時工作。電費也是實打實的開銷,一個大型推理集群一年的電費就是天文數字;其次是研發攤銷,服務好一個大模型的推理服務,需要投入大量的工程師、數據、算力,這些研發成本需要通過產品收入來回收;最后還有運維和安全,保證服務99.99%可用、做內容安全過濾、防止濫用,這些都需要成本。
目前百度千帆平臺上主流模型的價格,便宜的已經到了每百萬詞元幾毛錢的水平。而在3年前,詞元的價格大概是現在的幾十倍甚至上百倍。這一成本優勢源于百度千帆積累的技術能力,百度對推理引擎的極致優化、自研的昆侖芯片以及文心大模型的持續優化,使其推理效率在業內處于領先水平。
02
成本優勢從何而來?
“硬件+系統”的組合拳,讓百度千帆在同樣的單位成本下能夠跑出更多的詞元,從底層為詞元的持續降價提供了結構性支撐。
詞元價格持續走低的背后,不是簡單的“降價促銷”,而是技術創新的系統性突破。百度千帆依托百度智能云的全棧自研能力,構建了從昆侖芯片到百舸平臺,再到文心大模型及應用的一體化閉環。這種“芯片—框架—模型—應用”的四層架構,每一層都為下一層做極致優化,避免了跨廠商適配帶來的效率損耗。
百度對推理引擎的極致優化、自研昆侖芯片以及文心大模型的持續優化,讓同樣的錢能跑出更多的詞元。這個效率優勢不是靠壓縮利潤得來的,而是從底層架構中“省”出來的。
硬件層是詞元成本的第一道關卡,算力的核心是芯片。在硬件層面,百度在超節點領域的布局頗具前瞻性,在2025百度世界大會上,百度發布了新一代昆侖芯M100和M300,同步推出天池256超節點與天池512超節點,計劃于今年正式上市,其中單個天池512超節點就能完成萬億參數模型訓練。2025年,昆侖芯已累計完成數萬卡部署,百度已點亮昆侖芯三萬卡集群,可同時支撐多個千億參數大模型訓練。
這意味著處理同樣數量的詞元,需要的硬件更少、能耗更低、散熱成本更小。對于日均調用量動輒萬億級別的平臺來說,這些數字直接體現在詞元單價的下行曲線上。
在系統層面,百舸大規模推理加速系統通過大規模分布式推理的PD分離、MOE模型專家并行優化等技術創新,使推理吞吐提升20倍,推理速度提升50%以上,推理成本進一步降低。例如,MOE專家并行針對混合專家模型的特點,讓不同的專家模型并行工作,避免了算力閑置。這些技術聽起來復雜,但落到客戶賬上就是一句話:同樣的一塊錢,能買到的詞元數量翻了幾十倍。
這種“硬件+系統”的組合拳,讓百度千帆在同樣的單位成本下能夠跑出更多的詞元,從底層為詞元的持續降價提供了結構性支撐。
技術優勢最終需要轉化為客戶價值。在模型層面,百度千帆進一步擴大開放模型生態。除支持文心5.0等150余個精選SOTA模型外,近期還將密集上線Kimi K2.5、GLM 4.7、MiniMax M2.1等多款開源SOTA模型,確保企業和開發者能夠第一時間調用行業最優質的模型資源。
更關鍵的是,百度千帆在推理效率上做了大量精細化的優化。針對智能體應用中常見的長對話、多輪調用場景,平臺推出了“主動Cache模式”,通過創新的分布式KVCache技術,可為企業降低高達80%的推理成本。同時,平臺首創的思維鏈精細化控制能力,能夠智能判斷任務復雜度,為簡單問題匹配短路徑思考,為復雜問題調用多步推理,在保障效果的同時有效控制詞元消耗。
張婷表示,對價格最敏感的,To C產品團隊,比如做AI寫作工具、智能客服、教育輔導App的創業公司,他們的商業模式是“低價或免費給用戶用”,詞元成本直接決定他們能不能活下去。一旦日活用戶增長,詞元消耗會指數級放大,價格差一點點,算下來一個月就是幾十萬元的差距。
讓她印象比較深的是一家做法律科技的公司。他們的產品需要分析海量合同文本,每份合同動輒幾萬字,詞元消耗量極大。早期他們用某家海外API,一個月的詞元費用是主要成本支出。切換到千帆平臺之后,一方面價格更低,另一方面百度針對長文本推理做了專項優化,處理效率提升了30%以上,他們的產品體驗和成本結構同時得到了改善。
目前,百度千帆平臺納管了全球超過150個SOTA模型,工具組件日均調用量達億級;數據服務實現處理提效6倍、計算降本30%。截至目前,基于千帆平臺開發的智能體數量已突破130萬個,平臺客戶數量達46萬以上。
03
從詞元經濟到價值經濟
當詞元價格不再是門檻,競爭的焦點轉向了模型能力、響應速度、定制化程度以及對特定行業的理解深度。
張婷做了一個預判:5年后,“詞元”這個詞可能從普通用戶的視野里消失,但它的價值會以另一種形式存在。計費方式可能從“按詞元數”演變成“按任務結果”,就像打滴滴不需要關心汽油消耗了多少升,用AI寫一份報告你也不用關心消耗了多少詞元,直接為“成果”付費。
這個判斷并非空想。在百度千帆的客戶實踐中,已經有企業不再盯著詞元單價,而是關注“完成一個商業任務需要多少錢”。例如,某電商客戶使用千帆的智能客服智能體,不關心每次對話消耗了多少詞元,只關心“解決了多少客訴、節省了多少人工成本”。當AI從工具變為“數字員工”,計費邏輯自然要從“資源消耗”轉向“產出價值”。
同時,隨著多模態AI的發展——文字、圖片、視頻、音頻都成為模型的輸入輸出,“詞元”的定義本身也會擴展。圖像詞元、音頻詞元、視頻詞元等等,計量單位可能會更復雜,但對用戶的呈現會更簡單。
2025年,百度千帆的品牌戰略已從“百度智能云千帆”升級為“百度千帆”,更加聚焦企業生產場景,提供涵蓋模型服務、智能體開發服務、數據服務在內的一站式服務。
例如,詞元映射幫助全球鉆石畫龍頭“蒂彩工藝”實現生產力重構。通過在業務流中引入千帆智能體節點,將原本需要設計師耗時3小時的鉆石畫底圖生產工作縮減至30秒,打通了從修圖到生產排版的全流程自動化,極大地釋放了企業產能。在這個案例中,客戶付費的依據不再是消耗了多少詞元,而是“30秒完成3小時的工作”——效率提升了360倍,這是真正的價值錨點。
根據IDC報告,2025上半年,中國MaaS市場規模達12.9億元,同比增長421.2%;AI大模型解決方案市場規模達30.7億元,同比增長122.1%。在這兩個市場,百度智能云均處于領先地位,在AI大模型解決方案市場以16.6%的份額領跑,在大模型中標市場以48個中標項目和5.1億元中標金額居“雙第一”。
這個數據說明,百度千帆已經跨過了“技術驗證”階段,進入了“規模化商用”階段。當詞元價格不再是門檻,競爭的焦點轉向了模型能力、響應速度、定制化程度以及對特定行業的理解深度——而這些恰恰是百度千帆通過服務數十萬家企業積累起來的“護城河”。
張婷指出:“在百度千帆,我們現在已經在布局這個方向。MaaS只是起點,最終我們希望提供的是端到端的AI能力,讓企業客戶不用關心底層是哪個模型、消耗了多少詞元,只需要關注:AI幫我解決了什么問題,帶來了多少價值。這才是我們認為的AI商業化的終局形態。”
實際上,基于智能體Infra底座,百度千帆已在體育智能、工業制造、知識服務等多個行業深度落地,將智能體從輔助工具升級為真正的決策伙伴。
例如,在體育智能領域,匠體體育科技基于千帆搭建“足球分析大腦Agent”多智能體系統。利用4000多場高水平比賽、超過400萬條數據,訓練出70多個針對特定技戰術場景的小模型,構建球員個人評估、戰術效能評估、訓練設計等多個Agent,讓智能體從輔助工具演變成能融入教練決策鏈的虛擬助教團隊。
在工業制造領域,一脈云數基于百度千帆解決數據孤島、技術復雜、集成難度等工業智能體落地的行業痛點,深耕重型裝備、工業機器人、新能源汽車等工業領域智能化轉型。在幫助某制造企業進行供應鏈管理優化的過程中,實現了物流效率提高25%、庫存周轉加速18%的顯著成效。
張婷預測,詞元的價格還會繼續下降,而且還有很大的下降空間。驅動降價的底層邏輯沒有變:芯片算力在增長、模型效率在提升、基礎設施的規模效應在累積。這三條曲線都指向同一個方向——詞元越來越便宜。一個標志性的節點是,詞元的價格會便宜到讓普通個人開發者“不用在意”的程度,就像現在沒人會為發一條微信消耗的流量而心疼一樣。估計這個節點在3—5年內會到來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.