无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

智薈月刊 | 詞元經濟時代數據標注產業的價值重構與路徑創新

0
分享至


讓詞元更有質量

——推動詞元經濟高質量發展

編者按詞元(Token)正成為人工智能服務的核心計量、結算與統計單位。當前,詞元經濟呈現爆發式增長態勢,各類應用場景層出不窮,但“有流量、無質量”“有消耗、難評價”等問題日益凸顯:詞元消耗量難以反映AI服務真實價值、定價機制混亂、高質量供給缺乏有效激勵。

近日,國家數據局召開詞元經濟座談會,明確將詞元經濟納入工作體系,釋放出推動行業從規模擴張轉向高質量發展的強烈信號。中國經濟時報社等機構的專家學者和部分知名企業代表應邀參會發言。本期《智薈月刊》以“讓詞元更有質量——推動詞元經濟高質量發展”為主題,特別邀請四位與會專家,圍繞詞元經濟健康發展的核心議題展開深入研討,并從政策、技術、經濟與治理等維度帶來前沿思考與務實建議,以饗讀者。

崔向雨

當前,人工智能正從模型驅動邁向數據—模型—應用協同演進的新階段,詞元(Token)作為智能交互最小單元與價值結算載體,正重塑AI產業價值分配邏輯與商業模式。作為深耕高質量數據集建設、數據標注服務的市場主體,海天瑞聲深度參與詞元經濟生態構建,結合產業實踐,就詞元經濟發展趨勢、數據標注企業參與詞元經濟的路徑提出以下思考。

詞元規模化催生數據價值重估

大模型與智能體(AI Agent)的規模化應用,帶動詞元調用量指數級增長。國家數據局數據顯示,2026年3月中國日均詞元調用量已突破140萬億,兩年增長超千倍。數據服務行業隨之進入高速發展期。以海天瑞聲為例,2025年全年營收3.77億元(同比+59.00%),歸母凈利潤1411.85萬元(同比+24.54%);2026年第一季度營收9677.93萬元(同比+38.63%),歸母凈利潤840.30萬元(同比+2161.14%)。值得注意的是,國內收入已超越海外,反映出我國AI產業鏈自主供給能力的持續增強。

詞元經濟帶來三大深刻變革:其一,定價邏輯遷移。數據服務從按人工工時、數據條數計價,正逐步向按詞元質量、模型效果、場景價值定價擴展。其二,商業閉環初現。詞元調用量的持續增長驗證了“數據加工—模型訓練—推理服務”的商業可行性,但正向循環仍需高質量數據持續反哺。其三,產業位勢提升。數據已從模型訓練的輔助成本,升級為決定詞元信息密度、推理可靠性與應用安全性的核心資源。

高質量數據集是詞元經濟的價值根基與定價錨點

詞元經濟的本質是可計量、可定價、可交易的智能服務規模化。國家數據局將推動詞元經濟發展納入工作體系,以行業高質量數據集建設和全國一體化算力網建設為著力點。在詞元經濟的生產鏈條中,數據標注環節發揮基礎性作用。

(一)高質量數據集是詞元價值的“核心錨點”

詞元價值并非簡單由“數量×模型版本”決定,而是深度依賴數據采集、匯聚、清洗、標注、質檢、對齊全流程專業投入。高質量數據集賦予詞元準確性、知識性、邏輯性與場景適配性,直接決定模型推理效果、應用可靠性與商業價值,是詞元價值評估的核心錨點。

(二)數據工廠是詞元供給的“源頭活水”

數據工廠提供持續、穩定、合規、多模態的高質量數據,支撐模型預訓練、指令微調、強化學習、測評驗證全生命周期,是詞元規模化生成與穩定供給的基礎設施。打造“數據加工—流通利用—模型訓練”應用于一體的數據賦能工場,提升高效、專業的高質量數據供給能力,產出高價值詞元。

(三)數據標注是詞元經濟的“筑基工程”

數據標注將行業知識、邏輯規則、人類經驗注入數據,是提升數據集知識密度與模型理解能力的關鍵環節。面向專業領域的專家型標注、人機協同標注,直接決定垂直場景詞元的可用性與競爭力,是數據要素價值化的核心抓手。

完善頂層設計,推動詞元經濟高質量發展

面向詞元經濟規模化、規范化、普惠化發展,結合數據產業實踐,提出三方面政策建議。

(一)加快統一詞元經濟標準規范,夯實制度底座

當前詞元經濟在概念界定、分類認定、計量口徑、定價機制、合規流程等方面尚未形成統一標準,企業實踐缺乏清晰指引。建議加快構建覆蓋詞元定義、質量分級、定價規則、交易機制、安全合規的標準體系,形成行業共識,降低制度性交易成本,引導產業有序發展。

(二)以高質量數據集為錨,健全詞元價值評估體系

詞元價值評估應充分體現數據全流程價值貢獻,改變“重算力、輕數據”“重模型、輕底座”的傾向。建議將高質量數據集價值認定納入詞元價值評估核心維度,建立“數據質量—模型效果—詞元價值”聯動評估機制,讓數據價值在詞元經濟中得到合理體現與回報。

(三)統籌數據加工與算力布局,協同提升產業效能

算力是詞元經濟“動力”供給的“能量廠”,數據標注是詞元經濟“原料”供給的“精煉廠”,二者必須協同布局。建議在全國一體化算力網建設中,同步強化數據加工能力布局,支持數據標注、數據合成、質量測評、安全治理等環節能力提升,避免僅關注算力輸出而忽視數據底座建設,形成“數據精煉—模型訓練—詞元生成—場景應用”全鏈條高效協同。

數據標注企業融入詞元經濟的三大方向

作為數據服務企業,海天瑞聲將以三大舉措深度融入詞元生態,助力產業高質量發展。

一是做強數據標注核心能力。推進標注模式從人工為主向模型預標注+人工校準、人工標注+模型檢驗升級,發展專家型標注服務,建立行業專家參與機制,提升高知識密度、高專業性數據集供給能力,夯實詞元經濟產業根基。

二是擴大高質量數據集供給。聚焦人工智能重點領域與未來產業,體系化建設多模態、場景化、AI-Ready高質量數據集,推動公共數據與產業數據融合應用,強化鏈主協同與上下游聯動,為詞元生成提供持續優質“原料”。

三是構建價值共生新生態。積極探索數據要素與詞元價值聯動機制,推動形成模型能力提升—規模擴大—價值釋放—反哺高質量數據的良性循環,培育“為高質量數據付費”的市場共識,避免成本層層傳導擠壓數據環節利潤,實現數據產業與詞元經濟可持續發展。

同時,支持地方依托數據資源、算力資源與產業基礎,打造詞元經濟融合發展示范區,推動詞元能力與地方產業升級、專利轉化、實體經濟深度結合,釋放數據要素與詞元經濟疊加效應。

結語

詞元經濟是智能經濟的核心形態,更是數據要素價值化的關鍵載體。高質量數據集作為詞元經濟的根基與錨點,決定產業發展高度、安全底線與價值空間。唯有堅持標準引領、質量優先、數據筑基、生態協同,才能推動詞元經濟行穩致遠,為我國人工智能產業高質量發展、新質生產力培育與數字中國建設提供堅實支撐。

(作者系北京海天瑞聲科技股份有限公司副總裁、政企事業部總經理)


總 監 制丨王列軍車海剛

監 制丨陳 波 王 彧 楊玉洋

主 編丨毛晶慧 編 輯丨陳姝含



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

中國經濟時報 incentive-icons
中國經濟時報
國研中心主辦的綜合性經濟日報
42508文章數 64252關注度
往期回顧 全部

專題推薦

洞天福地 花海畢節 山水饋贈里的“詩與遠方

無障礙瀏覽 進入關懷版