飛書多維表格AI獲國際評測榜單冠軍，讓專業(yè)的數(shù)據(jù)分析人人可用

2026-06-15 21:31:38　來源: 硅星Breaknews

上海舉報(bào)

分享至

近日，飛書多維表格 AI 在國際表格數(shù)據(jù)問答評測 TableBench 上拿到全球第一。單看這個(gè)消息，它很容易被理解為又一次模型能力打榜。但放到企業(yè)工作場景里看，這件事更值得關(guān)注的地方在于，AI 開始在“表格"這個(gè)最貼近業(yè)務(wù)的數(shù)據(jù)載體上，展現(xiàn)出更強(qiáng)的理解和分析能力。

而這之所以值得關(guān)注，是因?yàn)樵谄髽I(yè)世界里，表格從來都是一個(gè)特殊存在。它看起來基礎(chǔ)、普通，卻承載著離業(yè)務(wù)最近的數(shù)據(jù)：銷售線索、項(xiàng)目進(jìn)度、庫存狀態(tài)、預(yù)算執(zhí)行、渠道投放、供應(yīng)鏈信息、門店巡檢，很多關(guān)鍵事實(shí)最終都沉淀在一張張表里。也正因?yàn)槿绱耍珹I 在企業(yè)經(jīng)營數(shù)據(jù)表格中的檢索、計(jì)算、分析與洞察能力，具有更加直接的業(yè)務(wù)價(jià)值。

TableBench測評：比的不是查數(shù)，而是完整的業(yè)務(wù)數(shù)據(jù)推理

對多數(shù)企業(yè)來說，真正棘手的不是有沒有數(shù)據(jù)，而是“能不能從多張表格里盡快得到一個(gè)可信判斷”。一個(gè)業(yè)務(wù)人員想回答“為什么本月銷售額下降”“哪些 SKU 連續(xù)走弱”“哪個(gè)區(qū)域回款異常”，往往要先篩選、寫公式、拉透視表，或者把需求交給數(shù)據(jù)團(tuán)隊(duì)排期。

作為面向真實(shí)業(yè)務(wù)場景的表格數(shù)據(jù)問答評測， TableBench 之所以值得關(guān)注，正在于它更接近企業(yè)真實(shí)業(yè)務(wù)場景下的數(shù)據(jù)工作。結(jié)合 TableBench 的任務(wù)設(shè)計(jì)來看，它把表格問答拆成四類能力：數(shù)據(jù)檢索、統(tǒng)計(jì)計(jì)算、數(shù)據(jù)分析和可視化，包含了18項(xiàng)測試任務(wù)，共 886 個(gè)真實(shí)業(yè)務(wù)用例。

它考察的是AI處理企業(yè)真實(shí)表格數(shù)據(jù)的綜合能力，包括能不能先從表格里準(zhǔn)確找到需要的信息，再進(jìn)一步完成計(jì)算、比較、匯總和分析，并把結(jié)果通過圖表更直觀地展示出來。簡單來說，就是看模型能不能真正把表格 “讀明白、算清楚、分析出來、展示出來”。

對企業(yè)用戶而言，這些評測任務(wù)不是抽象的技術(shù)指標(biāo)，而是日常經(jīng)營中的真實(shí)難題：銷售數(shù)據(jù)波動，如何快速定位原因？項(xiàng)目進(jìn)度滯后，如何一眼看清瓶頸？庫存周轉(zhuǎn)異常，如何及時(shí)預(yù)警并給出判斷依據(jù)？從這個(gè)意義上看，飛書多維表格 AI 在 TableBench 最新榜單中位列第一，意味著它在處理真實(shí)業(yè)務(wù)表格時(shí)，已經(jīng)可以幫助用戶從表格數(shù)據(jù)中獲得更可用的業(yè)務(wù)判斷。

直接問，AI答

落到產(chǎn)品里，價(jià)值會變得更直觀。現(xiàn)在用戶在飛書多維表格里打開側(cè)邊欄，就可以直接用自然語言向 AI 提出數(shù)據(jù)分析的需求，AI會給出完整的分析過程和分析結(jié)果。

比如，一個(gè)電商團(tuán)隊(duì)可以直接問：“找出連續(xù)三個(gè)月銷售額下降，且?guī)齑嬷苻D(zhuǎn)天數(shù)大于 30 天的產(chǎn)品。”這個(gè)問題并不只是篩選“銷售額下降”這么簡單，它同時(shí)涉及按月識別銷售趨勢、判斷是否連續(xù)下降，再疊加庫存周轉(zhuǎn)天數(shù)這一庫存效率指標(biāo)。庫存周轉(zhuǎn)天數(shù)大于 30 天通常意味著商品流轉(zhuǎn)速度偏慢，需要結(jié)合品類特性進(jìn)一步判斷是否存在動銷壓力。過去這類分析往往要先分組、計(jì)算、再篩選；現(xiàn)在用戶可以直接表達(dá)業(yè)務(wù)目標(biāo)。

運(yùn)營團(tuán)隊(duì)也可以問：“今年 Q1 和去年 Q4 相比，找出增長最快的前 5 個(gè)品類，并展示總銷量、利潤、增長率。”這里的關(guān)鍵不是查某個(gè)品類銷量，而是做跨周期對比：先統(tǒng)一時(shí)間口徑，再按品類匯總 Q1 與去年 Q4 的表現(xiàn)，計(jì)算增長率并排序，同時(shí)保留總銷量和利潤，避免只看到規(guī)模增長，卻忽略利潤質(zhì)量。

財(cái)務(wù)或銷售管理團(tuán)隊(duì)可以問：“統(tǒng)計(jì) 11 月所有已確認(rèn)回款記錄的總金額，并排除退款與作廢記錄，結(jié)果按人民幣金額匯總。”這類問題看起來樸素，卻非常貼近日常經(jīng)營。它要求 AI 理解“已確認(rèn)”“退款”“作廢”等狀態(tài)字段，也要處理金額口徑和幣種匯總。對業(yè)務(wù)來說，少做一輪手工篩選和核對，就可能意味著更快拿到可用于復(fù)盤和判斷的經(jīng)營數(shù)據(jù)。

組織績效場景同樣如此。比如用戶可以問：“計(jì)算員工平均績效得分，再按區(qū)域權(quán)重計(jì)算總平均績效，最后以 5 分為滿分得出最終績效指標(biāo)。”這不是簡單求平均，而是先計(jì)算個(gè)體或團(tuán)隊(duì)得分，再引入?yún)^(qū)域權(quán)重，最后把結(jié)果歸一到 5 分制。它考驗(yàn)的是 AI 能不能把業(yè)務(wù)規(guī)則轉(zhuǎn)成清晰、可執(zhí)行的計(jì)算過程。

再比如內(nèi)容電商團(tuán)隊(duì)，可以讓 AI “分析粉絲增長率、平均互動率、帶貨轉(zhuǎn)化率和目標(biāo)完成率趨勢，洞察排名前 5 的達(dá)人有什么共性特征，并給出下一步調(diào)整建議”。對一線團(tuán)隊(duì)來說，這類能力的意義不是少點(diǎn)幾下鼠標(biāo)，而是更快完成從數(shù)據(jù)到判斷、再到動作的閉環(huán)。

AI數(shù)據(jù)分析，讓數(shù)據(jù)更快賦能企業(yè)決策

過去幾年，很多企業(yè)已經(jīng)把飛書多維表格當(dāng)作輕量級業(yè)務(wù)系統(tǒng)來使用。它不只保存數(shù)據(jù)，也承載流程、權(quán)限配置。換句話說，多維表格早已成為業(yè)務(wù)運(yùn)行的重要底座。

在這個(gè)基礎(chǔ)上，表格數(shù)據(jù)問答能力的價(jià)值就變得很具體：用戶不必先學(xué)習(xí)復(fù)雜工具，再把業(yè)務(wù)問題翻譯成技術(shù)動作，而是可以直接圍繞經(jīng)營問題提問。對內(nèi)容運(yùn)營、電商、制造、供應(yīng)鏈、項(xiàng)目管理等場景來說，這種變化都很現(xiàn)實(shí)。因?yàn)槎鄶?shù)業(yè)務(wù)問題，本來就不是“要不要分析”，而是“能不能今天就分析出來”。

所以，飛書多維表格 AI 這次在 TableBench 上的成績，重要的不只是“排在第一”。更值得關(guān)注的是，AI 可以更可靠、可信地進(jìn)入企業(yè)最常用、最分散、也最貼近業(yè)務(wù)現(xiàn)場的數(shù)據(jù)入口。當(dāng)表格里的真實(shí)數(shù)據(jù)可以被直接提問、解釋和復(fù)盤，企業(yè)決策鏈路就有機(jī)會變短，數(shù)據(jù)也不再只是被記錄和沉淀，而是更快、更好地支撐企業(yè)經(jīng)營決策。

|(注：內(nèi)容由 AI 生成，請謹(jǐn)慎參考）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.