近日,飛書多維表格 AI 在國際表格數(shù)據(jù)問答評測 TableBench 上拿到全球第一。單看這個(gè)消息,它很容易被理解為又一次模型能力打榜。但放到企業(yè)工作場景里看,這件事更值得關(guān)注的地方在于,AI 開始在“表格"這個(gè)最貼近業(yè)務(wù)的數(shù)據(jù)載體上,展現(xiàn)出更強(qiáng)的理解和分析能力。
而這之所以值得關(guān)注,是因?yàn)樵谄髽I(yè)世界里,表格從來都是一個(gè)特殊存在。 它看起來基礎(chǔ)、普通,卻承載著離業(yè)務(wù)最近的數(shù)據(jù):銷售線索、項(xiàng)目進(jìn)度、庫存狀態(tài)、預(yù)算執(zhí)行、渠道投放、供應(yīng)鏈信息、門店巡檢,很多關(guān)鍵事實(shí)最終都沉淀在一張張表里。也正因?yàn)槿绱耍珹I 在企業(yè)經(jīng)營數(shù)據(jù)表格中的檢索、計(jì)算、分析與洞察能力,具有更加直接的業(yè)務(wù)價(jià)值。
![]()
TableBench測評 :比的不是查數(shù),而是完整的業(yè)務(wù)數(shù)據(jù)推理
對多數(shù)企業(yè)來說,真正棘手的不是有沒有數(shù)據(jù),而是“能不能從多張表格里盡快得到一個(gè)可信判斷”。一個(gè)業(yè)務(wù)人員想回答“為什么本月銷售額下降”“哪些 SKU 連續(xù)走弱”“哪個(gè)區(qū)域回款異常”,往往要先篩選、寫公式、拉透視表,或者把需求交給數(shù)據(jù)團(tuán)隊(duì)排期。
作為面向真實(shí)業(yè)務(wù)場景的表格數(shù)據(jù)問答評測, TableBench 之所以值得關(guān)注,正在于它更接近企業(yè)真實(shí)業(yè)務(wù)場景下的數(shù)據(jù)工作。結(jié)合 TableBench 的任務(wù)設(shè)計(jì)來看,它把表格問答拆成四類能力:數(shù)據(jù)檢索、統(tǒng)計(jì)計(jì)算、數(shù)據(jù)分析和可視化,包含了18項(xiàng)測試任務(wù),共 886 個(gè)真實(shí)業(yè)務(wù)用例。
它考察的是AI處理企業(yè)真實(shí)表格數(shù)據(jù)的綜合能力,包括能不能先從表格里準(zhǔn)確找到需要的信息,再進(jìn)一步完成計(jì)算、比較、匯總和分析,并把結(jié)果通過圖表更直觀地展示出來。簡單來說,就是看模型能不能真正把表格 “讀明白、算清楚、分析出來、展示出來”。
對企業(yè)用戶而言,這些評測任務(wù)不是抽象的技術(shù)指標(biāo),而是日常經(jīng)營中的真實(shí)難題:銷售數(shù)據(jù)波動,如何快速定位原因?項(xiàng)目進(jìn)度滯后,如何一眼看清瓶頸?庫存周轉(zhuǎn)異常,如何及時(shí)預(yù)警并給出判斷依據(jù)?從這個(gè)意義上看,飛書多維表格 AI 在 TableBench 最新榜單中位列第一,意味著它在處理真實(shí)業(yè)務(wù)表格時(shí),已經(jīng)可以幫助用戶從表格數(shù)據(jù)中獲得更可用的業(yè)務(wù)判斷。
![]()
直接問,AI答
落到產(chǎn)品里,價(jià)值會變得更直觀。現(xiàn)在用戶在飛書多維表格里打開側(cè)邊欄,就可以直接用自然語言向 AI 提出數(shù)據(jù)分析的需求,AI會給出完整的分析過程和分析結(jié)果。
![]()
比如,一個(gè)電商團(tuán)隊(duì)可以直接問:“找出連續(xù)三個(gè)月銷售額下降,且?guī)齑嬷苻D(zhuǎn)天數(shù)大于 30 天的產(chǎn)品。”這個(gè)問題并不只是篩選“銷售額下降”這么簡單,它同時(shí)涉及按月識別銷售趨勢、判斷是否連續(xù)下降,再疊加庫存周轉(zhuǎn)天數(shù)這一庫存效率指標(biāo)。庫存周轉(zhuǎn)天數(shù)大于 30 天通常意味著商品流轉(zhuǎn)速度偏慢,需要結(jié)合品類特性進(jìn)一步判斷是否存在動銷壓力。過去這類分析往往要先分組、計(jì)算、再篩選;現(xiàn)在用戶可以直接表達(dá)業(yè)務(wù)目標(biāo)。
運(yùn)營團(tuán)隊(duì)也可以問:“今年 Q1 和去年 Q4 相比,找出增長最快的前 5 個(gè)品類,并展示總銷量、利潤、增長率。”這里的關(guān)鍵不是查某個(gè)品類銷量,而是做跨周期對比:先統(tǒng)一時(shí)間口徑,再按品類匯總 Q1 與去年 Q4 的表現(xiàn),計(jì)算增長率并排序,同時(shí)保留總銷量和利潤,避免只看到規(guī)模增長,卻忽略利潤質(zhì)量。
財(cái)務(wù)或銷售管理團(tuán)隊(duì)可以問:“統(tǒng)計(jì) 11 月所有已確認(rèn)回款記錄的總金額,并排除退款與作廢記錄,結(jié)果按人民幣金額匯總。”這類問題看起來樸素,卻非常貼近日常經(jīng)營。它要求 AI 理解“已確認(rèn)”“退款”“作廢”等狀態(tài)字段,也要處理金額口徑和幣種匯總。對業(yè)務(wù)來說,少做一輪手工篩選和核對,就可能意味著更快拿到可用于復(fù)盤和判斷的經(jīng)營數(shù)據(jù)。
組織績效場景同樣如此。比如用戶可以問:“計(jì)算員工平均績效得分,再按區(qū)域權(quán)重計(jì)算總平均績效,最后以 5 分為滿分得出最終績效指標(biāo)。”這不是簡單求平均,而是先計(jì)算個(gè)體或團(tuán)隊(duì)得分,再引入?yún)^(qū)域權(quán)重,最后把結(jié)果歸一到 5 分制。它考驗(yàn)的是 AI 能不能把業(yè)務(wù)規(guī)則轉(zhuǎn)成清晰、可執(zhí)行的計(jì)算過程。
再比如內(nèi)容電商團(tuán)隊(duì),可以讓 AI “分析粉絲增長率、平均互動率、帶貨轉(zhuǎn)化率和目標(biāo)完成率趨勢,洞察排名前 5 的達(dá)人有什么共性特征,并給出下一步調(diào)整建議”。對一線團(tuán)隊(duì)來說,這類能力的意義不是少點(diǎn)幾下鼠標(biāo),而是更快完成從數(shù)據(jù)到判斷、再到動作的閉環(huán)。
AI數(shù)據(jù)分析,讓數(shù)據(jù)更快賦能企業(yè)決策
過去幾年,很多企業(yè)已經(jīng)把飛書多維表格當(dāng)作輕量級業(yè)務(wù)系統(tǒng)來使用。它不只保存數(shù)據(jù),也承載流程、權(quán)限配置。換句話說,多維表格早已成為業(yè)務(wù)運(yùn)行的重要底座。
在這個(gè)基礎(chǔ)上,表格數(shù)據(jù)問答能力的價(jià)值就變得很具體:用戶不必先學(xué)習(xí)復(fù)雜工具,再把業(yè)務(wù)問題翻譯成技術(shù)動作,而是可以直接圍繞經(jīng)營問題提問。對內(nèi)容運(yùn)營、電商、制造、供應(yīng)鏈、項(xiàng)目管理等場景來說,這種變化都很現(xiàn)實(shí)。因?yàn)槎鄶?shù)業(yè)務(wù)問題,本來就不是“要不要分析”,而是“能不能今天就分析出來”。
所以,飛書多維表格 AI 這次在 TableBench 上的成績,重要的不只是“排在第一”。更值得關(guān)注的是,AI 可以更可靠、可信地進(jìn)入企業(yè)最常用、最分散、也最貼近業(yè)務(wù)現(xiàn)場的數(shù)據(jù)入口。當(dāng)表格里的真實(shí)數(shù)據(jù)可以被直接提問、解釋和復(fù)盤,企業(yè)決策鏈路就有機(jī)會變短,數(shù)據(jù)也不再只是被記錄和沉淀,而是更快、更好地支撐企業(yè)經(jīng)營決策。
|(注:內(nèi)容由 AI 生成,請謹(jǐn)慎參考)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.