无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

ROI這口利劍,終于懸在了AI員工頭頂

0
分享至



過去,AI公司習(xí)慣按使用量收費(fèi)。無論是token消耗制還是額度制,本質(zhì)上都是“用多少、付多少”。

這套模式適合模型API,卻未必適合越來越深入工作流的企業(yè)Agent。為了完成一個(gè)任務(wù),它們會(huì)不斷讀取上下文、提煉信息、調(diào)用工具……token消耗很容易膨脹。

一些企業(yè)甚至開始出現(xiàn)token maxxing的情況——員工和Agent不斷增加AI使用量,卻很難證明這些token最終創(chuàng)造了多少價(jià)值。

如此這般,企業(yè)AI的成本越來越高,生產(chǎn)力回報(bào)卻并不總是清晰。Gartner預(yù)計(jì),到2028年,AI編程工具的成本甚至可能超過開發(fā)者薪資。

就在大家還在討論token該怎么省的時(shí)候,AI編程Agent公司Cognition提出了另一種思路:

它沒有繼續(xù)強(qiáng)調(diào)Devin消耗了多少token,而是把Devin完成的工作折算成“等效工程師小時(shí)”,再換算成美元價(jià)值。更進(jìn)一步,Cognition還推出了Productivity Guarantee——如果Devin創(chuàng)造的工程價(jià)值低于客戶支付的費(fèi)用,公司將返還最高1000萬美元額度的使用credits。



比起“AI能不能干活”,Cognition試圖回答另一個(gè)老板更為關(guān)心的問題:

這個(gè)AI員工,到底值不值這個(gè)價(jià)。

01

token消耗只是成本,不是價(jià)值

單看產(chǎn)品形態(tài),Cognition的主產(chǎn)品Devin仍然屬于AI編程Agent:寫代碼、修Bug、提交PR,都是這個(gè)賽道里的標(biāo)準(zhǔn)能力。讓它脫穎而出的是,Cognition沒有把Devin只當(dāng)成一個(gè)開發(fā)者工具來賣,而是把它包裝成一套能用ROI來衡量的生產(chǎn)力方案。

在David Senra 6月28日的最新訪談里,Cognition的CEO Scott Wu 專門用了一個(gè)章節(jié)討論“Measuring ROI Instead Of Token Spend”(用ROI而不是token消耗,來衡量AI的價(jià)值)。

他提到,一些企業(yè)開始統(tǒng)計(jì)員工用了多少AI、消耗了多少token,甚至把token用量當(dāng)成內(nèi)部指標(biāo)。但這樣很容易偏離真正的問題。

因?yàn)閠oken消耗只是成本,不是價(jià)值。

企業(yè)真正關(guān)心的根本不是誰用了更多AI,而是這些AI最終完成了多少工作。



Scott Wu舉了一個(gè)例子:

如果一個(gè)原本需要花1500萬美元、18個(gè)月的項(xiàng)目,最終借助Devin和內(nèi)部團(tuán)隊(duì),只花100萬美元、3個(gè)月就完成了,那么對(duì)于CEO和CFO來說,這筆投資就是劃算的。

他們其實(shí)并不在意這個(gè)項(xiàng)目花了多少token,甚至不在意你用的是哪家的AI——只要你能幫我解決我的問題、完成我的任務(wù),我就覺得這筆錢畫得值。

我用更少的錢、更短的時(shí)間,拿到了同樣甚至更好的結(jié)果,我就賺了。

Cognition會(huì)派團(tuán)隊(duì)到客戶現(xiàn)場(chǎng),幫他們找適合Devin的使用場(chǎng)景,做用戶培訓(xùn),搭建工作流程,寫playbook,配合安全審查和私有云部署。

也就是說,Devin被包裝成一套企業(yè)生產(chǎn)力改造方案,而不是被當(dāng)作一個(gè)“開箱即用”的工具。

這套打法不太像一家普通SaaS公司,更像一家咨詢公司或IT外包公司。企業(yè)采購(gòu)咨詢服務(wù),最終買單的是項(xiàng)目成果;采購(gòu)AI Agent,也正在越來越接近這種邏輯。

在這套邏輯下,Cognition想證明的不只是Devin的代碼能力,更重要的是,它值不值得進(jìn)入企業(yè)預(yù)算。

02

AI員工的價(jià)值,是怎么被計(jì)算出來的

問題是,ROI并不是一句空話。

如果Devin要向企業(yè)證明自己“值這個(gè)價(jià)”,Cognition首先要回答一個(gè)更具體的問題:一個(gè)AI工程師完成的工作,到底怎么換算成美元價(jià)值?

Cognition專門寫了一篇文章解釋這套方法。它承認(rèn),直接計(jì)算AI帶來的商業(yè)價(jià)值很難——一個(gè)PR到底帶來多少收入,一個(gè)Bug修復(fù)到底避免了多少損失,這些很難被精確歸因。所以Cognition沒有一上來就計(jì)算最終商業(yè)收益,它選擇了一個(gè)中間指標(biāo):“有效工程師小時(shí)”



首先,他們收集了126位企業(yè)開發(fā)者、258個(gè)真實(shí)Devin Session的數(shù)據(jù)。每位開發(fā)者都會(huì)回答一個(gè)問題:如果沒有Devin,這項(xiàng)工作你自己需要花多久?

這些真實(shí)反饋,被用來訓(xùn)練和校準(zhǔn)整套評(píng)估系統(tǒng)。之后,每一次Devin完成任務(wù),這套系統(tǒng)都會(huì)重新評(píng)估它到底創(chuàng)造了多少價(jià)值。

整個(gè)過程大致可以分為三步:

第一步,先過濾掉無效工作。

不是每一次Devin Session都算生產(chǎn)力。

如果Devin生成了一堆代碼,最后沒有被采用、沒有推進(jìn)項(xiàng)目、也沒有真正解決問題(PR沒有被合并),那么這些token消耗就不會(huì)被計(jì)入價(jià)值。

對(duì)于沒有PR的任務(wù),它還會(huì)用分類器判斷這個(gè)Session是否真的推進(jìn)了工作。比如查找未使用依賴、掃描安全漏洞、審查PR、跑數(shù)據(jù)查詢、排查Bug等等,這些工作不一定產(chǎn)生代碼,但仍然可能是有效工程工作。

相反,如果Devin因?yàn)闆]有權(quán)限無法繼續(xù),或者向用戶追問后沒人回復(fù),這類Session就會(huì)被過濾掉。

第二步,估算人類工程師完成同樣任務(wù)需要多少時(shí)間。

評(píng)估系統(tǒng)會(huì)讀取整個(gè)Session,包括用戶需求、Devin執(zhí)行過程、代碼、PR、日志以及代碼庫(kù)上下文,然后估算一名普通工程師完成同樣結(jié)果需要投入多少時(shí)間。

它甚至?xí)紤]很多細(xì)節(jié),例如:如果用戶已經(jīng)告訴了Devin具體怎么改,那只計(jì)算寫代碼的時(shí)間;如果Bug需要自己定位,那定位時(shí)間也要算進(jìn)去;如果這是一個(gè)陌生的遺留代碼庫(kù),人類需要先花時(shí)間熟悉,而Devin已經(jīng)完成了這部分工作,這些時(shí)間同樣會(huì)計(jì)入價(jià)值。

第三步,再把工程師時(shí)間換算成美元。

Cognition采用統(tǒng)一的工程師成本標(biāo)準(zhǔn),把“等效工程師小時(shí)”轉(zhuǎn)換成美元價(jià)值,再與企業(yè)實(shí)際支付的費(fèi)用進(jìn)行比較。

如果創(chuàng)造的價(jià)值高于成本,企業(yè)獲得正ROI;如果低于成本,Cognition就通過Productivity Guarantee返還credits(最高價(jià)值1000萬美元)。

當(dāng)然,Cognition并沒有宣稱這套算法能夠精確計(jì)算每一個(gè)任務(wù)的真實(shí)價(jià)值,他們?cè)诩夹g(shù)文檔里承認(rèn),單個(gè)任務(wù)的估算可能存在2到3倍誤差。但他們認(rèn)為,隨著企業(yè)部署規(guī)模擴(kuò)大、任務(wù)數(shù)量增加,整體平均結(jié)果會(huì)越來越穩(wěn)定,更接近AI創(chuàng)造的真實(shí)生產(chǎn)力。



這套機(jī)制值得關(guān)注的地方也不是它能把每一行代碼都精確折算成多少錢。重點(diǎn)在于,它把AI Agent的價(jià)值衡量,從“消耗了多少token”,轉(zhuǎn)向了“替企業(yè)節(jié)省了多少工程時(shí)間”。

因?yàn)槟切┐篌w量的客戶并不會(huì)只因?yàn)橐粋€(gè)AI產(chǎn)品看起來很酷,就去大規(guī)模部署。它們要過預(yù)算、合規(guī)、安全、采購(gòu)和財(cái)務(wù)審核,必須有人解釋:為什么這筆錢值得花?

過去,ROI往往是客戶內(nèi)部采購(gòu)部門、業(yè)務(wù)部門或財(cái)務(wù)部門需要自己計(jì)算的事。軟件公司只負(fù)責(zé)賣工具,至于工具有沒有真正提升效率、節(jié)省成本,更多要靠客戶自己證明。買了、用了、效果不好,通常也是客戶自己消化。

但Cognition把這件事攬了過來,在銷售階段就主動(dòng)幫客戶把這筆賬算清楚,還用Productivity Guarantee把一部分風(fēng)險(xiǎn)接了過去。

這套打法也確實(shí)成為了Cognition擴(kuò)張故事的一部分:Cognition在融資時(shí)披露,企業(yè)用量今年以來增長(zhǎng)超過10倍,run-rate revenue已經(jīng)達(dá)到4.92億美元;同時(shí),它把Citi、Goldman Sachs、Santander、Mercedes-Benz、Dell、美國(guó)陸軍和海軍等大客戶放在了最顯眼的位置。

Cognition這套邏輯帶來的最大價(jià)值就在于,它讓Devin從工程師手里的AI編程工具,變成了CFO能看懂、采購(gòu)部門能推進(jìn)、CEO能批準(zhǔn)的預(yù)算項(xiàng)。

畢竟,不是所有老板都會(huì)寫代碼,但所有老板都會(huì)算賬。

03

AI越像員工,就越要看結(jié)果

如果把視角從AI編程Agent放大到企業(yè)Agent,事實(shí)上,按結(jié)果衡量?jī)r(jià)值這件事,客服Agent已經(jīng)先走了一步。

比如Intercom。它原本就是做客戶服務(wù)軟件的,F(xiàn)in是它推出的AI客服Agent,它就是按一次成功結(jié)果收費(fèi),官方價(jià)格是每個(gè)結(jié)果0.99美元。

Zendesk也是類似邏輯,作為老牌客服軟件公司,它的AI Agent面向客服工單場(chǎng)景,收費(fèi)單位是“自動(dòng)解決”:只有AI獨(dú)立解決了一次客戶問題,才會(huì)被計(jì)入收費(fèi)。

Sierra則從一開始就把自己定位成“按業(yè)務(wù)結(jié)果收費(fèi)”的企業(yè)Agent公司,服務(wù)客服、銷售、續(xù)費(fèi)、退訂挽回等場(chǎng)景,客戶為AI完成了多少次有效業(yè)務(wù)結(jié)果付費(fèi)。

因?yàn)榭头?chǎng)景的結(jié)果最容易定義。用戶問題有沒有被解決、工單有沒有關(guān)閉、客戶有沒有被成功轉(zhuǎn)化……這些結(jié)果比“一個(gè)PR到底創(chuàng)造了多少商業(yè)價(jià)值”更容易被衡量。

傳統(tǒng)的企業(yè)服務(wù)本來就看重結(jié)果,ROI敘事本身就是企業(yè)軟件、咨詢服務(wù)和IT外包行業(yè)里非常常見的商業(yè)邏輯。可以說,客服Agent率先把這套邏輯轉(zhuǎn)移到了AI領(lǐng)域,而Devin又把這套邏輯搬到了更復(fù)雜的軟件工程場(chǎng)景。

不過,AI行業(yè)里并不是所有產(chǎn)品都適合用ROI直接計(jì)費(fèi)。

底層模型API就像水電煤,模型公司提供的是算力和模型調(diào)用能力,客戶調(diào)用一次模型,就會(huì)產(chǎn)生真實(shí)的推理成本。所以O(shè)penAI、Anthropic、Google這類模型公司,仍然很難完全擺脫token、調(diào)用量或credits計(jì)費(fèi)。

Copilot類產(chǎn)品則更像傳統(tǒng)軟件,GitHub Copilot、Microsoft 365 Copilot、ChatGPT Business這類產(chǎn)品,主要賣的是一個(gè)固定入口和一套使用權(quán)限,所以更適合按人頭、按月訂閱。

但Agent產(chǎn)品不一樣。

我們之前在討論Claude Tag的時(shí)候就提過,“AI同事”并不等于免費(fèi)牛馬。

企業(yè)Agent越像一個(gè)真正的同事,token消耗就越不可能像普通聊天那樣可控。當(dāng)這個(gè)AI同事足夠聰明、足夠勤快、足夠愿意加班的時(shí)候,企業(yè)反而需要限制它的使用。

AI同事也要有預(yù)算;而一旦有預(yù)算,老板就會(huì)繼續(xù)往下問:這筆預(yù)算帶來了多少回報(bào)?

換句話說,如果AI只是工具,企業(yè)可以按使用量、按席位、按額度付費(fèi);但如果AI被包裝成一個(gè)員工,老板自然也會(huì)用考核員工的方式考核它。

ROI敘事未必代表AI計(jì)費(fèi)方式的終點(diǎn),也不意味著所有企業(yè)Agent都會(huì)立刻轉(zhuǎn)向按成果收費(fèi)。但Cognition確實(shí)在軟件工程這個(gè)更難量化的場(chǎng)景里,重新建立了一套R(shí)OI計(jì)算方法,展示了Agent商業(yè)化的一條清晰路徑。

畢竟,當(dāng)“AI員工”正式上崗,老板遲早會(huì)問一句:

這個(gè)AI員工,到底值不值這個(gè)價(jià)?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
從21樓扔花盆!!天津警方:已采取刑事強(qiáng)制措施

從21樓扔花盆!!天津警方:已采取刑事強(qiáng)制措施

天津族
2026-07-01 12:48:35
新臺(tái)風(fēng)或直接影響廣東!暴雨、大暴雨要來了→

新臺(tái)風(fēng)或直接影響廣東!暴雨、大暴雨要來了→

白云融媒
2026-07-01 16:42:44
剛剛公布:天津千萬資產(chǎn)、身價(jià)過億富豪數(shù)量曝光!

剛剛公布:天津千萬資產(chǎn)、身價(jià)過億富豪數(shù)量曝光!

天津人
2026-07-01 15:16:37
美國(guó)發(fā)話也不行,中方正式通告全球:打日本,中國(guó)具備“正當(dāng)性”

美國(guó)發(fā)話也不行,中方正式通告全球:打日本,中國(guó)具備“正當(dāng)性”

鳳語談
2026-05-28 12:13:58
宣布了!準(zhǔn)備重返NBA!狀元郎直接點(diǎn)名熱火

宣布了!準(zhǔn)備重返NBA!狀元郎直接點(diǎn)名熱火

籃球?qū)崙?zhàn)寶典
2026-06-30 21:12:05
崔麒加盟玉昆,大連英博甩掉高薪包袱 李昂回避 戰(zhàn)三鎮(zhèn)拒3連敗

崔麒加盟玉昆,大連英博甩掉高薪包袱 李昂回避 戰(zhàn)三鎮(zhèn)拒3連敗

替補(bǔ)席看球
2026-07-01 18:48:23
賺翻了!阿森納放棄 1.3 億世界杯水貨,轉(zhuǎn)頭要撿漏頂級(jí)邊鋒!

賺翻了!阿森納放棄 1.3 億世界杯水貨,轉(zhuǎn)頭要撿漏頂級(jí)邊鋒!

瀾歸序
2026-07-01 06:35:40
巴媒:帕奎塔將留在巴西隊(duì)治療,力爭(zhēng)比原計(jì)劃更早重返賽場(chǎng)

巴媒:帕奎塔將留在巴西隊(duì)治療,力爭(zhēng)比原計(jì)劃更早重返賽場(chǎng)

懂球帝
2026-07-01 15:17:17
減肥這生意,有多臟!

減肥這生意,有多臟!

梳子姐
2026-06-30 11:43:52
伊朗:伊美諒解備忘錄條款“清清楚楚、公開透明、人人可見”,特朗普已承諾約束其在以色列的“寵物”,如果以方面無視,伊朗將出手教訓(xùn)

伊朗:伊美諒解備忘錄條款“清清楚楚、公開透明、人人可見”,特朗普已承諾約束其在以色列的“寵物”,如果以方面無視,伊朗將出手教訓(xùn)

魯中晨報(bào)
2026-07-01 19:34:16
中國(guó)U17男籃不敵法國(guó)無緣八強(qiáng)引熱議!26分落敗輸最多一戰(zhàn)

中國(guó)U17男籃不敵法國(guó)無緣八強(qiáng)引熱議!26分落敗輸最多一戰(zhàn)

狼叔評(píng)論
2026-07-01 19:58:09
163的王祖藍(lán)和175的老婆換褲子穿,一個(gè)成人行拖把,一個(gè)成7分褲

163的王祖藍(lán)和175的老婆換褲子穿,一個(gè)成人行拖把,一個(gè)成7分褲

木子愛娛樂大號(hào)
2026-06-22 10:21:23
看看中國(guó),再看看美國(guó),歐洲人更難受了……

看看中國(guó),再看看美國(guó),歐洲人更難受了……

環(huán)球時(shí)報(bào)國(guó)際
2026-07-01 07:45:23
天津一女子要和同居男友分手,6年戀情不敵大姑姐攪局

天津一女子要和同居男友分手,6年戀情不敵大姑姐攪局

九方魚論
2026-07-01 19:53:16
大難臨頭各自飛!中方甩出嚴(yán)厲措辭:美日也不叫了,臺(tái)獨(dú)也不跳了

大難臨頭各自飛!中方甩出嚴(yán)厲措辭:美日也不叫了,臺(tái)獨(dú)也不跳了

九客說事
2026-06-29 16:50:09
Shams:騎士前鋒迪恩-韋德4年3900萬美元加盟76人

Shams:騎士前鋒迪恩-韋德4年3900萬美元加盟76人

懂球帝
2026-07-01 10:55:14
太沉重了!一張殯儀館的電子顯示屏8位逝者,有6人未能活到55歲

太沉重了!一張殯儀館的電子顯示屏8位逝者,有6人未能活到55歲

火山詩(shī)話
2026-06-12 08:54:20
被嚴(yán)重低估!銻化銦:AI航天硬核剛需,2026國(guó)產(chǎn)替代爆發(fā)

被嚴(yán)重低估!銻化銦:AI航天硬核剛需,2026國(guó)產(chǎn)替代爆發(fā)

愛看劇的阿峰
2026-07-01 16:18:07
浙江今日“南北兩重天”:浙北暴雨倒水,文成熱到37.2℃!明天還這樣嗎?

浙江今日“南北兩重天”:浙北暴雨倒水,文成熱到37.2℃!明天還這樣嗎?

浙江天氣
2026-07-01 19:30:55
外國(guó)人對(duì)中國(guó)煙是怎么評(píng)價(jià) 看完網(wǎng)友講述感覺這么多年煙都白抽了

外國(guó)人對(duì)中國(guó)煙是怎么評(píng)價(jià) 看完網(wǎng)友講述感覺這么多年煙都白抽了

侃神評(píng)故事
2026-06-23 16:47:22
2026-07-01 20:47:00
字母榜 incentive-icons
字母榜
讓未來不止于大。
2582文章數(shù) 8069關(guān)注度
往期回顧 全部

科技要聞

Claude Code被曝“植入木馬”識(shí)別中國(guó)用戶

頭條要聞

小區(qū)起火雙胞胎男童遇難:消防栓疑無水 物業(yè)經(jīng)理辭職

頭條要聞

小區(qū)起火雙胞胎男童遇難:消防栓疑無水 物業(yè)經(jīng)理辭職

體育要聞

賣球衣救子的門將,把德國(guó)撲出了世界杯

娛樂要聞

張凌赫:我連心疼你都隔著時(shí)差

財(cái)經(jīng)要聞

新氧貸款:宣傳年化15%,實(shí)際頂格24%

汽車要聞

上半年累計(jì)銷量突破142萬輛 吉利6月銷量出爐

態(tài)度原創(chuàng)

家居
本地
數(shù)碼
親子
公開課

家居要聞

傳奇筑 日常詩(shī)

本地新聞

強(qiáng)烈建議,全國(guó)高校都向這所大學(xué)看齊!

數(shù)碼要聞

Intel發(fā)新版驅(qū)動(dòng):銳炫G3卻只支持Extreme版、標(biāo)準(zhǔn)版蹤影全無

親子要聞

月嫂每天帶寶寶唱歌,突然有一天寶寶也跟著唱了,寶寶不會(huì)拍手于是用腳鼓掌

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版