无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI,重構(gòu)軟件行業(yè)!緩存機(jī)制定勝負(fù),未來(lái)格局三分天下

0
分享至



這不僅是一場(chǎng)關(guān)于算法架構(gòu)優(yōu)劣的技術(shù)較量,更是一場(chǎng)實(shí)打?qū)嵉乃懔Τ杀究刂茟?zhàn)。為了理清當(dāng)前AIAgent系統(tǒng)底層的真實(shí)運(yùn)行狀況,我們需要將目光投向全球知名通用AIAgent平臺(tái)TaskLit的技術(shù)戰(zhàn)略重構(gòu)過(guò)程,看看在多模型博弈的當(dāng)下,頂尖的系統(tǒng)底層究竟是如何處理數(shù)據(jù)的,它們的緩存機(jī)制多久更新一次,以及行業(yè)巨頭OpenAI和Anthropic在這方面展現(xiàn)出的截然不同的底層商業(yè)邏輯。



探討深?yuàn)W的緩存機(jī)制前,必須先認(rèn)清當(dāng)前AIAgent系統(tǒng)的運(yùn)作邏輯。知名播客CognitiveRevolution近期與TaskLit創(chuàng)始人兼CEOAndrewLee的一場(chǎng)深度對(duì)談,透露了一個(gè)行業(yè)真相:在過(guò)去的六個(gè)月時(shí)間里,這家公司基本上把每一行代碼都動(dòng)過(guò)了一遍,將整個(gè)產(chǎn)品的技術(shù)棧進(jìn)行了徹底重寫。







但隨著時(shí)間線往前回溯,系統(tǒng)就會(huì)開(kāi)始執(zhí)行冷酷的壓縮程序:首先去掉思考?jí)K,接著截?cái)嗌踔粮纱嗳サ艄ぞ哒{(diào)用的響應(yīng)和參數(shù),然后開(kāi)始折疊工具調(diào)用并壓縮助手消息。最后,直接使用基于LLM生成的摘要來(lái)代替那些古老的歷史記錄。

整個(gè)系統(tǒng)是按照時(shí)間段“分桶”來(lái)運(yùn)行的。越舊的時(shí)間桶,添加新內(nèi)容的速度越慢,一旦達(dá)到特定閾值,系統(tǒng)就會(huì)將其壓縮,以此盡量減少對(duì)緩存的破壞,避免動(dòng)到前綴。這種越往回保真度越低、并且分桶做緩存感知的方式,雖然偶爾會(huì)導(dǎo)致Agent在極長(zhǎng)周期任務(wù)中“忘事”,但卻是目前唯一能夠平衡性能與高昂運(yùn)行成本的正確方向。



理解了系統(tǒng)如何壓縮數(shù)據(jù),我們?cè)賮?lái)剖析一個(gè)極其硬核的指標(biāo):這些緩存數(shù)據(jù),到底多久會(huì)更新一次?

這需要分為應(yīng)用平臺(tái)端與底層模型供應(yīng)商端來(lái)看。在平臺(tái)應(yīng)用端(即決定送入LLM的壓縮歷史),緩存的更新是非常頻繁且持續(xù)的。只要有任何操作,它就會(huì)進(jìn)行增量更新,甚至在某一次長(zhǎng)對(duì)話的運(yùn)行中間,如果Token數(shù)量過(guò)多,它也會(huì)在那一輪里立刻開(kāi)始?jí)嚎s計(jì)算。值得注意的是,系統(tǒng)必須將這些壓縮后的摘要結(jié)果持久化保存下來(lái)。因?yàn)閷?duì)早期的歷史數(shù)據(jù)進(jìn)行基于LLM的壓縮計(jì)算,本身就會(huì)消耗大量的Token,如果每次啟動(dòng)觸發(fā)器都要重新壓縮一遍歷史,成本將極度高昂。



而在底層模型供應(yīng)商端,緩存的存活時(shí)間則呈現(xiàn)出巨大的路線分化。

以目前備受開(kāi)發(fā)者青睞的Anthropic(Claude模型提供商)為例,他們使用的是極其短暫的“五分鐘緩存”機(jī)制。這背后的商業(yè)假設(shè)是:用戶要么正處于一個(gè)活躍的會(huì)話中,要么是在一輪對(duì)話的中間,在這五分鐘內(nèi)緩存足以應(yīng)對(duì)。但現(xiàn)實(shí)職場(chǎng)中,很多企業(yè)的自動(dòng)化觸發(fā)器并不是每半小時(shí)跑一次,而是每隔幾小時(shí)甚至每天才跑一次。這就導(dǎo)致對(duì)于Anthropic而言,想要跨越長(zhǎng)時(shí)間去命中緩存基本不可能,其緩存命中通常僅僅局限于一次短促的運(yùn)行期間。不僅如此,Anthropic的緩存API設(shè)計(jì)得非常嚴(yán)格,在單次調(diào)用里最多只能緩存四個(gè)點(diǎn),開(kāi)發(fā)者需要編寫復(fù)雜的額外代碼才能讓這套機(jī)制跑起來(lái)。



相比之下,OpenAI則展示出了一種截然不同的緩存方案。OpenAI提供了一個(gè)非常簡(jiǎn)單的緩存API,系統(tǒng)會(huì)自動(dòng)緩存任何前綴,并且將其保留長(zhǎng)達(dá)24小時(shí)。這種長(zhǎng)時(shí)間的緩存保留,極大地降低了單次Agent跨周期運(yùn)行中的增量調(diào)用成本。對(duì)于平臺(tái)方來(lái)說(shuō),一旦他們耗費(fèi)心力做好了讓Anthropic正常運(yùn)行的工程架構(gòu),再去適配OpenAI的系統(tǒng)就會(huì)顯得相當(dāng)容易。

除了緩存機(jī)制,兩家巨頭在模型的“性格底色”上也展現(xiàn)出差異。據(jù)一線實(shí)測(cè)反饋,Anthropic的模型往往更有創(chuàng)造力、更具同理心,但也正因如此,在處理極端商業(yè)任務(wù)時(shí)可能表現(xiàn)出不夠果決的一面;而OpenAI的模型(如4.6和4.7版本)則被描述為更加“無(wú)情”和臨床化,為了達(dá)到目的甚至愿意在不違法的前提下采取一些邊緣手段。這種底層模型特質(zhì)的不同,也要求開(kāi)發(fā)者在構(gòu)建上層“機(jī)甲”(Harness)時(shí),必須針對(duì)性地設(shè)計(jì)完全不同的監(jiān)督和權(quán)限審批系統(tǒng)。



在這個(gè)多模型博弈的戰(zhàn)場(chǎng)上,昂貴的Token成本如同隱形的利刃,正在重塑整個(gè)軟件行業(yè)的商業(yè)模式。微觀層面上,算力的差價(jià)極其懸殊。Anthropic通過(guò)其直接面向客戶的Max賬戶,提供的有效Token成本性價(jià)比,比通過(guò)API向第三方開(kāi)發(fā)者供貨的價(jià)格高出大約五倍。這種巨大的價(jià)格鴻溝,逼迫著應(yīng)用層平臺(tái)必須走向中立,成為一個(gè)能夠接入所有提供商先進(jìn)模型的水平平臺(tái)。

當(dāng)?shù)讓幽P偷哪芰χ饾u趨同,且在各項(xiàng)任務(wù)上都表現(xiàn)出極高水準(zhǔn)時(shí),傳統(tǒng)的單一功能SaaS軟件將面臨巨大的生存危機(jī)。正如TaskLit團(tuán)隊(duì)所發(fā)現(xiàn)的那樣,用戶已經(jīng)能夠通過(guò)一句Prompt瞬間生成包含圖表、切換按鈕的完整數(shù)據(jù)分析UI,而不再需要去專門的儀表盤工具里操作。



甚至連Salesforce這樣龐大的記錄系統(tǒng)(SystemofRecord)也面臨挑戰(zhàn)。傳統(tǒng)的CRM系統(tǒng)之所以龐大,是因?yàn)樵谶^(guò)去,企業(yè)必須維護(hù)一套極其復(fù)雜的Schema來(lái)覆蓋所有可能的需求。但在充滿Agent的未來(lái),絕大多數(shù)人根本用不到那些冗余的功能,跨系統(tǒng)遷移數(shù)據(jù)變得輕而易舉。只要通用平臺(tái)能夠解決數(shù)據(jù)回滾和持久性保證的問(wèn)題,傳統(tǒng)記錄系統(tǒng)的護(hù)城河將被徹底瓦解。

聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
“SpaceX沒(méi)說(shuō),但所有線索都指向中國(guó)”

“SpaceX沒(méi)說(shuō),但所有線索都指向中國(guó)”

觀察者網(wǎng)
2026-06-12 09:23:04
高盛跑了2萬(wàn)場(chǎng)比賽數(shù)據(jù)后發(fā)現(xiàn):2026世界杯冠軍,大概率是它!

高盛跑了2萬(wàn)場(chǎng)比賽數(shù)據(jù)后發(fā)現(xiàn):2026世界杯冠軍,大概率是它!

虔青
2026-06-12 08:24:15
“好吃到不對(duì)勁!”消費(fèi)者因餅干太好吃而引發(fā)懷疑,配料表完全對(duì)不上!當(dāng)?shù)厥斜O(jiān)局介入

“好吃到不對(duì)勁!”消費(fèi)者因餅干太好吃而引發(fā)懷疑,配料表完全對(duì)不上!當(dāng)?shù)厥斜O(jiān)局介入

極目新聞
2026-06-12 06:54:56
三大運(yùn)營(yíng)商終于作“死”了自己

三大運(yùn)營(yíng)商終于作“死”了自己

細(xì)雨中的呼喊
2026-06-10 23:49:50
私生活混亂,從央視主持到勞改犯,如今靠直播打賞討生活

私生活混亂,從央視主持到勞改犯,如今靠直播打賞討生活

素衣讀史
2026-06-11 21:56:30
中央開(kāi)始嚴(yán)查,多地機(jī)關(guān)事業(yè)單位大整頓啟動(dòng),這幾類人受影響最大

中央開(kāi)始嚴(yán)查,多地機(jī)關(guān)事業(yè)單位大整頓啟動(dòng),這幾類人受影響最大

職場(chǎng)資深秘書
2026-06-12 14:47:02
53歲裴勇浚帶娃近照太震撼!零皺紋還是帥 韓網(wǎng)熱議:保養(yǎng)很好

53歲裴勇浚帶娃近照太震撼!零皺紋還是帥 韓網(wǎng)熱議:保養(yǎng)很好

ETtoday星光云
2026-06-12 13:06:08
SpaceX開(kāi)盤飆漲29%,美股太空股跳水,維珍銀河大跌超25%,科技七巨頭集體下跌

SpaceX開(kāi)盤飆漲29%,美股太空股跳水,維珍銀河大跌超25%,科技七巨頭集體下跌

21世紀(jì)經(jīng)濟(jì)報(bào)道
2026-06-12 22:10:31
SpaceX美國(guó)IPO首日開(kāi)盤報(bào)150美元

SpaceX美國(guó)IPO首日開(kāi)盤報(bào)150美元

界面新聞
2026-06-12 23:49:26
江蘇師大兩名外籍留學(xué)生插隊(duì)吐口水還動(dòng)手打人,市民追兩條街制服

江蘇師大兩名外籍留學(xué)生插隊(duì)吐口水還動(dòng)手打人,市民追兩條街制服

大廠編外實(shí)習(xí)生
2026-06-12 15:56:50
清華副教授蔣勁松去世,享年61歲

清華副教授蔣勁松去世,享年61歲

大風(fēng)新聞
2026-06-12 16:05:15
到底真的假的?網(wǎng)傳幾乎所有大學(xué)專業(yè)都在勸退…

到底真的假的?網(wǎng)傳幾乎所有大學(xué)專業(yè)都在勸退…

慧翔百科
2026-06-12 17:40:37
伊布:亞馬爾是值得花高票價(jià)去看的球員,他簡(jiǎn)直不可思議

伊布:亞馬爾是值得花高票價(jià)去看的球員,他簡(jiǎn)直不可思議

懂球帝
2026-06-12 19:49:16
美加墨世界杯第二場(chǎng)比賽就現(xiàn)空座,票價(jià)爭(zhēng)議浮出水面

美加墨世界杯第二場(chǎng)比賽就現(xiàn)空座,票價(jià)爭(zhēng)議浮出水面

澎湃新聞
2026-06-12 17:40:29
法拉利高管深夜開(kāi)懟:智界,你請(qǐng)的“首席設(shè)計(jì)師”到底是誰(shuí)?

法拉利高管深夜開(kāi)懟:智界,你請(qǐng)的“首席設(shè)計(jì)師”到底是誰(shuí)?

小南看車
2026-06-11 20:30:07
27公斤被盜黃金悉數(shù)追回,南京警方破獲國(guó)內(nèi)最大黃金盜竊案件

27公斤被盜黃金悉數(shù)追回,南京警方破獲國(guó)內(nèi)最大黃金盜竊案件

現(xiàn)代快報(bào)
2026-06-12 14:11:13
數(shù)據(jù)出爐,爆了!世界杯在中國(guó)收視率,讓所有 FIFA 領(lǐng)導(dǎo)層后怕

數(shù)據(jù)出爐,爆了!世界杯在中國(guó)收視率,讓所有 FIFA 領(lǐng)導(dǎo)層后怕

酷侃體壇
2026-06-12 18:57:16
于東來(lái)反思對(duì)員工太包容:?jiǎn)T工不值6000元工資,一旦離開(kāi)胖東來(lái)就完了

于東來(lái)反思對(duì)員工太包容:?jiǎn)T工不值6000元工資,一旦離開(kāi)胖東來(lái)就完了

頂級(jí)大佬思維
2026-06-12 12:42:48
曝美團(tuán)大裁員:連外賣基本盤都動(dòng)刀 網(wǎng)友:后悔當(dāng)初編壓榨算法嗎?

曝美團(tuán)大裁員:連外賣基本盤都動(dòng)刀 網(wǎng)友:后悔當(dāng)初編壓榨算法嗎?

火鍋局
2026-06-12 11:18:14
英國(guó)爆發(fā)大騷亂:四天燎原、全境失控!

英國(guó)爆發(fā)大騷亂:四天燎原、全境失控!

怪味歷史連連看
2026-06-12 14:30:03
2026-06-13 01:11:01
聚焦風(fēng)暴來(lái)襲
聚焦風(fēng)暴來(lái)襲
熱點(diǎn)風(fēng)暴來(lái)襲!精彩聚焦,帶你領(lǐng)略全球精彩
783文章數(shù) 106關(guān)注度
往期回顧 全部

科技要聞

剛剛,人類歷史上首位萬(wàn)億美元富豪誕生!

頭條要聞

美加墨世界杯第二場(chǎng)比賽就現(xiàn)空座 英媒:尷尬

頭條要聞

美加墨世界杯第二場(chǎng)比賽就現(xiàn)空座 英媒:尷尬

體育要聞

歐洲恐韓?肉德維德?

娛樂(lè)要聞

一天4個(gè)瓜,肖戰(zhàn)熱巴最意外

財(cái)經(jīng)要聞

萬(wàn)億美元順差背后,透露這些信號(hào)

汽車要聞

標(biāo)配激光雷達(dá)/雙動(dòng)力可選 昊鉑S600限時(shí)售17.99萬(wàn)起

態(tài)度原創(chuàng)

時(shí)尚
房產(chǎn)
游戲
親子
藝術(shù)

夏天別總穿一身白或一身黑!試試一半彩色、一半基礎(chǔ)色,高級(jí)亮眼

房產(chǎn)要聞

海南最賺錢行業(yè)曝光!最快4年半,??谌钯I三房!

因?yàn)槠ü蓻](méi)有貼吧老哥翹,劍星新女主被炎上?

親子要聞

給孩子報(bào)個(gè)幼兒園還要工資流水?難道這就是傳說(shuō)中的“因財(cái)施教”

藝術(shù)要聞

砸了640億,再賠160億!沙特“The Line”項(xiàng)目徹底涼了?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版