從算力小時(shí)到token,亞馬遜要按模型實(shí)際處理量付費(fèi)
token是大模型行業(yè)最常見的計(jì)費(fèi)單位。對普通客戶來說,按token收費(fèi)意味著每一次提示詞、每一次輸出、每一個(gè)自動(dòng)化流程都會更直接地反映在賬單上。
亞馬遜此前與Anthropic的安排已經(jīng)與使用量掛鉤,只是掛鉤的是計(jì)算小時(shí),而不是token。兩者差別在于,計(jì)算小時(shí)更接近底層算力占用,token更接近模型實(shí)際處理的信息量。對于把Claude接進(jìn)多個(gè)自有產(chǎn)品的亞馬遜來說,這種變化意味著模型調(diào)用成本將更直接地隨業(yè)務(wù)使用量增長。
The Information稱,亞馬遜已經(jīng)在評估是否可以通過使用其他模型降低成本,包括OpenAI的模型和亞馬遜自家的Nova模型。報(bào)道沒有說亞馬遜已經(jīng)替換Claude;更準(zhǔn)確的變化是,在Anthropic議價(jià)能力變強(qiáng)之后,亞馬遜開始重新比較不同模型的成本和可控性。
亞馬遜既是客戶,也是投資方和銷售渠道
這件事敏感,是因?yàn)閬嗰R遜與Anthropic的關(guān)系并不是普通采購關(guān)系。
2023年,亞馬遜宣布向Anthropic投資40億美元,換取后者把AWS作為主要云服務(wù)提供方,并使用亞馬遜自研AI芯片Trainium和Inferentia。AWS也通過Bedrock向企業(yè)客戶銷售Claude,幫助Anthropic獲得大量企業(yè)分發(fā)渠道。
The Information報(bào)道稱,亞馬遜把Anthropic模型用于多個(gè)面向企業(yè)和消費(fèi)者的AI產(chǎn)品,包括購物助手Alexa for Shopping、編程工具Kiro和工作助手Quick。Claude因此不只是AWS貨架上的一個(gè)外部模型,它已經(jīng)嵌入亞馬遜自己的產(chǎn)品線。
這正是亞馬遜內(nèi)部擔(dān)憂的來源。報(bào)道稱,AWS高管擔(dān)心太多亞馬遜產(chǎn)品依賴Anthropic,而不是亞馬遜自家的Nova模型,外界可能會認(rèn)為這些產(chǎn)品只是套在Anthropic技術(shù)上的"殼"。如果Anthropic模型未來更貴,亞馬遜不僅要應(yīng)對成本上升,還要回答產(chǎn)品自主性問題。
OpenAI和Nova,都是亞馬遜的談判籌碼
報(bào)道還提到,亞馬遜與OpenAI的關(guān)系正在走近。今年早些時(shí)候,亞馬遜同意向OpenAI投資最高500億美元;作為交易的一部分,OpenAI將使用AWS基礎(chǔ)設(shè)施,AWS也會銷售OpenAI模型,亞馬遜還獲得在自有產(chǎn)品中使用OpenAI技術(shù)的權(quán)限。亞馬遜同時(shí)還同意將對Anthropic的總投資承諾提高至最高250億美元。
這些安排說明,亞馬遜并沒有把自己鎖死在單一模型供應(yīng)商上。它既押注Anthropic,也押注OpenAI,同時(shí)繼續(xù)發(fā)展Nova。對云平臺來說,這是一種典型的對沖:客戶想要最強(qiáng)模型,平臺想要最多選擇,內(nèi)部產(chǎn)品團(tuán)隊(duì)則希望成本、速度和可控性都能談得下來。
AWS負(fù)責(zé)企業(yè)智能體AI的副總裁Jiggar Thakkar對The Information表示,亞馬遜的工作助手Quick會讓客戶選擇任務(wù)所需的模型類型,再由亞馬遜從Bedrock上的多個(gè)模型中挑選合適模型;成本和速度都會被納入考慮。
這句話背后是一個(gè)更大的趨勢:AI產(chǎn)品不再默認(rèn)把所有任務(wù)都交給最貴、最強(qiáng)的模型。平臺正在把模型路由、成本控制和任務(wù)分層內(nèi)置到產(chǎn)品架構(gòu)中。
Anthropic議價(jià)能力變強(qiáng),但依賴亞馬遜的矛盾還在
Anthropic現(xiàn)在有能力和大客戶重新談價(jià)格,說明Claude在企業(yè)市場已經(jīng)形成足夠強(qiáng)的需求。許多客戶今年也經(jīng)歷了明顯的費(fèi)用上漲:Anthropic把部分原本按席位或封頂套餐計(jì)費(fèi)的服務(wù)轉(zhuǎn)向按量計(jì)費(fèi)后,一些客戶選擇繼續(xù)消化成本,另一些客戶開始轉(zhuǎn)向開源模型或成本更低的替代方案。
但Anthropic仍然深度依賴亞馬遜。AWS提供訓(xùn)練和運(yùn)行模型所需的算力,也提供企業(yè)客戶入口。The Information此前報(bào)道稱,當(dāng)AWS銷售Anthropic模型時(shí),Anthropic不僅要為使用AWS云服務(wù)付費(fèi),還要把扣除云成本后的約一半毛利潤分給亞馬遜。
這種相互依賴天然會制造摩擦。報(bào)道提到,Anthropic曾對Bedrock工程團(tuán)隊(duì)未能及時(shí)集成Anthropic新功能感到不滿;亞馬遜工程師則無法隨意定制Anthropic模型。另有知情人士稱,出于對未來價(jià)格上漲的擔(dān)心,部分亞馬遜工程師已經(jīng)主動(dòng)嘗試蒸餾Anthropic模型。按報(bào)道口徑,這更像是成本壓力下的內(nèi)部技術(shù)探索,而不是亞馬遜已經(jīng)形成"復(fù)制Claude"的正式路線。
這場分歧的核心不是雙方關(guān)系破裂,而是大模型商業(yè)化進(jìn)入了下一階段:當(dāng)模型開始大規(guī)模嵌入客戶產(chǎn)品,定價(jià)方式本身就會變成權(quán)力關(guān)系。模型公司希望按真實(shí)使用量收費(fèi),平臺客戶希望控制賬單并保留替代方案。而云廠商則同時(shí)扮演著投資方、供應(yīng)商、銷售渠道和競爭者四重角色。(易句)
(本文由AI翻譯,網(wǎng)易編輯負(fù)責(zé)校對)