AIPress.com.cn報道
4月14日消息,人工智能公司Anthropic因其Claude模型性能變化,遭到開發(fā)者與重度用戶集中質(zhì)疑。多位用戶反映,模型在復雜任務中的表現(xiàn)出現(xiàn)下滑,包括指令執(zhí)行不穩(wěn)定、錯誤率上升以及在多步驟流程中表現(xiàn)不一致。
爭議的核心集中在Anthropic近期對模型推理機制的調(diào)整。據(jù)公司回應,其已將Claude默認“推理努力程度”下調(diào)至“中等”,以減少每次請求消耗的token數(shù)量,從而降低計算資源使用。但部分用戶認為,這一調(diào)整直接影響了模型的思考深度與任務完成質(zhì)量。
在技術層面,token消耗與算力成本直接相關。隨著用戶規(guī)模快速增長,外界普遍推測Anthropic可能面臨算力資源緊張問題,尤其是在其未如部分競爭對手那樣大規(guī)模鎖定數(shù)據(jù)中心資源的背景下。這一猜測進一步引發(fā)關于“是否因算力不足而主動降低模型性能”的討論。
Anthropic方面否認刻意降低模型能力,并表示相關調(diào)整源于用戶反饋——此前部分用戶認為Claude在任務中消耗token過多。公司還指出,其旗艦模型已引入“自適應思考”機制,可根據(jù)任務復雜度動態(tài)調(diào)整推理強度。不過,部分用戶質(zhì)疑公司未充分披露關鍵變更,影響了使用預期。
爭議對Anthropic的商業(yè)前景構成潛在影響。該公司近期估值已達3800億美元,并被視為可能推進IPO的重要候選者之一。在此階段,用戶信任與產(chǎn)品穩(wěn)定性對其增長路徑尤為關鍵。圍繞“透明度不足”的批評,尤其觸及其長期強調(diào)的品牌定位。
從行業(yè)角度看,類似問題并非個案。隨著AI應用需求快速增長,企業(yè)普遍面臨GPU成本上升、數(shù)據(jù)中心擴張受限等約束。在Agent需求加速的背景下,如何在性能、成本與規(guī)模之間取得平衡,成為各大模型廠商的共同挑戰(zhàn)。
值得注意的是,Anthropic近期還經(jīng)歷多次服務中斷,并在高峰時段實施更嚴格的使用限制。同時,公司宣布已訓練出新一代模型“Mythos”,其能力超越現(xiàn)有Opus系列,但因成本與安全等因素尚未全面發(fā)布。這也引發(fā)外界對其算力儲備與部署能力的進一步關注。
具體到產(chǎn)品層面,爭議主要集中在AI編程工具Claude Code。部分開發(fā)者指出,該工具在近期更新后,從“先廣泛讀取上下文再行動”的模式,轉(zhuǎn)向更直接的編輯方式,導致錯誤增加、上下文理解不足,并需要更多人工干預。有觀點認為,這種變化與推理深度下降存在關聯(lián)。
Anthropic表示,未來將測試為企業(yè)用戶默認提供更高推理強度設置,以提升復雜任務表現(xiàn),即便這意味著更高的token消耗與響應延遲。同時,公司強調(diào)并未削弱模型核心推理能力,部分差異源于展示機制調(diào)整,例如不再向用戶完整呈現(xiàn)推理過程。(AI普瑞斯編譯)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.