Anthropic陷性能爭議：Claude被指「明顯退化」

2026-04-14 18:10:09　來源: 鞭牛士

北京舉報

分享至

AIPress.com.cn報道

4月14日消息，人工智能公司Anthropic因其Claude模型性能變化，遭到開發(fā)者與重度用戶集中質(zhì)疑。多位用戶反映，模型在復雜任務中的表現(xiàn)出現(xiàn)下滑，包括指令執(zhí)行不穩(wěn)定、錯誤率上升以及在多步驟流程中表現(xiàn)不一致。

爭議的核心集中在Anthropic近期對模型推理機制的調(diào)整。據(jù)公司回應，其已將Claude默認“推理努力程度”下調(diào)至“中等”，以減少每次請求消耗的token數(shù)量，從而降低計算資源使用。但部分用戶認為，這一調(diào)整直接影響了模型的思考深度與任務完成質(zhì)量。

在技術層面，token消耗與算力成本直接相關。隨著用戶規(guī)模快速增長，外界普遍推測Anthropic可能面臨算力資源緊張問題，尤其是在其未如部分競爭對手那樣大規(guī)模鎖定數(shù)據(jù)中心資源的背景下。這一猜測進一步引發(fā)關于“是否因算力不足而主動降低模型性能”的討論。

Anthropic方面否認刻意降低模型能力，并表示相關調(diào)整源于用戶反饋——此前部分用戶認為Claude在任務中消耗token過多。公司還指出，其旗艦模型已引入“自適應思考”機制，可根據(jù)任務復雜度動態(tài)調(diào)整推理強度。不過，部分用戶質(zhì)疑公司未充分披露關鍵變更，影響了使用預期。

爭議對Anthropic的商業(yè)前景構成潛在影響。該公司近期估值已達3800億美元，并被視為可能推進IPO的重要候選者之一。在此階段，用戶信任與產(chǎn)品穩(wěn)定性對其增長路徑尤為關鍵。圍繞“透明度不足”的批評，尤其觸及其長期強調(diào)的品牌定位。

從行業(yè)角度看，類似問題并非個案。隨著AI應用需求快速增長，企業(yè)普遍面臨GPU成本上升、數(shù)據(jù)中心擴張受限等約束。在Agent需求加速的背景下，如何在性能、成本與規(guī)模之間取得平衡，成為各大模型廠商的共同挑戰(zhàn)。

值得注意的是，Anthropic近期還經(jīng)歷多次服務中斷，并在高峰時段實施更嚴格的使用限制。同時，公司宣布已訓練出新一代模型“Mythos”，其能力超越現(xiàn)有Opus系列，但因成本與安全等因素尚未全面發(fā)布。這也引發(fā)外界對其算力儲備與部署能力的進一步關注。

具體到產(chǎn)品層面，爭議主要集中在AI編程工具Claude Code。部分開發(fā)者指出，該工具在近期更新后，從“先廣泛讀取上下文再行動”的模式，轉(zhuǎn)向更直接的編輯方式，導致錯誤增加、上下文理解不足，并需要更多人工干預。有觀點認為，這種變化與推理深度下降存在關聯(lián)。

Anthropic表示，未來將測試為企業(yè)用戶默認提供更高推理強度設置，以提升復雜任務表現(xiàn)，即便這意味著更高的token消耗與響應延遲。同時，公司強調(diào)并未削弱模型核心推理能力，部分差異源于展示機制調(diào)整，例如不再向用戶完整呈現(xiàn)推理過程。（AI普瑞斯編譯）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.