![]()
一道簡單題,豆包、千問、DeepSeek全翻車,我也是服氣了。
我承認有點無聊了,看到群友發了一道題,心想2026年了,這種低端腦筋急轉彎題目,應該難不住大模型了吧。
沒想到,這一試,國產模型幾乎全軍覆沒了。
這一道題是↓
小明拿了80元去買肉,買了20元肉,商家該找小明多少錢?
是不是很簡單?
結果——
豆包(iOS最新客戶端,專家),答錯 ?
![]()
千問(iOS最新客戶端,思考),答錯 ?
![]()
元寶(Hy3p 深度思考),答錯 ?
![]()
DeepSeek(V4 快速深思),答錯 ?
![]()
Minimax(M3 思考),答錯 ?
![]()
智譜(GLM5.1 思考),答錯 ?
![]()
Kimi(K2.6 快速),答對 ?
![]()
Gemini(3.5Flash 標準),答對 ?
![]()
ChatGPT(5.5 Instant),答對 ?
![]()
說明:豆包、千問客戶端具體模型版本不可見。
國產模型幾乎全軍覆沒,只有Kimi沒有被繞進去,而國外模型,GPT和Gemini也都成功繞坑。
當然,我相信,這個問題很快會像洗車問題一樣被修復。
不過,在大家越來越依賴大模型、遇事不決問AI的大背景下,一旦人類失去了最基本的邏輯判斷和推理能力,大模型又一番胡說八道,我們該怎么辦?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.