金磊 發自 凹非寺
量子位 | 公眾號 QbitAI
今年高考數學,又把不少人做沉默了。
從考場出來后,很多考生的第一反應不是有幾道題不會,而是怎么每一道都這么能算。
于是乎,計算量大、題型新、區分度高,成了這張卷子被討論最多的幾個關鍵詞。
![]()
更有意思的是,另一個問題也被順手推上了臺面:
如果把這張卷子交給AI,它到底會不會做?
我們平時會看到有些網友吐槽,AI在計算一些簡單問題時會出錯,怎么能答對從沒見過的新高考題?
但這里有一個容易被忽略的細節,很多吐槽針對的是默認的快速模式,適合日常問答;而復雜數學、邏輯推理、編程分析這類任務,真正的打開方式應該是讓模型深度思考。
![]()
所以這次,我們把問題拆開看。
同一張高考數學卷,分別交給豆包思考模式和ChatGPT(GPT-5.5),按照教育場景常用的圖像輸入進行測試,結果會怎樣?
先說結論。
豆包思考模式和ChatGPT都能給出相當穩定的解題表現。尤其是在需要多步推理、函數分析、概率建模、解析幾何計算的題目上,AI已經可以按照人類解題路徑一步步推進了。
AI們的答案匯總如下:
![]()
(根據目前網傳的試題和答案驗證,豆包和ChatGPT在選擇題和填空題上全都回答準確。解答題部分還需要專業老師評估過程分數。)
那么AI做高考數學,強在哪里?又容易卡在哪里?
我們繼續往下看詳細實測過程。
單選題:
前幾道選擇題看起來很基礎,但并不等于機械計算。
比如第1題,中位數;第2題,平面向量線性表示;第3題,三角函數值與集合交集;第4題,導數與切線方程。
這些題人類考生做起來不算特別難,但對AI來說,其實會同時考幾個能力:
讀懂題干,識別考點,調用公式,完成計算,還要避免在最后一步把選項看錯。
到了后面,題目明顯開始拉開梯度。
比如拋物線焦點距離、函數最大值反推參數、古塔排列中的等差數列分組、空間點集里的數學期望。
接下來,我們分別給豆包思考模式和ChatGPT,每個題單獨截圖輸入,并附上簡單一句“解答這道題”。
第一題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
這道題比較簡單,豆包和ChatGPT從思路和答案上來看,沒有任何問題。
第二題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
兩者都抓住了“向量a、b不共線”這一關鍵條件,轉化為對應系數相等。整體看,這類題對當前頭部AI難度不高。
第三題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
這題容易錯在特殊角的符號上,豆包和ChatGPT都逐項計算后再取交集,思路比較規范。差異主要在表述詳略,結論一致。
第四題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
兩者都準確完成了求導、代入斜率、寫切線方程三步,沒有把函數值和導數值混淆。作為導數基礎題,表現穩定。
第五題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
這題開始要求先由點確定拋物線參數,再轉為焦點坐標求距離。豆包和ChatGPT都能把計算鏈條走完,說明基礎解析幾何能力比較扎實。
第六題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
相比前幾題,這道題需要把“最大值為1”轉化成參數約束。兩者都能給出完整推導,但這類題也更能暴露中間計算是否嚴謹。
第七題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
這題的難點在于先把“一百零八塔”的情境轉成數列條件。豆包和ChatGPT都能識別等差結構并構造分組,說明對中文長題干的理解較穩。
第八題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
關鍵點在于樣本空間刪去了P(1,1,1),不能直接套“對稱所以期望為0”。兩者都抓住了刪點帶來的擾動,這是本輪測試里比較有代表性的推理點。
多選題:
第九題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
多選題不能只算一個結論,必須逐項驗證。豆包和ChatGPT都對共軛、模長、平方和復數除法分別判斷,整體比較細。
第十題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
空間幾何多選題對直覺判斷并不友好,兩者都傾向于通過坐標或幾何約束逐項排除。ChatGPT的排除過程更直接,豆包的推導更展開。
第十一題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
這一題對圓與直線交點條件的拆解要求較高,兩者在部分選項判斷上出現了差異。這里也提醒我們,多選綜合題仍需要結合標準答案做人工核驗。
填空題:
第十二題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
填空題沒有選項兜底,兩者都能把雙曲線化為標準形式,并通過a、b、c關系求離心率。結論形式雖可等價變化,但核心計算一致。
第十三題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
這題同時考奇偶性和單調性,需要先鎖定參數范圍再計算函數值。豆包和ChatGPT都能沿著性質推導,思路比較完整。
第十四題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
數列構造題的難點在于從條件中抽出可用規律,而不是直接代公式。兩者都嘗試先求連續三項和,再分析等比關系,推理鏈條較長但方向清楚。
解答題:
第十五題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
立體幾何證明題里,坐標法能顯著降低想象難度。兩者都選擇建立坐標系推進證明和距離計算,適合展示AI處理幾何綜合題的過程能力。
第十六題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
這題把三角形邊角關系和后續幾何條件連在一起。兩者都先用余弦定理處理基礎量,再進入坐標化求解,整體策略比較穩。
第十七題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
概率題最容易錯在“停止規則”,尤其是最后一次投籃既可能投中,也可能一直未中。兩者都能把邊界情況納入分布列,處理得比較細。
第十八題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
橢圓題對計算量和幾何關系都有要求,模型需要在方程、交點、面積條件之間來回切換。兩者都給出了長鏈條推導,但壓軸題仍建議人工復核關鍵代數步驟。
第十九題:
![]()
豆包和ChatGPT答案如下:
![]()
![]()
最后一題更接近函數邏輯證明,重點不只是算出結果,還要把包含關系、單調性和條件推演講清楚。AI能給出完整證明框架,但嚴謹性仍需要逐步檢查。
這次高考數學實測,真正說明了什么?
把這輪實測放在一起看,一個變化很明顯:
AI做高考數學的討論,已經從會不會算轉向能不能穩定讀題、拆條件、驗步驟。
選擇題里,它要避免粗心;多選題里,它要逐項判斷;填空題里,沒有選項提示,最終答案必須自己算出來;到了大題,模型還要把證明過程講清楚。這些能力疊在一起,才更接近真實的數學推理。
這也解釋了為什么同一個產品里,快速模式和思考模式會給人完全不同的感受。前者適合日常問答,追求快;后者面對復雜數學題時,會花更多時間展開推理、檢查條件、組織步驟。拿快速模式去代表一個AI產品的復雜推理上限,結論很容易失真。
當然,AI現在還不應該被當成永遠正確的答案機。尤其是多選綜合題、壓軸解析幾何、函數證明這類長鏈條任務,任何一步計算或條件理解出錯,后面都可能一路錯下去。
更穩妥的用法,是把它當成一個高質量解題陪練:先幫你拆題,再幫你核對思路,最后提醒哪些步驟最容易出問題。
從這個意義上說,高考數學實測的價值不只是看豆包和ChatGPT誰多做對一道題。它更像一次公開壓力測試:
當題目足夠標準、評分足夠嚴苛、推理鏈條足夠長,AI到底能不能在中文數學場景里穩定工作。至少從這輪表現看,頭部AI已經具備相當強的高考數學解題能力;但越到復雜題,越需要人和AI一起做校驗。
一句話,AI已經能做很多高考數學題;接下來更重要的問題,是我們怎么把它用成學習工具,而不是簡單的抄答案工具。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.