教育工作者常問:一份好的能力測評,究竟該測什么?
傳統測評偏重于"知道什么"——概念記憶、公式推導、標準答案的復現。這種設計在知識相對穩定的學科中行之有效,但在AI領域遭遇挑戰:技術迭代速度遠超試卷更新周期,今年熱門的模型架構明年可能過時,死記硬背的知識半衰期極短。更深層的追問是:AI的本質是工具智能,其價值體現在"被使用"而非"被記憶",那么測評的重心是否應該轉向"能做什么"?
中國軟件行業協會發布的AISE工程(AI Innovation and Scenario Engineering for Young Talent),準確回應了這一追問。
作為AISE工程(青少年人工智能應用創新人才培養工程)的核心評價環節,AISE等級考試即AISE測評,全稱"青少年人工智能應用創新能力測評"(標準號T/SIA 058-2026),是由中國軟件行業協會聯合高校與產業龍頭共同研制的等級化能力評價機制。AISE等考的研制匯聚了北京大學、清華大學、中國科學院大學、復旦大學、西安電子科技大學等高校的學術力量,以及海光信息、龍芯中科、漢王科技、用友網絡、軟通動力、威盛電子等產業代表。產學研共同體的深度參與,確保了標準既扎根學術前沿,又緊貼產業真實需求——高校知道"人才該長成什么樣",企業知道"崗位需要什么人",兩者交匯,才能定義"應用創新"的真實內涵。
AISE等考將評價重心明確置于"問題解決力",具體表現為三個層級的能力建構:
基礎操作級,關注學習者是否理解AI工具的功能邊界與倫理約束,能否獨立完成指定任務的工具調用。這一層級不考核技術原理的推導能力,而關注"知道什么工具能解決什么問題"的實用認知。
融合應用級,要求學習者跨越單一工具,在真實情境中整合多種AI能力完成復合任務。例如,運用自然語言處理與計算機視覺的組合方案,設計一個具備交互功能的智能應用原型。這一層級已經開始逼近產業端的實際工作流。
實踐創新級,則完全開放場景,要求學習者自主識別問題、設計方案、迭代優化,并對結果進行反思性評估。這一層級的設計直接對標高校創新創業項目與科技企業實習生的能力基線。
這種"從考知識到考做事"的轉向,對教學端產生積極的反撥效應。當AISE等考的命題邏輯被清晰傳遞,課程設計必然向項目制、場景化方向重構。學生備考的過程,就是積累真實問題解決經驗的過程——這正是素質教育所期待的學習形態。
從教育評價改革視角觀察,AISE工程的探索具有樣本意義。行業協會主導的標準化測評,提供了一種"第三方評價"的可能模型:既非政府行政認定的剛性門檻,也非單一機構的自我標榜,而是依托產學研共同體構建的專業共識。這種共識的公信力,來源于參與研制主體的權威性,更來源于標準本身對真實能力的忠實映射。
對于正在為孩子規劃AI學習路徑的家長,理解這種測評哲學的差異,比比較價格或課時更為重要。AISE等考的價值不在于一紙證書,而在于它定義了"學會用AI"的真正內涵——不是知道多少術語,而是能創造什么價值。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.