![]()
江蘇省蘇州工業園區方洲小學學生在美術課上尋找校園美景。學校供圖
![]()
廣東省佛山市禪城區瀾石小學學生利用設計軟件設計龍舟。資料圖片
教育評價是教育的指揮棒,更是教育現代化的度量衡。20多年來,我國學生綜合素質評價雖歷經多輪探索,但始終面臨“評什么”內涵不清、“怎么評”科學性不足、“怎么用”導向虛化三大難題。當前,人工智能正以顛覆性力量重塑教育生態,這為學生綜合素質評價帶來了前所未有的戰略機遇——能否借助人工智能破解長期存在的客觀性與科學性困局?評價的內容、方法與功能應如何迭代?
自2022年起,在教育部“信息技術支撐學生綜合素質評價”試點工作中,以國家重點研發計劃項目“大規模學生跨學段成長跟蹤研究”為支撐,政產學研用協同創新,開展一場覆蓋全國百余萬中小學生的改革實踐,系統回應了學生綜合素質評價“評什么”“怎么評”“怎么用”三大戰略命題。
評什么:
“五育”并舉與核心素養的整體融通
目前,有兩個關鍵詞與學生綜合素質評價緊密相關。一個是以德智體美勞全面發展為目標的“五育”并舉,另一個是2016年頒布的《中國學生發展核心素養》提出的學生全面發展所應具備的“核心素養”。二者本應相互貫通、彼此支撐,共同構成育人目標與評價的邏輯基礎。然而在實踐中,兩者的邏輯關系與內涵結構始終未被厘清,存在口徑不一的問題。
此外,10余年前的理論框架已難以適應數智時代社會的飛速發展,尤其是在適應人工智能時代智能素養的新要求、中華優秀傳統文化育人價值轉化、拔尖創新人才診斷標準等關鍵領域,現有的理論體系存在概念內涵不清晰、結構不完整等多方面的不足,“評什么”的問題成為需要破解的重要命題。
在試點工作中,多領域專家協同研究,并在百萬級學生數據中多輪迭代檢驗,一套新時代背景下以《中國學生發展核心素養》為底座,系統納入德智體美勞全面發展理念的綜合素質評價理論體系逐漸成熟。它將綜合素質定義為學生在受教育過程中形成的跨越學科的價值觀、必備品格和關鍵能力,涵蓋“自主發展、文化修養、社會參與”三大維度,下設“身心健康”“自我管理”“問題解決與創新”“人文與審美”“語言與溝通”等10項指標及36個基本要點,并具象化為特定任務場景中的數據觀測點。如“語言與溝通”指標下的“閱讀理解”要點,可進一步細分為信息定位、文本理解、評價反思等子能力,學生在完成閱讀任務時的作答用時、作答表現、點擊與回看等行為軌跡,便成為一系列可觀測、可記錄的數據信號,共同表征其閱讀理解水平。這為回答今天綜合素質評價“評什么”提供了可參照、可操作的內容體系。
怎么評:
AI賦能構建分層分級智能化評價體系
按照區域的評價指標體系,提交各類證據檔案,在此基礎上由多主體結合日常表現,主觀評價確定評價等級,這是目前我國各地開展學生綜合素質評價的常規做法。這種評價方法存在客觀性和科學性兩方面的不足。客觀性方面,各地各校分層分級綜合素質評價平臺體系在記錄內容、數據處理、指標賦權等方面不一致,數據的真實性、主觀研判尺度,以及“客觀性”存在不足。科學性方面,綜合素質只有在特定場景和特定實踐中才能反映出來,日常觀察無法全面捕捉到,因缺少對復雜真實場景中的學生表現數據進行分析,以至于評價結果的科學性常常被質疑。
隨著人工智能技術不斷深度融入教育教學,人工智能已不再是綜合素質評價的支撐工具,而是推動其系統性變革的關鍵變量,促使學生綜合素質評價正在向智能化、數據驅動和應用導向的方向轉型升級。具體表現為:學生在完成學習任務場景中,通過與智能體、文字、圖片、多媒體資源的交互來探索嘗試解決復雜問題,在這一過程中,在保證倫理安全的基礎上,可以運用數據采集技術收集學生在問題解決過程中的多模態表現數據,并通過應用智能分析技術,結合專家智慧,實現對學生全方位素質發展水平的建模和評估,從而提升評價結果的真實性與客觀性,并促進技術支持下的及時反饋引導。如閱讀理解測評活動“舌尖上的絲綢之路”以絲綢之路上的飲食文化為情境,模擬真實的數字閱讀頁面,學生通過點擊、檢索、作答等方式與圖文內容持續交互,其交互過程中的行為數據被同步采集并經智能分析建模,生成個體與群體的診斷報告。黑龍江省某中學將這一測評與歷史教學相融合,教師根據診斷結果定位學生的薄弱環節、動態優化教學并提供個性化指導,使評價真正反哺教學、以評促學。
未來,有必要在全國各地已經建設的綜合素質檔案記錄系統的基礎上,依托人工智能技術,整合教育部“信息技術支撐學生綜合素質評價”試點中探索出的客觀診斷的表現性評價體系,實現過程記錄、主觀評價與表現性評價活動數據的有效映射融合,進而探索“識別”導向的學生綜合素質評價方案,建立國家、省、市、校分層分級、互聯互通,基于國產化技術底座自主可控的學生綜合素質評價能力體系。
怎么用:
充分發揮綜合素質評價的育人、診斷和識別作用
《教育強國建設規劃綱要(2024—2035年)》提出“完善拔尖創新人才發現和培養機制”,這迫切需要關注和強化學生綜合素質評價的“水平診斷”作用。只有科學、客觀的精準診斷,才能準確研判學生、學校和區域學生綜合素質發展的真實水平,實現既在宏觀上監測素質教育實施情況,又在微觀上掌握每名學生綜合素質具體發展情況。
在“信息技術支撐學生綜合素質評價”試點工作推進中,江蘇省蘇州工業園區方洲小學借助智能化的精準診斷,識別出馮同學藝術感知敏銳的特點,據此制定“美育小導師”個性化育人方案,持續記錄該學生的日常表現。3年下來,馮同學的10項核心指標躍升至班級均線以上。又如廣東省佛山市南海區將平臺上的表現性測評活動與區域已有的教育質量綠色指標監測體系相融合,把過程性、多維度的素質評價數據納入區域監測,有效提升了區域學生綜合素質評價的綜合化與客觀化水平。
人工智能賦能學生綜合素質評價,亟須加快推進構建定位清晰、功能協同的“三位一體”學生綜合素質評價體系:一是面向新時代育人目標,以評價作為指揮棒,引導人才培養方向,發揮育人作用;二是面向基礎教育質量監測,精準評價學校、區域學生全面發展水平,發揮診斷作用;三是面向拔尖創新人才培養和學生個性發展,識別學生發展特長和潛能,服務人才選拔和個人成長規劃,發揮識別作用。綜合素質評價三個作用同等重要,只有實現了三個作用,才能徹底打破“唯分數”的瓶頸,真正的素質教育才能得以實現。
數智時代,對于學生綜合素質評價“怎么用”的問題,我們認為答案應該是:發揮“育人”作用筑牢學生發展根基,發揮“診斷”作用客觀研判發展水平,發揮“識別”作用服務人才選拔和分流。
(作者系北京師范大學教育學部教授)
《中國教育報》2026年06月23日 第04版
作者:陳麗
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.