![]()
圖片由AI生成
如果說每年雙11是阿里對電商業務的年度大考,那么,每年6-7月的高考志愿報告,便是其Agent年度算力峰值大練兵。
去年,阿里巴巴旗下夸克團隊首次推出了“AI志愿報告”這一形式,最終數據顯示,用戶領取量將近1300萬份。而AI Agent生成單份報告需5–10分鐘,?內部估算,一份報告相當于發起上萬次搜索?,對算力需求極高。
當時,為應對高考季(6月中下旬)集中使用,夸克?將相關算力投入擴大100倍?,并調用阿里巴巴集團資源保障服務,不過未披露絕對資源量。
今年6月10日,阿里旗下千問上線國內首個全周期高考志愿填報Agent。今年新推出的高考Agent,基于千問高考志愿大模型和夸克8年高考數據經驗打造,具備“志愿報告”“志愿日歷”“志愿問答”三項能力。
如果按千問這一次AI志愿填報單份15-40頁A4紙的PDF的規模計算,對算力資源又是一次極大的消耗。不過,千問團隊未公開回應具體算力消耗規模。
“在高考志愿這件事情上,從阿里全集團的角度上來看,是不做任何限制的,我們也得到了阿里云到全集團所有算力的支撐,這個我們可以直接作承諾。”發布會結束后,千問事業部產品負責人鄭嗣壽說。
Agent填報機制與大模型應用本質不同
當前,全國各地高考戰爭已經結束,1290萬人(2026年全國高考報名人數),或者說1290萬個家庭的另一場戰爭已經開啟——“志愿填報”正在進入白熱化。
考生和家長們打開手機,各式各樣的“AI志愿助手”的信息已然鋪天蓋地。它們號稱能“一鍵生成完美方案”,能“精準預測錄取概率”。 然而,在這股看似繁榮的AI熱潮背后,大家內心始終會有擔憂:如果AI“一本正經地胡說八道”(產生幻覺),把前途算錯了怎么辦?
事實上,高考志愿填報,本質上是一個有限理性下的多屬性風險決策模型。它是一次性的、結構不清晰、無現成標準答案的重大人生決策,無法靠固定程序來解決,需要個人的判斷、創造力和大量信息處理。
考生能根據往年錄取位次、線差等數據,大致估算出被某校某專業錄取的概率,但信息并不完美,且存在“大小年”等波動。同時,填報需要權衡多個相互沖突的目標,比如,學校層次、專業實力與興趣、所在城市、就業前景、學費等。無法用一個指標最優來簡單決定,本質上是多目標決策。
現實中,考生和家長無法掌握所有信息,也不可能列出全部備選方案一一比較(“平行志愿”數量有限)。認知和時間都有限,所以人們通常尋找“足夠好”的滿意解,而非理論上的全局最優解。這個過程高度依賴啟發式判斷,并受情緒、社會比較等影響。
千問事業部AI算法負責人蔣冠軍對作者分析道,高考志愿填報決策極其復雜,涉及院校、專業、地域、就業等十個核心維度,理論組合空間高達上億種。面對這類復雜決策場景,缺乏領域知識的通用大模型不僅易出現事實錯誤,也缺少真實志愿填報中“如何平衡沖穩保”的專家經驗。
為此,基于千問基礎大模型,算法團隊提取了志愿規劃師的專家思考路徑,將其轉化為多輪對話與推理鏈訓練數據,通過強化學習建模與監督微調,讓模型形成“規劃、執行、反思”的推理機制。千問構建了覆蓋約40萬種組合空間的“AI考生”體系對模型進行反復壓測,確保模型對志愿填報的各種情況都能應對。
Agent機制跟傳統的大語言模型的應用有何差異?
鄭嗣壽解釋道,傳統大模型是用戶問一個問題,模型直接給你答案,在這個過程中,模型會去搜索最新的資料,參考資料做總結和回答,但Agent有天然的不同,它得到問題后有一個復雜的從思考、規劃、執行,再思考、再規劃、再執行的這樣一個反復循環過程。
在公共Agent部分,拿到問題,它先想的是,這個問題用戶背后的真實意圖是什么?有簡單的,有復雜的,也有連續的。Agent如果判斷是簡單的,會直接給答案,如果是復雜的,需要架幾個步驟,用幾個工具組合起來回答的,那就開始規劃各種工具。
此外,千問志愿的Agent組建了一個300多人的志愿填報專家團隊,把專家思考一個具體的志愿問題的經驗抽離出來數據讓Agent掌握,結合志愿填報場景做深度的優化和建設,這是高考志愿Agent有別于其他Agent的地方。
不過,在千問的邏輯里,Agent不能盲目自信。對于那些“超出規則”的敏感問題,比如,“家里沒背景別學金融”等帶有主觀色彩的經驗之談,千問采取了相對謹慎的策略。
“我們不會把這些抽象成通用規則讓模型去死記硬背。”鄭嗣壽對作者解釋道,因為今年和去年,很多企業和行業規則可能就變了。對于這種動態的、語境化極強的信息,不做通用回答,而是引導用戶去思考當下的具體情況。
千問是選擇讓AI扮演“輔助者”,在那些AI容易“翻車”的邊緣地帶,保留了人類的復核機制。
“歸根到底,今天整個AI的發展,其實還是AI機器學人,但是有一些地方機器做得比人好,但是肯定還有很多的地方,機器是不如人的。”蔣冠軍對作者表示。
在他看來,人類咨詢師能夠干的事情是“感同身受”,有人類的背景知識,這種同理心是天然“對齊”的,這是人比機器有優勢的地方。而當用戶去用Agent高考問題的時候,很多信息是沒有那么對齊的,所以Agent要采取追問機制,要讓用戶提交資料,盡量做對齊。
那些“非AI”敘事的笨功夫
“坦率講,我們在高考這件事情上沒有競品。”鄭嗣壽對作者說。
但有意思的是,千問在高考領域積累了8年的護城河,一項關鍵的工作,其實是屬于最“笨”的數據清洗工作。
據鄭嗣壽透露,千問內部有一個數據團隊全年做高考相關的數據,特別是基礎數據,特別是招錄數據的校驗、補全。
為此,他們還投資了一家公司專門做與高考數據有關的事情。
數據清洗有非常多的苦活、累活。在高考志愿填報場景,除了大家已經都知道的,全國各地高考分數線不是統一公布的,它散落在各個學校的官網、考試院,甚至是一本本紙質的“大本”里的情況,過程中,團隊也發現一些更難解決的問題。
比如說,有時候哪怕是標準本上的數據也可能有問題。如果把幾年數據累加在一起,就更難了,因為專業改名了,專業做調整,兩個專業合并了等,這些邊界條件非常復雜。
因此,整個志愿回答里面,千問Agent會著重溯源的機制。這種設計在技術上增加了巨大的復雜度。通常大模型生成回答是一氣呵成的,而千問則要求模型在生成每一個數據點時,都要“回頭看”,都要綁定一個可信的源頭。這相當于給AI套上了一副“腳鐐”,讓它每走一步都要“有據可查”。
“這是我們在用盡所有的力量去對抗大模型天然的漏洞。如果數據實在太多,或者不同來源有出入,我們的辦法是把不同的來源都列出來,展示給用戶。”鄭嗣壽表示。(本文首發于鈦媒體APP,作者|李程程,編輯|楊林)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.