无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

Agent填高考志愿,能對抗幻覺與數據陷阱?

0
分享至


圖片由AI生成

如果說每年雙11是阿里對電商業務的年度大考,那么,每年6-7月的高考志愿報告,便是其Agent年度算力峰值大練兵。

去年,阿里巴巴旗下夸克團隊首次推出了“AI志愿報告”這一形式,最終數據顯示,用戶領取量將近1300萬份。而AI Agent生成單份報告需5–10分鐘,?內部估算,一份報告相當于發起上萬次搜索?,對算力需求極高。

當時,為應對高考季(6月中下旬)集中使用,夸克?將相關算力投入擴大100倍?,并調用阿里巴巴集團資源保障服務,不過未披露絕對資源量。

今年6月10日,阿里旗下千問上線國內首個全周期高考志愿填報Agent。今年新推出的高考Agent,基于千問高考志愿大模型和夸克8年高考數據經驗打造,具備“志愿報告”“志愿日歷”“志愿問答”三項能力。

如果按千問這一次AI志愿填報單份15-40頁A4紙的PDF的規模計算,對算力資源又是一次極大的消耗。不過,千問團隊未公開回應具體算力消耗規模。

“在高考志愿這件事情上,從阿里全集團的角度上來看,是不做任何限制的,我們也得到了阿里云到全集團所有算力的支撐,這個我們可以直接作承諾。”發布會結束后,千問事業部產品負責人鄭嗣壽說。

Agent填報機制與大模型應用本質不同

當前,全國各地高考戰爭已經結束,1290萬人(2026年全國高考報名人數),或者說1290萬個家庭的另一場戰爭已經開啟——“志愿填報”正在進入白熱化。

考生和家長們打開手機,各式各樣的“AI志愿助手”的信息已然鋪天蓋地。它們號稱能“一鍵生成完美方案”,能“精準預測錄取概率”。 然而,在這股看似繁榮的AI熱潮背后,大家內心始終會有擔憂:如果AI“一本正經地胡說八道”(產生幻覺),把前途算錯了怎么辦?

事實上,高考志愿填報,本質上是一個有限理性下的多屬性風險決策模型。它是一次性的、結構不清晰、無現成標準答案的重大人生決策,無法靠固定程序來解決,需要個人的判斷、創造力和大量信息處理。

考生能根據往年錄取位次、線差等數據,大致估算出被某校某專業錄取的概率,但信息并不完美,且存在“大小年”等波動。同時,填報需要權衡多個相互沖突的目標,比如,學校層次、專業實力與興趣、所在城市、就業前景、學費等。無法用一個指標最優來簡單決定,本質上是多目標決策。

現實中,考生和家長無法掌握所有信息,也不可能列出全部備選方案一一比較(“平行志愿”數量有限)。認知和時間都有限,所以人們通常尋找“足夠好”的滿意解,而非理論上的全局最優解。這個過程高度依賴啟發式判斷,并受情緒、社會比較等影響。

千問事業部AI算法負責人蔣冠軍對作者分析道,高考志愿填報決策極其復雜,涉及院校、專業、地域、就業等十個核心維度,理論組合空間高達上億種。面對這類復雜決策場景,缺乏領域知識的通用大模型不僅易出現事實錯誤,也缺少真實志愿填報中“如何平衡沖穩保”的專家經驗。

為此,基于千問基礎大模型,算法團隊提取了志愿規劃師的專家思考路徑,將其轉化為多輪對話與推理鏈訓練數據,通過強化學習建模與監督微調,讓模型形成“規劃、執行、反思”的推理機制。千問構建了覆蓋約40萬種組合空間的“AI考生”體系對模型進行反復壓測,確保模型對志愿填報的各種情況都能應對。

Agent機制跟傳統的大語言模型的應用有何差異?

鄭嗣壽解釋道,傳統大模型是用戶問一個問題,模型直接給你答案,在這個過程中,模型會去搜索最新的資料,參考資料做總結和回答,但Agent有天然的不同,它得到問題后有一個復雜的從思考、規劃、執行,再思考、再規劃、再執行的這樣一個反復循環過程。

在公共Agent部分,拿到問題,它先想的是,這個問題用戶背后的真實意圖是什么?有簡單的,有復雜的,也有連續的。Agent如果判斷是簡單的,會直接給答案,如果是復雜的,需要架幾個步驟,用幾個工具組合起來回答的,那就開始規劃各種工具。

此外,千問志愿的Agent組建了一個300多人的志愿填報專家團隊,把專家思考一個具體的志愿問題的經驗抽離出來數據讓Agent掌握,結合志愿填報場景做深度的優化和建設,這是高考志愿Agent有別于其他Agent的地方。

不過,在千問的邏輯里,Agent不能盲目自信。對于那些“超出規則”的敏感問題,比如,“家里沒背景別學金融”等帶有主觀色彩的經驗之談,千問采取了相對謹慎的策略。

“我們不會把這些抽象成通用規則讓模型去死記硬背。”鄭嗣壽對作者解釋道,因為今年和去年,很多企業和行業規則可能就變了。對于這種動態的、語境化極強的信息,不做通用回答,而是引導用戶去思考當下的具體情況。

千問是選擇讓AI扮演“輔助者”,在那些AI容易“翻車”的邊緣地帶,保留了人類的復核機制。

“歸根到底,今天整個AI的發展,其實還是AI機器學人,但是有一些地方機器做得比人好,但是肯定還有很多的地方,機器是不如人的。”蔣冠軍對作者表示。

在他看來,人類咨詢師能夠干的事情是“感同身受”,有人類的背景知識,這種同理心是天然“對齊”的,這是人比機器有優勢的地方。而當用戶去用Agent高考問題的時候,很多信息是沒有那么對齊的,所以Agent要采取追問機制,要讓用戶提交資料,盡量做對齊。

那些“非AI”敘事的笨功夫

“坦率講,我們在高考這件事情上沒有競品。”鄭嗣壽對作者說。

但有意思的是,千問在高考領域積累了8年的護城河,一項關鍵的工作,其實是屬于最“笨”的數據清洗工作。

據鄭嗣壽透露,千問內部有一個數據團隊全年做高考相關的數據,特別是基礎數據,特別是招錄數據的校驗、補全。

為此,他們還投資了一家公司專門做與高考數據有關的事情。

數據清洗有非常多的苦活、累活。在高考志愿填報場景,除了大家已經都知道的,全國各地高考分數線不是統一公布的,它散落在各個學校的官網、考試院,甚至是一本本紙質的“大本”里的情況,過程中,團隊也發現一些更難解決的問題。

比如說,有時候哪怕是標準本上的數據也可能有問題。如果把幾年數據累加在一起,就更難了,因為專業改名了,專業做調整,兩個專業合并了等,這些邊界條件非常復雜。

因此,整個志愿回答里面,千問Agent會著重溯源的機制。這種設計在技術上增加了巨大的復雜度。通常大模型生成回答是一氣呵成的,而千問則要求模型在生成每一個數據點時,都要“回頭看”,都要綁定一個可信的源頭。這相當于給AI套上了一副“腳鐐”,讓它每走一步都要“有據可查”。

“這是我們在用盡所有的力量去對抗大模型天然的漏洞。如果數據實在太多,或者不同來源有出入,我們的辦法是把不同的來源都列出來,展示給用戶。”鄭嗣壽表示。(本文首發于鈦媒體APP,作者|李程程,編輯|楊林)

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
墻倒眾人扶!被人民日報點名的李維剛,再次證明真誠才是必殺技

墻倒眾人扶!被人民日報點名的李維剛,再次證明真誠才是必殺技

舊事別提
2026-06-12 07:09:01
教科書上有哪些令你觸動的話?網友:所有的蝗蟲都會在秋風中死去

教科書上有哪些令你觸動的話?網友:所有的蝗蟲都會在秋風中死去

夜深愛雜談
2026-06-13 23:31:52
社保繳費變了!2026年6月1日起執行

社保繳費變了!2026年6月1日起執行

新浪財經
2026-06-13 00:11:54
“把兒子當外人整呢”,一根破爛眼鏡腿,讓人心疼高考男生處境

“把兒子當外人整呢”,一根破爛眼鏡腿,讓人心疼高考男生處境

澤澤先生
2026-06-13 21:43:34
徹查!信號強烈!中央升級反腐“天網”!

徹查!信號強烈!中央升級反腐“天網”!

職場資深秘書
2026-06-13 16:01:25
婆婆退休擺十桌唯獨漏我,我關機旅游七天,老公哭訴:媽出大事了

婆婆退休擺十桌唯獨漏我,我關機旅游七天,老公哭訴:媽出大事了

千秋文化
2026-05-31 22:19:38
世界杯預測:冷門震碎三觀的一天

世界杯預測:冷門震碎三觀的一天

生活新鮮市
2026-06-13 14:30:34
中東那個惡霸終于死了,不是被打死的,是被特朗普的談判拖死的!

中東那個惡霸終于死了,不是被打死的,是被特朗普的談判拖死的!

云舟史策
2026-06-14 07:48:18
日本隊慌了!中國隊首發五虎預測:雙塔鎖內線,三個海歸領銜

日本隊慌了!中國隊首發五虎預測:雙塔鎖內線,三個海歸領銜

童叔不飆車
2026-06-14 00:39:15
“清淡飲食”正在毀掉中老年人的血管!我國近20%的老年人患有肌少癥,不吃肉,血管反而越來越脆

“清淡飲食”正在毀掉中老年人的血管!我國近20%的老年人患有肌少癥,不吃肉,血管反而越來越脆

消化石醫生
2026-06-05 21:28:28
中國政府債券余額首次突破100萬億元

中國政府債券余額首次突破100萬億元

第一財經資訊
2026-06-13 13:16:38
天降橫財!男子入獄前,花120萬買股票,6年后出獄,變成4.9億!

天降橫財!男子入獄前,花120萬買股票,6年后出獄,變成4.9億!

川渝視覺
2026-05-13 22:09:30
她是足球報主任,和董路水火不容對罵5年,如今仍在足球媒體一線

她是足球報主任,和董路水火不容對罵5年,如今仍在足球媒體一線

青梅侃史啊
2026-06-13 16:36:45
世界杯最新積分榜:亞洲球隊強勢!再爆大冷南美1平1負歐洲2平1負

世界杯最新積分榜:亞洲球隊強勢!再爆大冷南美1平1負歐洲2平1負

求球不落諦
2026-06-14 08:36:13
王毅收到蒙古國外長的邀請,稀土外運日本一事,想聽聽中方想法?

王毅收到蒙古國外長的邀請,稀土外運日本一事,想聽聽中方想法?

共工之錨
2026-06-13 00:25:29
不要讓俄國進來! 1976年4月2日《人民日報》

不要讓俄國進來! 1976年4月2日《人民日報》

那些看得見的老照片
2026-05-21 20:30:03
李連杰一家三口拜見仁波切,64歲利智許久不見,顏值回春如昔日!

李連杰一家三口拜見仁波切,64歲利智許久不見,顏值回春如昔日!

娛樂團長
2026-06-02 15:09:12
拉杜卡努晉級女單決賽將戰維克奇

拉杜卡努晉級女單決賽將戰維克奇

體壇周報
2026-06-14 02:10:57
釘釘員工自曝作息大改,內部爭議曝光

釘釘員工自曝作息大改,內部爭議曝光

影視情報室
2026-06-14 00:39:31
我幫同事點了份32元的外賣,用紅包抵扣了12元,實際付款20元;隨后同事轉賬給我,當我看到金額后,當場傻眼!

我幫同事點了份32元的外賣,用紅包抵扣了12元,實際付款20元;隨后同事轉賬給我,當我看到金額后,當場傻眼!

勵職派
2026-06-13 19:22:04
2026-06-14 10:32:49
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經科技媒體
135025文章數 862259關注度
往期回顧 全部

科技要聞

Anthropic最強模型被禁,傳亞馬遜通風報信

頭條要聞

牛彈琴:一不小心美國又創造歷史 英格蘭隊被"一鍋端"

頭條要聞

牛彈琴:一不小心美國又創造歷史 英格蘭隊被"一鍋端"

體育要聞

美國4比1巴拉圭:這統治力真是美國隊?!

娛樂要聞

鄧超曬孫儷親手織的帽子,笑瘋全網!

財經要聞

金價跌至900元關口,大媽又來抄底了!

汽車要聞

深藍S07華為乾崑激光版增程車型上市 限時15.49萬元起

態度原創

時尚
家居
藝術
旅游
數碼

伊姐周六熱推:電視劇《南部檔案》;電視劇《意外調查組》......

家居要聞

空間微調 移形換境

藝術要聞

廣州再建一座“小蠻腰”?190米,頂著個球,2027年見!

旅游要聞

探秘西班牙旅游科技之旅;酒店業大內卷誰該負責 | 一周視頻速遞

數碼要聞

藍粉動漫風!映眾推出RTX 5070櫻花限定版:隱藏供電+磁吸背板

無障礙瀏覽 進入關懷版