網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

15個(gè)前沿大模型，100個(gè)職業(yè)場(chǎng)景：誰(shuí)才是最強(qiáng)AI打工人？

2026-04-15 16:34:11　來(lái)源: AI科技評(píng)論

廣東舉報(bào)

分享至

通義千問(wèn) × 港中文聯(lián)合發(fā)布OccuBench，首次用"語(yǔ)言世界模型"系統(tǒng)評(píng)測(cè)AI Agent的真實(shí)職業(yè)能力。

GPT-5.2能寫(xiě)代碼、能刷網(wǎng)頁(yè)、能聊天。但如果讓它去做急診分診呢？或者管核電站報(bào)警、處理海關(guān)報(bào)關(guān)呢？

答案是不知道，因?yàn)楦緵](méi)法測(cè)。

WebArena測(cè)網(wǎng)頁(yè)操作，SWE-bench測(cè)代碼修復(fù)，OSWorld測(cè)桌面任務(wù)。這些基準(zhǔn)加在一起，覆蓋的也不過(guò)是瀏覽器、代碼編輯器、操作系統(tǒng)這幾個(gè)領(lǐng)域。而真實(shí)世界中絕大多數(shù)高價(jià)值職業(yè)工作，壓根沒(méi)有可以用來(lái)測(cè)試的公開(kāi)環(huán)境：急診室沒(méi)有開(kāi)源API，核電站不會(huì)給你搭沙箱，海關(guān)系統(tǒng)更不可能開(kāi)放權(quán)限。

核心思路：讓大模型來(lái)模擬環(huán)境

通義千問(wèn)團(tuán)隊(duì)（Qwen Team）和香港中文大學(xué)的研究者想了個(gè)辦法：既然沒(méi)有真實(shí)環(huán)境，那就讓大模型模擬一個(gè)。

給LLM一份環(huán)境配置（任務(wù)場(chǎng)景描述、工具定義和初始狀態(tài)），它就能變成一個(gè)有狀態(tài)的、可交互的模擬環(huán)境。研究者將其稱為語(yǔ)言世界模型（Language World Model, LWM）。

舉個(gè)例子：你告訴LLM "你現(xiàn)在是一個(gè)急診科信息系統(tǒng)，有3個(gè)檢查室、5個(gè)候診患者，支持分診、轉(zhuǎn)運(yùn)、下醫(yī)囑等操作"，它就真的能扮演這個(gè)系統(tǒng), 根據(jù)Agent的每一步操作，維護(hù)內(nèi)部狀態(tài)并返回合理的響應(yīng)。

通過(guò)這樣做，環(huán)境的構(gòu)建從工程問(wèn)題變成了配置問(wèn)題，不用寫(xiě)后端代碼，不用搭基礎(chǔ)設(shè)施，只要LLM能理解這個(gè)領(lǐng)域就行。

基于這個(gè)思路，研究者構(gòu)建了OccuBench，一個(gè)覆蓋100個(gè)職業(yè)場(chǎng)景、10大行業(yè)、65個(gè)細(xì)分領(lǐng)域、382個(gè)評(píng)測(cè)實(shí)例的Agent評(píng)測(cè)基準(zhǔn)。Bench當(dāng)中的任務(wù)平均包含5.5個(gè)專業(yè)工具，需要Agent調(diào)用約16.2次工具才能完成。

不只是模擬，還能注入故障

真實(shí)生產(chǎn)環(huán)境里，API會(huì)超時(shí)，數(shù)據(jù)會(huì)截?cái)啵?wù)會(huì)降級(jí)，這些都是常態(tài)。但現(xiàn)有的Agent評(píng)測(cè)基本都是在理想環(huán)境下跑的。

基于LWM的agent 評(píng)測(cè)有一個(gè)獨(dú)特優(yōu)勢(shì)：環(huán)境行為完全由提示詞控制。只需要修改幾句提示詞，就能精確注入各種故障：

所有故障都是暫態(tài)的，重試就能恢復(fù)。關(guān)鍵在于Agent能不能意識(shí)到出了問(wèn)題，然后主動(dòng)重試。這考驗(yàn)了agent的自主性，影響了agent能否在沒(méi)有人工干預(yù)的情況下獨(dú)立完成長(zhǎng)程任務(wù)。

15個(gè)模型綜合評(píng)價(jià)，幾個(gè)值得注意的結(jié)果

研究者評(píng)測(cè)了15個(gè)前沿模型，覆蓋8大模型家族：GPT-5.2、Claude全系列（4 / 4.5 / 4.6，含Opus和Sonnet）、Gemini 3.1 Pro / Flash-Lite、DeepSeek V3.2、Kimi K2.5、MiniMax M2.7、GLM-5、Qwen 3.5 Plus / Flash。

▎發(fā)現(xiàn)一：沒(méi)有全能選手

GPT-5.2以總分79.6%排名第一，在科研領(lǐng)域更是高達(dá)94%。但看電商消費(fèi)？只有67%，被Qwen 3.5 Plus（81%）甩開(kāi)14個(gè)百分點(diǎn)。

Gemini 3.1 Pro在教育領(lǐng)域以84%拿下第一，Claude Opus 4.6在交通運(yùn)輸以77%稱王，Qwen 3.5 Plus則在醫(yī)療健康和電商消費(fèi)雙雙拿到81%的行業(yè)最高分。

每個(gè)模型都有自己擅長(zhǎng)和不擅長(zhǎng)的行業(yè)。這啟示我們，在實(shí)際生產(chǎn)中，選Agent不能只看總分，還得看你的具體場(chǎng)景。

▎發(fā)現(xiàn)二：隱式故障比顯式故障難對(duì)付得多

顯式故障（API報(bào)錯(cuò)、超時(shí)）相對(duì)好處理, Agent看到報(bào)錯(cuò)，知道該重試就行了。

隱式故障就不一樣了。在干凈環(huán)境下，模型平均得分67.5%。遇到顯式故障掉到62.6%，遇到隱式故障則降到53.4%，比顯式故障低了9.2個(gè)百分點(diǎn)。拿Claude Opus 4.6舉例：顯式故障下只掉了3.4%（71.5%→68.1%），但隱式故障下直接掉了17.6%（71.5%→53.9%）。原因其實(shí)也很簡(jiǎn)單：數(shù)據(jù)截?cái)嗔耍祷馗袷酵耆_，沒(méi)有報(bào)錯(cuò)信號(hào)，Agent不知道自己拿到的數(shù)據(jù)是殘缺的。

9個(gè)測(cè)試模型中，有4個(gè)在隱式故障（E2）下的表現(xiàn)甚至比混合故障（E3）更差, 隱式故障比顯式+隱式一起來(lái)還難對(duì)付。

▎發(fā)現(xiàn)三：Scaling定律依然有效

研究者們還發(fā)現(xiàn)，更大的模型、更新的版本、更深的思考，在OccuBench上全部帶來(lái)了穩(wěn)定提升：

模型規(guī)模：Gemini Pro比Flash-Lite高11.0%，Qwen Plus比Flash高10.2%

代際迭代：Claude Opus從v4到v4.6，總提升10.2個(gè)百分點(diǎn)（61.3%→71.5%）

推理深度：GPT-5.2關(guān)掉推理只有54.7%，開(kāi)到最高推理強(qiáng)度則達(dá)到了82.2%的分?jǐn)?shù)，差了27.5個(gè)百分點(diǎn)

▎發(fā)現(xiàn)四：做Agent厲害 ≠ 當(dāng)環(huán)境模擬器靠譜

研究者還做了一個(gè)交叉實(shí)驗(yàn)：讓不同模型分別充當(dāng)Agent和環(huán)境模擬器，看結(jié)果會(huì)怎么變。

GPT-5.2當(dāng)Agent是第一名（79.6%），但當(dāng)它反過(guò)來(lái)充當(dāng)環(huán)境模擬器時(shí), 所有Agent的平均分只剩29.3%，還不到用Gemini Flash當(dāng)模擬器時(shí)（67.9%）的一半。

研究者扒了失敗案例，發(fā)現(xiàn)GPT-5.2當(dāng)模擬器時(shí)存在三種典型問(wèn)題：

狀態(tài)虛構(gòu)：急診分診任務(wù)中，憑空多出兩個(gè)不存在的檢查室，Agent被誤導(dǎo)選錯(cuò)了房間

實(shí)體遺漏：工單派發(fā)任務(wù)中，把關(guān)鍵的數(shù)據(jù)庫(kù)專家從名冊(cè)里吞掉了，Agent無(wú)人可派

規(guī)則發(fā)明：退貨任務(wù)中，自己編了一條 "退貨窗口已過(guò)期" 的規(guī)則，但是任務(wù)里根本沒(méi)這條限制

相比之下，Qwen 3.5 Plus作為模擬器與Gemini Flash的排名的一致性達(dá)到了85.7%（28對(duì)成對(duì)排名比較中，24對(duì)完全相同），前三名完全吻合。

這啟示我們，做agent和做環(huán)境模擬器，看起來(lái)是兩種不太一樣的能力。這個(gè)結(jié)果對(duì)所有用LLM模擬環(huán)境來(lái)做評(píng)測(cè)/訓(xùn)練的方案來(lái)說(shuō)，都值得參考。

三個(gè)具體案例

▎案例一：末端配送: 你會(huì)先充電嗎？

任務(wù)：找到編號(hào)最大的醫(yī)療包裹MED-615，送到指定地址，全程電池不能低于15%。

Claude Opus 4.6：查庫(kù)存→找到MED-615→看了眼電量28%，覺(jué)得不夠→先充滿電→出發(fā)，到達(dá)時(shí)還剩82%→送達(dá) ->Success

DeepSeek V3.2：查庫(kù)存→找到MED-615→直接就走了→到達(dá)時(shí)電量12.5%→違反15%安全線 ->Fail

它們的區(qū)別就在于出發(fā)前有沒(méi)有看一眼電量夠不夠, 有沒(méi)有時(shí)刻牢記問(wèn)題中的約束。

▎案例二：房產(chǎn)估值: 你能發(fā)現(xiàn)數(shù)據(jù)被截?cái)嗔藛幔?/strong>

任務(wù)：評(píng)估一棟15個(gè)單元的物業(yè)，計(jì)算DSCR（償債覆蓋率）是否達(dá)到1.20x的貸款門(mén)檻。環(huán)境悄悄只返回了2個(gè)單元的數(shù)據(jù)，沒(méi)有任何報(bào)錯(cuò)。

Claude Opus 4.6：“等等，15個(gè)單元怎么只返回了2個(gè)？”→重新請(qǐng)求→拿到完整數(shù)據(jù)→算出DSCR 1.19x，不達(dá)標(biāo) ->Success

Kimi K2.5：也重試了一次，但故障還在→直接假設(shè)15個(gè)單元都跟這2個(gè)一樣→算出1.72x，達(dá)標(biāo)→實(shí)際上這棟樓根本不合格 ->Fail

就因?yàn)閿?shù)據(jù)截?cái)啵瑑蓚€(gè)模型得出了完全相反的財(cái)務(wù)結(jié)論。放在真實(shí)金融場(chǎng)景里，這種錯(cuò)誤的代價(jià)是很大的！

▎案例三：公交調(diào)度: 故障面前，誰(shuí)能堅(jiān)持到底？

任務(wù)：在顯式故障（E1）環(huán)境下恢復(fù)一條公交線路的時(shí)刻表。

Claude Opus 4.6：12步操作中遇到了4次錯(cuò)誤（超時(shí)、500），每次都堅(jiān)持重試→最終完成全部調(diào)度 ->Success

Kimi K2.5：第一次遇到錯(cuò)誤就停了→只完成了2步操作→任務(wù)失敗 ->Fail

同樣的故障率，一個(gè)堅(jiān)持了12步走完了，另一個(gè)第2步就放棄了。

關(guān)于OccuBench

OccuBench覆蓋10大行業(yè): 農(nóng)業(yè)與環(huán)境、商務(wù)與企業(yè)、電商與消費(fèi)、教育與文化、醫(yī)療與生命科學(xué)、工業(yè)與工程、公共服務(wù)與治理、科學(xué)與研究、技術(shù)與IT、交通與物流。從行業(yè)難度來(lái)看，商務(wù)與企業(yè)（70.1%）和公共服務(wù)（69.4%）相對(duì)容易，而交通與物流（56.2%）和教育與文化（57.6%）是最具挑戰(zhàn)性的行業(yè)。

OccuBench完整開(kāi)源：382個(gè)評(píng)測(cè)任務(wù) + 100個(gè)場(chǎng)景的環(huán)境配置 + 全部參考實(shí)現(xiàn)代碼。

論文：https://arxiv.org/abs/2604.10866

項(xiàng)目主頁(yè)：https://gregxmhu.github.io/OccuBench-website/

代碼：https://github.com/GregxmHu/OccuBench

數(shù)據(jù)：https://huggingface.co/datasets/gregH/OccuBench

未經(jīng)「AI科技評(píng)論」授權(quán)，嚴(yán)禁以任何方式在網(wǎng)頁(yè)、論壇、社區(qū)進(jìn)行轉(zhuǎn)載！

公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán)，轉(zhuǎn)載時(shí)需標(biāo)注來(lái)源并插入本公眾號(hào)名片。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁(yè) 下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點(diǎn)推薦

單任務(wù)狂飆16小時(shí)！模型+Harness雙輪驅(qū)動(dòng)，金融Agent跑通了

新智元 2026-04-17 21:12:05
3 跟貼 3

ReconVLA：具身智能研究首次獲得AI頂級(jí)會(huì)議最佳論文獎(jiǎng)

機(jī)器之心Pro 2026-01-26 13:51:30
0 跟貼 0

智元機(jī)器人，要做AI大模型平臺(tái)和開(kāi)放生態(tài)

36氪 2026-04-18 10:05:08
1 跟貼 1

具身智能缺數(shù)據(jù)？覓蜂科技發(fā)布MEgo：無(wú)本體采集，隨走隨采

雷科技 2026-04-18 19:44:51
0 跟貼 0

大模型的下半場(chǎng)，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0

π0.7發(fā)布，機(jī)器人迎來(lái)GPT-2時(shí)刻

智東西 2026-04-18 17:19:27
1 跟貼 1

攻防技術(shù)同源！在 C3 安全大會(huì)上，亞信要用 AI 去對(duì)抗 AI

雷科技 2026-04-18 22:26:37
0 跟貼 0

當(dāng)老板與員工展開(kāi)“蒸餾”對(duì)抗

經(jīng)濟(jì)觀察報(bào) 2026-04-18 17:48:45
13 跟貼 13

高效智能體幕后推手是誰(shuí)？一篇綜述帶你從記憶×工具學(xué)習(xí)×規(guī)劃看透

機(jī)器之心Pro 2026-01-27 15:24:36
0 跟貼 0

VGGT4D：無(wú)需訓(xùn)練，挖掘3D基礎(chǔ)模型潛力，實(shí)現(xiàn)4D動(dòng)態(tài)場(chǎng)景重建

機(jī)器之心Pro 2025-12-17 17:46:42
0 跟貼 0

表格建模也能Scaling？樹(shù)模型的時(shí)代要改變了

機(jī)器之心Pro 2026-04-17 11:12:25
0 跟貼 0

這個(gè)時(shí)代必須以Agent為中心：三個(gè)趨勢(shì)回顧

量子位 2026-04-05 02:14:15
0 跟貼 0

AI Agent是科技革命中的一次真正的范式轉(zhuǎn)移

量子位 2026-04-03 22:52:35
0 跟貼 0

B站爆了！Hermes首度直播回應(yīng)「抄襲」，MiniMax提前殺入Harness賽點(diǎn)

新智元 2026-04-18 18:17:20
2 跟貼 2

V4 發(fā)布前夜，DeepSeek 被曝尋求至少 3 億美元融資

鈦媒體APP 2026-04-18 10:23:06
10 跟貼 10

不裝了我就是你的后臺(tái)

艾瑪影視匯 2026-04-17 16:25:46
2 跟貼 2

三層防御仍然不夠，一條PR標(biāo)題就能偷走你的API密鑰：AI Agent安全裂痕再現(xiàn)

鈦媒體APP 2026-04-18 10:44:12
0 跟貼 0

龍蝦之戰(zhàn)進(jìn)入深水區(qū)，產(chǎn)品完成度是下一個(gè)賽點(diǎn)

鈦媒體APP 2026-04-18 08:48:14
0 跟貼 0

從匹配困境到推理突破：阿里REG4Rec 激活生成式推薦的個(gè)性化潛力

機(jī)器之心Pro 2026-03-02 16:10:32
0 跟貼 0

一國(guó)可敵全球，中國(guó)數(shù)據(jù)相比其他國(guó)家就是bug

小信新鮮事 2026-04-16 01:10:46
0 跟貼 0

解放軍護(hù)衛(wèi)艦與外艦纏斗20小時(shí) 細(xì)節(jié)披露

上觀新聞 2026-04-18 12:26:59
10273 跟貼 10273

段曉天以為羅子君沒(méi)有后臺(tái)，肆無(wú)忌憚的欺負(fù)

熊樣動(dòng)漫 2026-04-17 08:48:52
0 跟貼 0

一臺(tái)黃色掌機(jī)，讓杜克游戲課改了作業(yè)標(biāo)準(zhǔn)

閃存獵手 2026-04-17 12:41:07
3 跟貼 3

免費(fèi)領(lǐng)69元游戲：Steam在下一盤(pán)什么棋？

我是一個(gè)粉刷匠2 2026-04-17 15:03:17
8 跟貼 8

模擬器團(tuán)隊(duì)做主機(jī)：EmuDeck的硬件野心

我是一個(gè)養(yǎng)蝦人 2026-04-18 20:35:23
0 跟貼 0

揭秘年銷10億的爆款宋柚汁：“宋柚”是商標(biāo)，柚含量不到3%，主配料為糖水，品牌號(hào)稱全國(guó)銷量第一

藍(lán)鯨新聞 2026-04-15 09:44:24
3808 跟貼 3808

15元恐怖游戲突然免費(fèi)，Steam在測(cè)試什么？

固件更新中 2026-04-17 15:08:07
1 跟貼 1

直播15小時(shí)，1300公里，雷軍被逼急了

財(cái)天COVER 2026-04-18 22:38:33
6 跟貼 6

動(dòng)畫(huà)演示二戰(zhàn)日軍“回天”人操魚(yú)雷作戰(zhàn)過(guò)程

裝甲鏟史官 2026-04-01 11:23:23
0 跟貼 0

60歲老爺機(jī)跑《我的世界》：一場(chǎng)關(guān)于技術(shù)極限的執(zhí)念

爬蟲(chóng)飼養(yǎng)員 2026-04-18 21:37:57
0 跟貼 0

組裝V8汽車發(fā)動(dòng)機(jī)模型

制造科技 2026-04-16 13:26:17
0 跟貼 0

EA888發(fā)動(dòng)機(jī)迭代解讀

愛(ài)玩游戲的小莫 2026-04-16 20:20:00
0 跟貼 0

貓兒雖然怕但是代碼讓它還是先叼著才說(shuō)

扎克東哥 2026-04-17 10:12:55
1 跟貼 1

美末原版設(shè)計(jì)師開(kāi)撕頑皮狗！胡亂刪改一想就來(lái)氣

游民星空 2026-04-17 16:19:08
1 跟貼 1

川崎 H2R模型摩托

制造科技 2026-04-16 21:58:46
12 跟貼 12

編程已死，鍵盤(pán)長(zhǎng)草！Claude Code之父對(duì)談Kaparthy，全程爆金句

新智元 2026-02-04 11:41:01
0 跟貼 0

廣東“莫氏雞煲大公主”爆火前后反差大，晚上干到凌晨2點(diǎn)才收工，發(fā)文吐槽：這個(gè)雞你們是非吃不可嗎

大象新聞 2026-04-15 12:57:04
2674 跟貼 2674

上一個(gè)兄弟離職了，我接手了他的代碼，我承認(rèn)沒(méi)憋住

環(huán)亞搞笑 2026-04-14 14:35:36
3 跟貼 3

日本又有新動(dòng)作軍事專家：其出兵海外的野心非常迫切

環(huán)球網(wǎng)資訊 2026-04-18 16:03:55
294 跟貼 294

女子在飛豬旅行購(gòu)買(mǎi)四張機(jī)票，實(shí)際支付金額均高于出票價(jià)格！雙方協(xié)商未果，飛豬單方面退還差價(jià)，消費(fèi)者無(wú)奈退票，被收取190元費(fèi)用

大風(fēng)新聞 2026-04-18 16:49:05
451 跟貼 451

地質(zhì)專家在洞穴中，發(fā)現(xiàn)2臺(tái)發(fā)電機(jī)，專家說(shuō)發(fā)電機(jī)已經(jīng)工作了80年
咸説歷史
2026-04-14 09:47:27

后悔莫及！火箭不要的新秀，徹底完成蛻變，21歲有望成為聯(lián)盟超巨
體育大朋說(shuō)
2026-04-18 05:05:03

六小齡童回應(yīng) “煩死了” 表情包，稱這是當(dāng)年拍戲時(shí)導(dǎo)演抓拍到的真實(shí)狀態(tài)，意外成了全網(wǎng)爆款表情
魯中晨報(bào)
2026-04-18 17:20:04

星光大道多位冠軍現(xiàn)狀：大多已無(wú)人問(wèn)津，有人負(fù)債累累當(dāng)搬運(yùn)工
雅兒姐游世界
2026-04-14 16:52:38

恒大0.69%清償率：一個(gè)時(shí)代神話的墓志銘
流蘇晚晴
2026-04-17 18:20:43

深大一口氣停招26個(gè)專業(yè)，這些“坑”你還在踩嗎？
牛鍋巴小釩
2026-04-17 13:18:03

35歲女子覺(jué)得不夠緊做陰道緊縮手術(shù)，縫合針突然斷體內(nèi)，瞬間崩潰
丫頭舫
2026-03-03 21:33:10

為啥淘寶，拼多多幾塊錢(qián)的東西還能包郵？看完你就明白了！
呼呼歷史論
2026-04-10 21:17:24

鄭麗文稱臺(tái)灣是國(guó)家，反對(duì)兩岸統(tǒng)一？喊話大陸：美國(guó)讓我過(guò)去
阿器談史
2026-01-26 20:48:30

深夜猝死的人增多！醫(yī)生反復(fù)強(qiáng)調(diào)：吃完晚飯后，盡量少做這4件事
岐黃傳人孫大夫
2026-04-18 11:45:03

高中女生借攤主手機(jī)帶入考場(chǎng) 企圖作弊被抓家長(zhǎng)遷怒攤主攤主被逼下跪道歉
閃電新聞
2026-04-18 17:32:26

NBA季后賽G1明天4月19日賽程：森林狼VS掘金，殘陣湖人VS火箭
薇說(shuō)體育
2026-04-18 12:45:27

事發(fā)浦東機(jī)場(chǎng)！女子稱兩次拒絕幫陌生人帶行李，多名網(wǎng)友：我也遇到過(guò)！別心軟！
新民晚報(bào)
2026-04-18 21:15:45

60歲的郭富城在香港銅鑼灣街邊被撞見(jiàn)，染著一頭黃發(fā)，腳蹬帆布鞋
可樂(lè)談情感
2026-04-18 00:18:37

經(jīng)濟(jì)熱點(diǎn)快評(píng)｜全島封關(guān)運(yùn)作后“首秀”，今年消博會(huì)有啥不一樣？
環(huán)球網(wǎng)資訊
2026-04-18 23:39:12

衛(wèi)冕冠軍險(xiǎn)象環(huán)生！趙心童5-4險(xiǎn)勝海菲爾德，狀態(tài)低迷敲響警鐘
十一體育館
2026-04-18 21:43:48

伊朗副外長(zhǎng)：伊朗絕不接受被當(dāng)作國(guó)際法的“例外”對(duì)待
財(cái)聯(lián)社
2026-04-18 23:18:09

曾經(jīng)走紅，如今卻“淪為笑柄”的4種數(shù)碼產(chǎn)品，還是別再買(mǎi)了
美家指南
2026-03-06 10:31:36

不會(huì)干，你就別干了！中國(guó)勒令馬士基停運(yùn)，巴拿馬的反應(yīng)很有意思
阿腩講娛樂(lè)
2026-04-18 13:00:07

芭蕾姐喊我練一字馬，這不純扯蛋了嗎！
飛娛日記
2026-04-17 08:02:36

2026-04-19 00:04:49

AI科技評(píng)論

點(diǎn)評(píng)學(xué)術(shù)，服務(wù)AI

7198文章數(shù) 20744關(guān)注度

往期回顧全部

科技要聞

傳Meta下月擬裁8000 大舉清退人力為AI騰位

“世界模型”火了，但大家說(shuō)的根本不是一回事

梁文鋒，被曝融資20億！

7家頭部平臺(tái)被罰沒(méi)35.97億元

營(yíng)收5年百億，8年千億！智元立下軍令狀

頭條要聞

伊朗革命衛(wèi)隊(duì)向油輪開(kāi)火伊朗最高領(lǐng)袖發(fā)聲

王行環(huán)被"雙開(kāi)"：搞權(quán)色交易曾任武漢雷神山醫(yī)院院長(zhǎng)

北約30國(guó)駐布魯塞爾大使集體訪日日本外務(wù)省：罕見(jiàn)

特朗普"金主"把產(chǎn)線轉(zhuǎn)移到中國(guó) 曾承諾保護(hù)美國(guó)制造業(yè)

特朗普：伊朗無(wú)法用封鎖海峽"要挾"美國(guó)

頭條要聞

伊朗革命衛(wèi)隊(duì)向油輪開(kāi)火伊朗最高領(lǐng)袖發(fā)聲

王行環(huán)被"雙開(kāi)"：搞權(quán)色交易曾任武漢雷神山醫(yī)院院長(zhǎng)

北約30國(guó)駐布魯塞爾大使集體訪日日本外務(wù)省：罕見(jiàn)

特朗普"金主"把產(chǎn)線轉(zhuǎn)移到中國(guó) 曾承諾保護(hù)美國(guó)制造業(yè)

特朗普：伊朗無(wú)法用封鎖海峽"要挾"美國(guó)

體育要聞

時(shí)隔25年重返英超！沒(méi)有人再嘲笑他了

福建19分大逆轉(zhuǎn)時(shí)隔15年勝?gòu)V東皮特森39+7+6徐杰14中2

格林36+6太陽(yáng)戰(zhàn)勝勇士將對(duì)陣?yán)做?庫(kù)里17+4布克追夢(mèng)被逐

犯規(guī)罰退一位！WSBK荷蘭站第一回合：張雪機(jī)車車手德比斯獲第4名

NBA季后賽完整對(duì)陣：火箭vs湖人成焦點(diǎn) 雷霆vs太陽(yáng) 活塞vs魔術(shù)

娛樂(lè)要聞

劉德華回應(yīng)潘宏彬去世，拒談喪禮細(xì)節(jié)

45歲汪詩(shī)詩(shī)生日排面十足！甄子丹豪氣包場(chǎng)

何炅與李小冉為何“撫養(yǎng)”素人時(shí)的謝娜

沈騰帶老婆聚餐，頸紋堆圈發(fā)福明顯，王琦豐腴

王寶強(qiáng)陪女友青島聚餐被拍，這一次終于選對(duì)人了

財(cái)經(jīng)要聞

"影子萬(wàn)科"2.0：管理層如何吸血萬(wàn)物云？

馬斯克、奧特曼與OpenAI的“最后審判”

海爾與醫(yī)美女王互撕換血抗衰誰(shuí)的生意?

高油價(jià)，山姆的潛在危機(jī)

魏建軍平遙對(duì)話：探尋契約精神之源

汽車要聞

奇瑞威麟R08 PRO正式上市售價(jià)14.48萬(wàn)元起

11.58萬(wàn)起售來(lái)看埃安N60的“反向刀法”

新工廠2026年扎堆投產(chǎn) 零跑按部就班實(shí)現(xiàn)產(chǎn)能擴(kuò)張

迎接技術(shù)平權(quán)時(shí)代四款純電動(dòng)大型車推薦

推薦For Me SE 蓮花跑車FOR ME購(gòu)車指南

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戲

時(shí)尚

手機(jī)

教育

房產(chǎn)

讓老粥批直呼“計(jì)劃有變”的歲獸代理人，到底是什么東西？

《刺客信條黑旗》重制版將至你心中最帥刺客導(dǎo)師是誰(shuí)

《刺客信條黑旗》后育碧下一款游戲是《幽靈行動(dòng)》

致敬傳奇制作人！《戰(zhàn)地6》新增《泰坦隕落》紀(jì)念臂章

選對(duì)發(fā)型，真的能少走很多變美彎路

今天流行的冰藍(lán)色太適合春夏了，誰(shuí)穿誰(shuí)美！

有些衣服，是穿給自己看的

今日熱點(diǎn)：許光漢否認(rèn)和周子瑜戀情；郝熠然與誠(chéng)實(shí)一口終止合作……

手機(jī)要聞

榮耀600系列參數(shù)、外觀全曝光

華為蘋(píng)果爭(zhēng)第一，手機(jī)TOP5排名來(lái)了

愛(ài)馬仕橙謝幕！iPhone 18 Pro新配色偷跑：名為深櫻桃色

藍(lán)廠續(xù)航之王來(lái)了！vivo Y600 Pro首發(fā)10200mAh藍(lán)海電池：告別充電寶

教育要聞

教育縱深 | 聚焦春招進(jìn)行時(shí)

定了！綿陽(yáng)富樂(lè)二中、富樂(lè)二小學(xué)區(qū)劃片范圍正式變更

EF=8m，ED=FB，求梯形的陰影面積是多

N個(gè)實(shí)戰(zhàn)案例分析，涵蓋各區(qū)各分?jǐn)?shù)段！

兵團(tuán)二中：科學(xué)、高效的育人體系："1+X"多層階 | 新時(shí)代教育書(shū)摘

房產(chǎn)要聞

官宣簽約最強(qiáng)城更！海口樓市，突然殺入神秘房企！

重磅利好！2500個(gè)學(xué)位，海口濱江片區(qū)，要建九年一貫制學(xué)校！

2600億砸向城更，海南要巨變！

動(dòng)真格！重拳出擊，海南整治物業(yè)亂象，事關(guān)你家房?jī)r(jià)！

手機(jī) / 數(shù)碼

房產(chǎn) / 家居

15個(gè)前沿大模型，100個(gè)職業(yè)場(chǎng)景：誰(shuí)才是最強(qiáng)AI打工人？

傳Meta下月擬裁8000 大舉清退人力為AI騰位

伊朗革命衛(wèi)隊(duì)向油輪開(kāi)火 伊朗最高領(lǐng)袖發(fā)聲

伊朗革命衛(wèi)隊(duì)向油輪開(kāi)火 伊朗最高領(lǐng)袖發(fā)聲

時(shí)隔25年重返英超！沒(méi)有人再嘲笑他了

劉德華回應(yīng)潘宏彬去世，拒談喪禮細(xì)節(jié)

"影子萬(wàn)科"2.0：管理層如何吸血萬(wàn)物云？

奇瑞威麟R08 PRO正式上市 售價(jià)14.48萬(wàn)元起

態(tài)度原創(chuàng)

讓老粥批直呼“計(jì)劃有變”的歲獸代理人，到底是什么東西？

選對(duì)發(fā)型，真的能少走很多變美彎路

榮耀600系列參數(shù)、外觀全曝光

教育縱深 | 聚焦春招進(jìn)行時(shí)

官宣簽約最強(qiáng)城更！海口樓市，突然殺入神秘房企！

伊朗革命衛(wèi)隊(duì)向油輪開(kāi)火伊朗最高領(lǐng)袖發(fā)聲

伊朗革命衛(wèi)隊(duì)向油輪開(kāi)火伊朗最高領(lǐng)袖發(fā)聲

奇瑞威麟R08 PRO正式上市售價(jià)14.48萬(wàn)元起