无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI打爆人類題庫!16小時(shí)獨(dú)立工作,程序員要失業(yè)?

0
分享至

AI能連續(xù)工作16小時(shí),人類出的考題不夠用了。



AI“考爆”了,不是它錯(cuò),是題太簡(jiǎn)單

通用人工智能的到來,或許比我們預(yù)想的要快。至少在編程領(lǐng)域,變革的浪潮已經(jīng)清晰可見。

最近,一個(gè)名為Claude Mithras的模型,在權(quán)威評(píng)測(cè)中取得了令人震驚的成績(jī)。

這好比學(xué)霸與學(xué)神的區(qū)別:學(xué)霸考100分,是努力達(dá)到了極限;學(xué)神考100分,是因?yàn)樵嚲頋M分只有100分

評(píng)測(cè)機(jī)構(gòu)METR在測(cè)試新一代模型時(shí),首次遇到了“測(cè)不準(zhǔn)”的情況。

并非模型出錯(cuò),而是人類設(shè)計(jì)的題庫已經(jīng)不夠用了。

你給孩子出考題,本來以為夠難了,結(jié)果孩子全對(duì),不是他只會(huì)這么多,是你出的題最多就值這么多分。AI現(xiàn)在就是這樣。

過去,人們測(cè)試AI,主要看它能否解答單點(diǎn)問題,比如數(shù)學(xué)計(jì)算、代碼片段或語言理解。

但現(xiàn)在,新的測(cè)試方向聚焦于另一件事:AI能否像一個(gè)真正的員工一樣,連續(xù)、獨(dú)立地完成一項(xiàng)復(fù)雜任務(wù)。

例如,一個(gè)原本需要程序員花費(fèi)數(shù)小時(shí)的工作,交給AI。



看它能否自己閱讀理解代碼庫、理解系統(tǒng)架構(gòu)、制定解決方案、調(diào)試錯(cuò)誤,并最終完整交付。

這種獨(dú)立工作的持久力,被稱為“任務(wù)時(shí)間跨度”。

幾年前,AI只能處理幾秒鐘級(jí)別的任務(wù),比如寫一行代碼。

后來,進(jìn)化到幾分鐘完成一個(gè)簡(jiǎn)單函數(shù)。再后來,能花一小時(shí)搞定一個(gè)小模塊。

而最新一代的模型,其獨(dú)立工作時(shí)間已經(jīng)輕松超過16小時(shí)。

關(guān)鍵點(diǎn)來了:METR評(píng)測(cè)中最難的題目,耗時(shí)就是16小時(shí)。

所以,不是模型只能工作16小時(shí),而是題庫里根本沒有更復(fù)雜的題目了。

這標(biāo)志著一個(gè)臨界點(diǎn):AI開始突破人類為它設(shè)定的能力上限。



從“工具”到“員工”,AI角色變了

互聯(lián)網(wǎng)時(shí)代,自動(dòng)化的是信息流轉(zhuǎn)。

AI時(shí)代,真正開始自動(dòng)化的,是“認(rèn)知?jiǎng)趧?dòng)”。

這種變化,在編程和網(wǎng)絡(luò)安全行業(yè)感受最為直接。

原本,AI編程是程序員的得力助手。但照此發(fā)展,未來可能真的不再需要那么多程序員了。

AI不僅能寫代碼,更能理解需求、設(shè)計(jì)架構(gòu)、持續(xù)調(diào)試,完成一個(gè)完整的開發(fā)閉環(huán)。

過去一個(gè)軟件開發(fā)團(tuán)隊(duì)需要10個(gè)人,如果AI能獨(dú)立完成其中80%的工作,那還需要幾個(gè)人?

這不是危言聳聽,是正在發(fā)生的事。

網(wǎng)絡(luò)安全領(lǐng)域同樣如此。一些安全公司發(fā)現(xiàn),AI不再只是輔助人類尋找漏洞,而是能像經(jīng)驗(yàn)豐富的高級(jí)黑客一樣,自動(dòng)將多個(gè)微小漏洞串聯(lián)起來,形成完整的攻擊鏈。

過去一個(gè)團(tuán)隊(duì)需要數(shù)周才能完成的滲透測(cè)試,AI可能只需幾小時(shí)甚至幾十分鐘



這也催生了“用AI對(duì)抗AI”的新賽道:你拿AI攻擊,我就拿AI防守。

人跑不贏AI,但AI可以跑贏AI。

當(dāng)然,不必過度恐慌或神化。今天的AI依然會(huì)犯錯(cuò)誤,會(huì)產(chǎn)生“幻覺”,會(huì)偏離軌道,也遠(yuǎn)未達(dá)到真正理解世界的人類級(jí)智能。

它距離所謂的“技術(shù)奇點(diǎn)”或“外星文明”般的超級(jí)智能,還有很長(zhǎng)的路要走。

真正值得警惕的,是AI進(jìn)步的速度和方式

但真正值得警惕的,不是AI是否已成“神”,而是它進(jìn)步的速度和方式。

過去的AI,更像一個(gè)增強(qiáng)版的搜索引擎,有問必答。你問它問題,它給你答案。

未來的AI,將真正成為一個(gè)可以委派任務(wù)、獨(dú)立工作的數(shù)字員工。

你給它一個(gè)目標(biāo),它自己規(guī)劃路徑、執(zhí)行任務(wù)、交付結(jié)果。

更深層的問題是:如果AI未來開始自己研發(fā)更強(qiáng)的AI呢?

現(xiàn)在是人研發(fā)AI。如果AI的編程能力已經(jīng)超過人類,那它完全可以自己寫代碼、自己優(yōu)化自己。

到那時(shí)候,技術(shù)進(jìn)步本身將被AI加速,其增長(zhǎng)曲線可能不再是簡(jiǎn)單的指數(shù)增長(zhǎng),而是“指數(shù)的指數(shù)”增長(zhǎng)。



評(píng)測(cè)題庫被AI“打爆”,是一個(gè)極具象征意義的信號(hào),它告訴我們?nèi)拢?/p>

變革已至,且正在加速。不是未來某一天,就是現(xiàn)在。

衡量AI的標(biāo)準(zhǔn)變了。從“會(huì)不會(huì)做這道題”變成了“能不能獨(dú)立完成一項(xiàng)工作”。

人類需要重新思考自己在工作中的位置。當(dāng)AI能連續(xù)工作16小時(shí)不休息、不出錯(cuò)、不抱怨,人類的核心競(jìng)爭(zhēng)力在哪里?

這不是要制造焦慮,而是提醒:適應(yīng)的最好時(shí)機(jī)是昨天,其次是現(xiàn)在。

聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
奧運(yùn)冠軍楊威在香港的居住環(huán)境:一家六口蝸居在40多平米的小屋里

奧運(yùn)冠軍楊威在香港的居住環(huán)境:一家六口蝸居在40多平米的小屋里

觀魚聽雨
2026-05-15 21:06:26
五一和老伴旅游,僅僅花了不到一萬塊錢,回來后卻被兒子兒媳疏遠(yuǎn)

五一和老伴旅游,僅僅花了不到一萬塊錢,回來后卻被兒子兒媳疏遠(yuǎn)

十指說情
2026-05-14 08:48:05
你的藍(lán)牙耳機(jī)可能在“竊聽”!國(guó)安部提醒涉密人員禁止使用,蘋果、華為、小米、索尼等品牌客服回應(yīng)

你的藍(lán)牙耳機(jī)可能在“竊聽”!國(guó)安部提醒涉密人員禁止使用,蘋果、華為、小米、索尼等品牌客服回應(yīng)

都市快報(bào)橙柿互動(dòng)
2026-05-14 00:46:18
福州市倉山區(qū)民政局原黨組書記、局長(zhǎng)陳晶被查

福州市倉山區(qū)民政局原黨組書記、局長(zhǎng)陳晶被查

海峽網(wǎng)
2026-05-15 15:50:04
主動(dòng)表態(tài)!勇士續(xù)約庫里,2年1.36億,一人一城的傳奇還在延續(xù)

主動(dòng)表態(tài)!勇士續(xù)約庫里,2年1.36億,一人一城的傳奇還在延續(xù)

體育大朋說
2026-05-16 10:38:20
中方喊話以色列:停止在敘利亞境內(nèi)一切軍事行動(dòng)

中方喊話以色列:停止在敘利亞境內(nèi)一切軍事行動(dòng)

看看新聞Knews
2026-05-16 08:54:10
海港球迷意難平!不止因?yàn)?-2浙江,更多原因在于以下6點(diǎn)

海港球迷意難平!不止因?yàn)?-2浙江,更多原因在于以下6點(diǎn)

佳佳說奇事故事
2026-05-16 06:35:52
命中關(guān)鍵三分率隊(duì)取勝,張鎮(zhèn)麟出場(chǎng)34分鐘&三分5中3取17分

命中關(guān)鍵三分率隊(duì)取勝,張鎮(zhèn)麟出場(chǎng)34分鐘&三分5中3取17分

懂球帝
2026-05-15 21:44:31
一場(chǎng)87-82!輸球不可怕,可怕的是賽后京媒一席話,被打服了

一場(chǎng)87-82!輸球不可怕,可怕的是賽后京媒一席話,被打服了

晚霧空青
2026-05-16 10:58:10
毛主席83歲給華國(guó)鋒的珍貴書法,練字真的有意義嗎?

毛主席83歲給華國(guó)鋒的珍貴書法,練字真的有意義嗎?

書畫相約
2026-05-11 10:09:02
成人片女星許諾薩福諾夫奪歐冠將共度良宵,球員妻子爆粗回應(yīng)

成人片女星許諾薩福諾夫奪歐冠將共度良宵,球員妻子爆粗回應(yīng)

懂球帝
2026-05-14 15:58:14
30歲夜市老板娘當(dāng)眾脫內(nèi)褲套男子脖頸,丈夫全程旁觀,細(xì)節(jié)太辣眼

30歲夜市老板娘當(dāng)眾脫內(nèi)褲套男子脖頸,丈夫全程旁觀,細(xì)節(jié)太辣眼

老特有話說
2026-05-15 16:18:24
天氣 | 最新雨情!天津這里有暴雨或大暴雨!

天氣 | 最新雨情!天津這里有暴雨或大暴雨!

天津廣播
2026-05-16 08:55:52
破例舉杯!川普國(guó)宴淺酌中國(guó)紅酒,這款東方佳釀快斷貨了?

破例舉杯!川普國(guó)宴淺酌中國(guó)紅酒,這款東方佳釀快斷貨了?

超新星財(cái)經(jīng)
2026-05-15 17:12:01
世乒賽落幕才幾天,日本主帥銳評(píng)梁靖崑,只字不提球技卻一針見血

世乒賽落幕才幾天,日本主帥銳評(píng)梁靖崑,只字不提球技卻一針見血

觀史搜尋著
2026-05-15 14:28:14
叫囂讓華屈服?特朗普沒想到,訪華第一天,就見識(shí)了“待客之道”

叫囂讓華屈服?特朗普沒想到,訪華第一天,就見識(shí)了“待客之道”

田園小歸
2026-05-16 10:13:47
中老年人同居要記住:沒有生理上的需求,就不要搭伙了

中老年人同居要記住:沒有生理上的需求,就不要搭伙了

三農(nóng)老歷
2026-05-16 09:40:00
隨特朗普訪華的白宮通訊主任:史蒂文.張,是華人移民的后代

隨特朗普訪華的白宮通訊主任:史蒂文.張,是華人移民的后代

魔都姐姐雜談
2026-05-15 06:12:44
特斯拉突然甩出“五毛七電價(jià)”!1299元包6年2300度電

特斯拉突然甩出“五毛七電價(jià)”!1299元包6年2300度電

阿芒娛樂說
2026-05-16 09:18:54
女子騎馬拍照,摔下馬背手臂骨折,在救護(hù)車上還在問“沒事弟弟,主要是出片了嗎”,當(dāng)事人回應(yīng):為安撫團(tuán)隊(duì)員工情緒,一直說話緩和氣氛

女子騎馬拍照,摔下馬背手臂骨折,在救護(hù)車上還在問“沒事弟弟,主要是出片了嗎”,當(dāng)事人回應(yīng):為安撫團(tuán)隊(duì)員工情緒,一直說話緩和氣氛

瀟湘晨報(bào)
2026-05-16 09:12:31
2026-05-16 12:20:49
我超有瓜
我超有瓜
全網(wǎng)熱瓜第一線,網(wǎng)友神評(píng)天天見。不生產(chǎn)瓜,只是瓜田的搬運(yùn)工。
6文章數(shù) 0關(guān)注度
往期回顧 全部

科技要聞

漲的是車價(jià),要的是老命

頭條要聞

美國(guó)媒體在天壇里尋找俄勒岡木材 被指非常耐人尋味

頭條要聞

美國(guó)媒體在天壇里尋找俄勒岡木材 被指非常耐人尋味

體育要聞

35歲坎特,干了一件這輩子最吵的事

娛樂要聞

張嘉譯和老婆的差距讓人心酸

財(cái)經(jīng)要聞

造詞狂魔賈躍亭

汽車要聞

高爾夫GTI刷新紐北紀(jì)錄 ID. Polo GTI迎全球首秀

態(tài)度原創(chuàng)

藝術(shù)
手機(jī)
親子
房產(chǎn)
健康

藝術(shù)要聞

19位當(dāng)代畫家油畫作品欣賞

手機(jī)要聞

支付寶回應(yīng)關(guān)閉支付仍被扣款;蘋果iPhone17Pro系列降價(jià)千元

親子要聞

凱特訪問幼兒園,與孩子們一同探索自然,溫柔系穿搭讓人眼前一亮

房產(chǎn)要聞

老黃埔熱銷之下,珠江春,為何去化僅3成?

專家揭秘干細(xì)胞回輸?shù)陌踩L(fēng)險(xiǎn)

無障礙瀏覽 進(jìn)入關(guān)懷版