无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

科研奇點(diǎn)已至:AI兩小時(shí)完成博士數(shù)月工作

0
分享至

【導(dǎo)讀】就在今天,Agentic AI工程師發(fā)現(xiàn):博士80小時(shí)的科研任務(wù),Codex不到2小時(shí)就跑完了,效率差達(dá)到了40倍!其實(shí)按照舊標(biāo)準(zhǔn),AGI早已存在了,只是全行業(yè)都在移動(dòng)球門(mén)。

科研界的「奇點(diǎn)」真的來(lái)了,比所有人預(yù)想的都要近。

近日,一項(xiàng)針對(duì)Codex「目標(biāo)模式(Goal Mode)」的實(shí)驗(yàn)震驚了學(xué)術(shù)界:Codex可以讓AI科研效率猛增40倍!

Agentic AI工程師Dan McAteer近日在X上披露一次實(shí)驗(yàn):用OpenAI Codex的Goal Mode跑一項(xiàng)機(jī)械可解釋性(Mechanistic Interpretability)研究任務(wù)。



GPT-5.5自己估算這個(gè)任務(wù)博士可能需要約80小時(shí)才完成,在實(shí)際操作中,AI 僅用時(shí)1小時(shí)56分鐘便徹底完成了任務(wù)。



表面效率提升約40倍!



他所使用的是Codex中一種內(nèi)置的技能 /goal。

也就是,讓模型自行設(shè)定目標(biāo),其中的關(guān)鍵就是它寫(xiě)出的提示詞很可能比你的更出色。



這不再是簡(jiǎn)單的「效率提升」,而是一場(chǎng)徹頭徹尾的「降維打擊」。

當(dāng)科研周期從以「周」為單位縮減至「小時(shí)」,當(dāng) AI 開(kāi)始自主撰寫(xiě)自己的實(shí)驗(yàn)?zāi)繕?biāo)(/goal),我們必須承認(rèn)一個(gè)殘酷的現(xiàn)實(shí):

「智能爆炸」的斜率已經(jīng)現(xiàn)身,AI 的自我迭代速度正在脫離人類(lèi)的掌控節(jié)奏!

先來(lái)看看這個(gè)實(shí)驗(yàn)是怎么進(jìn)行的。

實(shí)驗(yàn)發(fā)起人是Dan McAteer,Agentic AI工程師,前Amp Code工程師。

常年在X上分享AI agent工程化的具體實(shí)踐。



他的實(shí)驗(yàn)配置很簡(jiǎn)單——

他自己對(duì)這套配置的描述是:當(dāng)前可用的最高效的AI智能體配置。

這件事真正值得說(shuō)的是Codex /goal這個(gè)模式本身。



按OpenAI Codex工程師Philip Corey的描述,/goal是我們對(duì)Ralph loop的一種實(shí)現(xiàn)——讓目標(biāo)在多輪對(duì)話(huà)里持續(xù)存在,不達(dá)成不停止。

簡(jiǎn)單說(shuō),普通的Codex調(diào)用是你說(shuō)一句、它做一步、回你一句。

Codex /goal是你說(shuō)一個(gè)目標(biāo)、它自己拆分子任務(wù)、自己執(zhí)行、自己review、自己繼續(xù),直到達(dá)成或失敗。

這是從對(duì)話(huà)式AI到目標(biāo)驅(qū)動(dòng)AI的工程切換。



對(duì)Mechanistic Interpretability這類(lèi)研究任務(wù),/goal模式的天然契合度高。

研究流程本身就是提出假設(shè)→設(shè)計(jì)實(shí)驗(yàn)→運(yùn)行→看結(jié)果→修正假設(shè)→再實(shí)驗(yàn)的循環(huán),正好可以喂給一個(gè)會(huì)自我循環(huán)的agent。

McAteer的實(shí)驗(yàn)真正證明的,是Codex /goal 模式在科研型循環(huán)任務(wù)上具備可用性:不是替代研究員,是替代研究員的重復(fù)操作部分。



這個(gè)能力如果能穩(wěn)定下來(lái),對(duì)AI研究本身有非常直接的杠桿。

它意味著AI實(shí)驗(yàn)室自己內(nèi)部的AI研究員,未來(lái)某天可以用AI agent去做訓(xùn)練數(shù)據(jù)準(zhǔn)備、實(shí)驗(yàn)設(shè)置、消融研究、可視化生成、初步結(jié)果分析這些重復(fù)工作。

這也就是Anthropic和OpenAI最近反復(fù)說(shuō)的AI正在加速AI研究本身。

這套流程之所以漫長(zhǎng),是因?yàn)槿祟?lèi)大腦在處理復(fù)雜邏輯和海量數(shù)據(jù)時(shí),存在物理上限。

但Codex的這次實(shí)驗(yàn)徹底打破了這種認(rèn)知。



在「/goal + GPT-5.5 High + Fast Mode」的最強(qiáng)智能體配置下,AI不再是一個(gè)「聽(tīng)指令」的工具,而是一個(gè)「出策略」的獨(dú)立研究員。

它能夠理解復(fù)雜的自然語(yǔ)言自動(dòng)編碼器(NLA)實(shí)驗(yàn)需求,自主拆解任務(wù),并在不到2小時(shí)的時(shí)間里走完了人類(lèi)精英需要兩周才能走完的路。

這代表著,從此人類(lèi)的科研門(mén)檻徹底崩塌。曾經(jīng)需要數(shù)年寒窗苦讀換來(lái)的專(zhuān)業(yè)分析能力,正在被算法模塊化。

而且,自主AI研究員已經(jīng)提前降臨了!

OpenAI此前設(shè)定的目標(biāo)是2026年底實(shí)現(xiàn)AI自主科研。

但從目前的實(shí)驗(yàn)進(jìn)度看,2026年可能不是開(kāi)始,而是人類(lèi)徹底交出科研接力棒的終點(diǎn)。

如果說(shuō)Codex 40倍速實(shí)驗(yàn)是一個(gè)刺眼的個(gè)案,那更讓人坐不住的,是圍繞「遞歸自我改進(jìn)」的證據(jù)正在密集涌現(xiàn)。

5月7日,據(jù)Axios報(bào)道,Anthropic聯(lián)創(chuàng)Jack Clark公開(kāi)給出了一個(gè)概率:

到2028年底,AI實(shí)現(xiàn)完全遞歸自我改進(jìn)的概率超過(guò)60%。





Sakana AI和UBC的研究團(tuán)隊(duì)今年造出了Darwin G?del Machine,一個(gè)能改寫(xiě)自己源代碼來(lái)提升自身能力的編程智能體。



在SWE-bench上,它的得分從20.0%自我提升到50.0%。全程沒(méi)有人類(lèi)插手。



同一個(gè)團(tuán)隊(duì)的AI Scientist項(xiàng)目今年3月發(fā)表在Nature上。

一整條科研流水線(xiàn),從頭到尾,AI獨(dú)立完成。



再看一組硬數(shù)據(jù)。GPQA Diamond,一個(gè)由博士專(zhuān)家出題的科學(xué)問(wèn)答基準(zhǔn)。2023年11月GPT-4得分39%。人類(lèi)領(lǐng)域?qū)<业钠骄郊s65%。

2026年4月,前沿模型集體越線(xiàn):Gemini 3.1 Pro得分94.3%,Claude Opus 4.7得分94.2%。

所有前沿模型都已遠(yuǎn)遠(yuǎn)甩開(kāi)人類(lèi)博士專(zhuān)家。



SWE-bench的軌跡更能說(shuō)明加速度。



2023年底,Claude 2的通過(guò)率是2%。現(xiàn)在,93.9%。

兩年半,就從2%飆升到了93.9%。

這條曲線(xiàn)畫(huà)出來(lái),任何一個(gè)學(xué)過(guò)高中數(shù)學(xué)的人都認(rèn)識(shí)它的形狀。

顯然,遞歸自我改進(jìn)(RSI)的進(jìn)程已經(jīng)開(kāi)始。

一旦 AI 開(kāi)始用這種 40 倍的效率去改寫(xiě)自己的底層代碼、優(yōu)化自己的架構(gòu),智力的增長(zhǎng)將不再是線(xiàn)性的,而是垂直向上的。



按照 2022 年之前的定義,AGI其實(shí)早已實(shí)現(xiàn)。

之所以現(xiàn)在還沒(méi)人承認(rèn),是因?yàn)檎麄€(gè)AI行業(yè)正在對(duì)公眾進(jìn)行一場(chǎng)集體性的「煤氣燈效應(yīng)」。



2022 年前,只要能通過(guò)圖靈測(cè)試、能跨領(lǐng)域處理任務(wù),就是AGI。

ChatGPT出現(xiàn)后: 「光有這些不行,還得有完美的推理、得有身體(具身性)、得有自我意識(shí)。」

每當(dāng)模型突破一個(gè)關(guān)口,人類(lèi)就會(huì)即興加入新的、虛無(wú)縹緲的指標(biāo)作為門(mén)檻,不斷移動(dòng)球門(mén)。

問(wèn)題是,如果AGI已經(jīng)存在,那么現(xiàn)在的行業(yè)邏輯就變得極其荒誕。

OpenAI 還在籌集 400 億美元聲稱(chēng)要「構(gòu)建 AGI」;Anthropic 每次發(fā)布新模型都要包裝成「接近 AGI」的期貨。



如今,我們正處于一個(gè)極其詭異的節(jié)點(diǎn)。

在實(shí)驗(yàn)室里,AI已經(jīng)用 40 倍速在進(jìn)行機(jī)械解釋性研究,甚至在幫自己寫(xiě)代碼。

在市場(chǎng)上,算力依然是硬通貨,英偉達(dá)的 Blackwell 芯片被瘋搶?zhuān)恳粔K芯片都在加速那個(gè)奇點(diǎn)的到來(lái)。

然而在社會(huì)心理上,大眾還在用「復(fù)讀機(jī)」和「概率預(yù)測(cè)」這種過(guò)時(shí)的詞匯來(lái)安慰自己。

當(dāng) AI 能夠獨(dú)立完成博士級(jí)任務(wù)時(shí),我們現(xiàn)有的教育體系、職稱(chēng)評(píng)定、甚至專(zhuān)家這個(gè)詞本身的含義,都將面臨滅頂之災(zāi)。

正如哥白尼將地球移出了宇宙中心,現(xiàn)在的 AI 正在將人類(lèi)移出「唯一智慧生命」的圣殿。

現(xiàn)在,這場(chǎng)名為智能爆炸的戰(zhàn)爭(zhēng)沒(méi)有硝煙。

我們要么學(xué)會(huì)如何與這種智能新物種共生,要么就只能眼睜睜地看著它,以 40 倍的速度,把我們甩在塵埃里。

聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
香會(huì)上美國(guó)防長(zhǎng)一個(gè)字不提臺(tái)灣,臺(tái)當(dāng)局的尷尬太平洋都裝不下了

香會(huì)上美國(guó)防長(zhǎng)一個(gè)字不提臺(tái)灣,臺(tái)當(dāng)局的尷尬太平洋都裝不下了

浪子的煙火人間
2026-05-31 01:30:03
利物浦臉都綠了!剛炒掉的冠軍主帥,轉(zhuǎn)頭被歐洲豪門(mén)搶著當(dāng)救世主

利物浦臉都綠了!剛炒掉的冠軍主帥,轉(zhuǎn)頭被歐洲豪門(mén)搶著當(dāng)救世主

瀾歸序
2026-05-31 02:44:49
78歲連路都走不穩(wěn)還開(kāi)演唱會(huì),全網(wǎng)罵聲一片,她卻揚(yáng)言回饋粉絲

78歲連路都走不穩(wěn)還開(kāi)演唱會(huì),全網(wǎng)罵聲一片,她卻揚(yáng)言回饋粉絲

二胡的歲月如歌
2026-04-14 18:43:51
“耿同學(xué)”永久限流后,南開(kāi)大學(xué)、中山大學(xué)趁周末接連通報(bào):多人遭免職

“耿同學(xué)”永久限流后,南開(kāi)大學(xué)、中山大學(xué)趁周末接連通報(bào):多人遭免職

藥識(shí)局
2026-05-30 21:11:23
蘋(píng)果五款新品曝光,6 月 9 日正式發(fā)布!

蘋(píng)果五款新品曝光,6 月 9 日正式發(fā)布!

XCiOS俱樂(lè)部
2026-05-30 20:40:52
《真人快打2》女星自曝為角色拼命:毫無(wú)武術(shù)基礎(chǔ),開(kāi)拍前瘋狂特訓(xùn)

《真人快打2》女星自曝為角色拼命:毫無(wú)武術(shù)基礎(chǔ),開(kāi)拍前瘋狂特訓(xùn)

赴一場(chǎng)山海啊
2026-05-30 01:20:38
《主角》大結(jié)局:繞了半輩子,憶秦娥終于回頭,看見(jiàn)老去的劉紅兵

《主角》大結(jié)局:繞了半輩子,憶秦娥終于回頭,看見(jiàn)老去的劉紅兵

君笙的拂兮
2026-05-29 22:24:03
干得太漂亮!馬英九正式提告蕭旭岑,鄭麗文:蕭職務(wù)、業(yè)務(wù)均不變

干得太漂亮!馬英九正式提告蕭旭岑,鄭麗文:蕭職務(wù)、業(yè)務(wù)均不變

小陸搞笑日常
2026-05-30 15:27:35
踩爆大陸底線(xiàn)!鄭麗文稱(chēng)美國(guó)是“恩人”,訪美16天比訪華多三倍

踩爆大陸底線(xiàn)!鄭麗文稱(chēng)美國(guó)是“恩人”,訪美16天比訪華多三倍

無(wú)情有思ss
2026-05-31 02:13:48
解雇斯洛特沒(méi)毛病,但利物浦的決策過(guò)程說(shuō)明了一切

解雇斯洛特沒(méi)毛病,但利物浦的決策過(guò)程說(shuō)明了一切

慢享生活集
2026-05-31 00:23:18
我在非洲干廢品回收,娶了一對(duì)姐妹,年賺三百萬(wàn),如今感覺(jué)快瘋了

我在非洲干廢品回收,娶了一對(duì)姐妹,年賺三百萬(wàn),如今感覺(jué)快瘋了

千秋文化
2026-05-01 19:00:05
兩性關(guān)系:男性過(guò)了75,不管跟誰(shuí)處,牢記4句話(huà),余生少心酸

兩性關(guān)系:男性過(guò)了75,不管跟誰(shuí)處,牢記4句話(huà),余生少心酸

匹夫來(lái)搞笑
2026-05-14 00:32:20
南通新任命兩名副市長(zhǎng)

南通新任命兩名副市長(zhǎng)

黃河新聞網(wǎng)呂梁
2026-05-30 11:22:54
德布勞內(nèi):孔蒂離任讓我由衷高興 我不喜歡保守踢法

德布勞內(nèi):孔蒂離任讓我由衷高興 我不喜歡保守踢法

球事百科吖
2026-05-31 04:17:20
暴漲27倍,一群華人賣(mài)Token:年入22億

暴漲27倍,一群華人賣(mài)Token:年入22億

人人都是產(chǎn)品經(jīng)理社區(qū)
2026-05-29 18:00:01
七年統(tǒng)治夢(mèng)碎!烏克蘭民眾親手選出的總統(tǒng),終于將國(guó)家拖入深淵?

七年統(tǒng)治夢(mèng)碎!烏克蘭民眾親手選出的總統(tǒng),終于將國(guó)家拖入深淵?

阿器談史
2026-05-29 14:13:01
吳簽換了新工種!口紅一哥潛規(guī)則男主播?

吳簽換了新工種!口紅一哥潛規(guī)則男主播?

八卦瘋叔
2026-05-29 11:31:08
國(guó)際奧委會(huì)主席:我不贊成向參加奧運(yùn)會(huì)的運(yùn)動(dòng)員支付報(bào)酬

國(guó)際奧委會(huì)主席:我不贊成向參加奧運(yùn)會(huì)的運(yùn)動(dòng)員支付報(bào)酬

乒乓助手
2026-05-30 00:02:48
高市早苗與菲律賓總統(tǒng)一起唱歌比耶,并問(wèn)“總統(tǒng)先生,要不要幫你介紹個(gè)音樂(lè)公司?”日本網(wǎng)民批:丟人現(xiàn)眼

高市早苗與菲律賓總統(tǒng)一起唱歌比耶,并問(wèn)“總統(tǒng)先生,要不要幫你介紹個(gè)音樂(lè)公司?”日本網(wǎng)民批:丟人現(xiàn)眼

環(huán)球時(shí)報(bào)國(guó)際
2026-05-30 18:28:02
芒果高層聚會(huì)!副臺(tái)長(zhǎng)汪涵腿夾手機(jī)蹺二郎腿,編外人何炅端坐似學(xué)生

芒果高層聚會(huì)!副臺(tái)長(zhǎng)汪涵腿夾手機(jī)蹺二郎腿,編外人何炅端坐似學(xué)生

八卦王者
2026-05-30 14:36:55
2026-05-31 04:35:00
地球記
地球記
科普世界地理知識(shí),有不對(duì)的歡迎指正!
807文章數(shù) 790關(guān)注度
往期回顧 全部

科技要聞

車(chē)圈大佬發(fā)聲:價(jià)格戰(zhàn)遠(yuǎn)去,但競(jìng)爭(zhēng)仍殘酷

頭條要聞

兩名9歲女孩被困電梯近2小時(shí) 求救幾十次物業(yè)無(wú)動(dòng)于衷

頭條要聞

兩名9歲女孩被困電梯近2小時(shí) 求救幾十次物業(yè)無(wú)動(dòng)于衷

體育要聞

歲月不饒人!39歲德約鏖戰(zhàn)近5小時(shí)拼到嘔吐

娛樂(lè)要聞

張碧晨《歌手》 “活人微死” 自嘲

財(cái)經(jīng)要聞

雙匯管不住一頭豬

汽車(chē)要聞

900V+3.2秒破百 領(lǐng)克10+&領(lǐng)克10上市16.99萬(wàn)元起

態(tài)度原創(chuàng)

時(shí)尚
手機(jī)
家居
數(shù)碼
公開(kāi)課

美回巔峰的她們,帶火的這些爆款真的好用嗎

手機(jī)要聞

REDMI K90至尊版入網(wǎng)?K90單品激活破200萬(wàn)

家居要聞

云棲 舒展如流云

數(shù)碼要聞

華擎RX 9070 XT太極十周年版曝光:黑白金配色首次亮相

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版