你敢信嗎?博士埋頭苦干80小時的科研任務,AI只用1小時56分鐘就完美交差了!
![]()
效率差足足40倍!
![]()
最近Agentic AI工程師Dan McAteer在X上披露的這個實驗,直接炸了整個學術界——科研界的“奇點”,可能比我們想的還要近得多。
![]()
這次實驗用的是OpenAI Codex的Goal Mode,搭配GPT-5.5 high和fast mode。
普通AI是你說一句它做一步,像個聽話的工具人;但Goal Mode完全不一樣:你給個大目標,它自己拆成小任務,自己執行、自己檢查、自己調整,直到完成目標才停下。
就像給AI配了個“自動導航”,不用你一步步指揮,它自己就能跑完整個科研流程。
Dan McAteer甚至說,這套配置是“當今最高效的AI智能體配置”——因為AI寫的提示詞,可能比人類還出色。
![]()
但AI用Goal Mode,直接把周期從“周”縮到“小時”。
更可怕的是,它不是簡單幫你干活,而是像個獨立研究員一樣出策略:理解復雜的機械可解釋性需求,自主拆解任務,甚至能修正假設、重復實驗。
這意味著,曾經需要多年寒窗苦讀的專業分析能力,正在被AI模塊化。
科研門檻,正在肉眼可見地崩塌。
如果說40倍速只是個案,那更讓人坐不住的是“遞歸自我改進”的證據正在密集涌現。
Anthropic聯創Jack Clark公開說,到2028年底AI實現完全遞歸自我改進的概率超過60%。
![]()
![]()
再看硬數據:GPQA Diamond基準(博士專家出題),去年11月GPT-4才39%,現在Gemini 3.1 Pro和Claude Opus 4.7都超過94%,甩人類博士幾條街;
SWE-bench通過率從2%飆升到93.9%,這條曲線簡直是垂直向上!
為什么沒人承認?因為全行業在“移動球門”——以前圖靈測試+跨領域任務就是AGI,ChatGPT出來后又加了完美推理、具身性、自我意識這些新指標。
這就像把已經賣給你的東西,重新包裝成“未來新品”再賺一遍錢。
現在的情況很詭異:實驗室里AI用40倍速搞科研,英偉達Blackwell芯片被瘋搶加速奇點;但大眾還在用“復讀機”“概率預測”這些過時詞匯安慰自己。
如果AI繼續這樣發展,人類幾千年的知識總量可能幾個月就翻倍,教育體系、職稱評定、“專家”這個詞的含義都要變。
哥白尼把地球移出宇宙中心,現在AI把人類移出“唯一智慧生命”的圣殿。
你覺得AI會徹底取代科研人員嗎?或者你身邊有AI改變工作的例子?
評論區聊聊你的看法,覺得這篇內容有價值的話,別忘了點贊收藏轉發給朋友!
畢竟,在智能爆炸的前夜,我們每個人都該看清正在發生的變化。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.