網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

OpenAI致力打造自主“AI研究員”

2026-03-30 17:29:25　來(lái)源: 科技導(dǎo)報(bào)

北京舉報(bào)

分享至

來(lái)源：科技日?qǐng)?bào)

記者：張佳欣

在人工智能（AI）競(jìng)逐日益白熱化的今天，OpenAI再次拋出了一個(gè)震撼業(yè)界的宏大藍(lán)圖。近日，OpenAI首席科學(xué)家雅各布·帕喬基在接受《麻省理工科技評(píng)論》獨(dú)家專訪時(shí)透露，他們正瞄準(zhǔn)一個(gè)前所未有的科研目標(biāo)：在2028年前，打造一個(gè)能夠自主解決復(fù)雜問(wèn)題的“AI研究員”。

這是一套全自動(dòng)的多智能體研究系統(tǒng)，能夠獨(dú)立完成從數(shù)學(xué)、物理到生物、化學(xué)，乃至政策分析的各類科研任務(wù)。OpenAI表示，實(shí)現(xiàn)“AI研究員”計(jì)劃是該公司未來(lái)幾年的方向。今年9月，第一階段目標(biāo)將率先落地，屆時(shí)，OpenAI將先行推出“自主AI研究實(shí)習(xí)生”。

這一計(jì)劃標(biāo)志著OpenAI在推動(dòng)AI技術(shù)應(yīng)用方面的新嘗試，同時(shí)也是其在面對(duì)Anthropic、“深度思維”等競(jìng)爭(zhēng)對(duì)手時(shí)的重要戰(zhàn)略部署。

“我們正接近這樣一個(gè)階段：我們的模型能夠像人一樣，以連貫的方式無(wú)限期地工作。”帕喬基表示，“當(dāng)然，仍然需要有人負(fù)責(zé)并設(shè)定目標(biāo)。但我認(rèn)為，我們將最終達(dá)到這樣的境界：在數(shù)據(jù)中心里擁有一個(gè)完整的研究實(shí)驗(yàn)室。”

從Codex開始“進(jìn)化”

OpenAI并非在空中樓閣上構(gòu)筑夢(mèng)想。今年1月，OpenAI發(fā)布了Codex，這是一款能即時(shí)生成代碼、執(zhí)行復(fù)雜計(jì)算任務(wù)的智能體應(yīng)用。它能分析文檔、生成圖表、整理郵件和社交媒體摘要等。時(shí)至今日，Codex已經(jīng)成為其內(nèi)部員工的標(biāo)配，輔助開發(fā)代碼并解決問(wèn)題。帕喬基表示，可以把Codex看作是“AI研究員”的雛形。未來(lái)，Codex將實(shí)現(xiàn)顛覆性革新。

作為OpenAI首席科學(xué)家和公司長(zhǎng)期研究目標(biāo)的制定者，帕喬基已經(jīng)觀察到，在技術(shù)演進(jìn)上，模型的“長(zhǎng)程工作能力”正隨著參數(shù)規(guī)模和邏輯深度的增加而呈線性提升。

從GPT-3到GPT-4，模型在無(wú)干預(yù)情況下處理復(fù)雜問(wèn)題的時(shí)長(zhǎng)實(shí)現(xiàn)了質(zhì)的飛躍。而2024年推出的“推理模型”技術(shù)，通過(guò)引入“思維鏈”訓(xùn)練，讓AI學(xué)會(huì)了像人類一樣步步為營(yíng)、遇錯(cuò)回溯。目前，OpenAI正在利用數(shù)學(xué)和編程競(jìng)賽的難題對(duì)模型進(jìn)行“魔鬼訓(xùn)練”，旨在提升其處理超長(zhǎng)文本和拆解多重子任務(wù)的能力，最終能夠解決現(xiàn)實(shí)世界的科研難題。

帕喬基認(rèn)為，自動(dòng)化科研的關(guān)鍵在于系統(tǒng)能夠長(zhǎng)期運(yùn)行，減少人工干預(yù)。帕喬基解釋說(shuō)：“我們的目標(biāo)是開發(fā)一個(gè)研究實(shí)習(xí)生系統(tǒng)，可以把本來(lái)需要幾天的人力任務(wù)交給它完成。”通過(guò)訓(xùn)練模型逐步解決問(wèn)題、回溯錯(cuò)誤，推理模型能夠在較長(zhǎng)時(shí)間內(nèi)保持連貫工作。

艾倫人工智能研究所的研究科學(xué)家道格·唐尼表示，自動(dòng)化科研是令人興奮的探索。“想象一下，明天早上我們回到實(shí)驗(yàn)室，智能體已經(jīng)完成了一系列科研工作，并產(chǎn)生可供分析的新結(jié)果，這將極大加速科研進(jìn)程。”

AI科研能力進(jìn)入驗(yàn)證階段

OpenAI目前更專注于與現(xiàn)實(shí)世界相關(guān)的研究。據(jù)介紹，研究人員已經(jīng)利用驅(qū)動(dòng)Codex的GPT-5模型，發(fā)現(xiàn)了多個(gè)未解數(shù)學(xué)問(wèn)題的解決方案，并在生物、化學(xué)和物理學(xué)的若干難題中取得了進(jìn)展。

這種生產(chǎn)力的飛躍，甚至改變了那些最“硬核”程序員的職業(yè)習(xí)慣。帕喬基坦言，由于對(duì)代碼精準(zhǔn)度有著近乎苛刻的追求，他一年前甚至拒絕使用最基礎(chǔ)的自動(dòng)補(bǔ)全功能，更傾向于在Vim編輯器（一款深受資深程序員喜愛的文本編輯器）中手動(dòng)輸入每一個(gè)字符。但隨著模型能力的迭代，他的看法發(fā)生了根本性改變。他發(fā)現(xiàn)，盡管復(fù)雜的架構(gòu)設(shè)計(jì)仍需由人主導(dǎo)，但在實(shí)驗(yàn)驗(yàn)證階段，AI可以在一個(gè)周末內(nèi)完成他以前需要一周才能編寫完的代碼。

針對(duì)OpenAI樂觀的預(yù)期，學(xué)術(shù)界仍有不同聲音。艾倫人工智能研究所的研究員指出，在去年的測(cè)試中，當(dāng)任務(wù)需要多個(gè)復(fù)雜的邏輯步驟耦合時(shí)，現(xiàn)有模型極易因?yàn)槊恳粋€(gè)微小錯(cuò)誤的累積，導(dǎo)致最終結(jié)果崩潰。對(duì)此，OpenAI正在不斷迭代模型，例如近期發(fā)布的GPT-5.4版本，旨在進(jìn)一步增強(qiáng)邏輯穩(wěn)定性和任務(wù)處理的連貫性。OpenAI希望通過(guò)這種不斷地迭代，證明“AI研究員”在真正深度介入現(xiàn)實(shí)世界的科研之前，是具備科學(xué)意義上的可靠性的。

需共同應(yīng)對(duì)“集中化力量”的挑戰(zhàn)

然而，當(dāng)科研的“方向盤”逐漸移交給算法，安全與倫理的圍欄必須同步加固。帕喬基指出，一個(gè)能運(yùn)行整個(gè)研究計(jì)劃的強(qiáng)大AI，可能會(huì)伴隨一些尚未解決的重大問(wèn)題，例如系統(tǒng)失控、遭受黑客攻擊，或者可能僅僅是誤解了自身的指令。為了應(yīng)對(duì)這些挑戰(zhàn)，OpenAI正在推廣“思維鏈監(jiān)控”技術(shù)，即訓(xùn)練模型在“草稿本”中記錄工作筆記，以便研究人員實(shí)時(shí)審計(jì)其行為是否符合預(yù)期。

帕喬基認(rèn)為，在能夠完全信任這些系統(tǒng)之前，必須設(shè)置嚴(yán)格的限制，例如將極強(qiáng)大的模型部署在與外界隔絕的“沙箱”中。他還提醒道，“想象一下，一個(gè)數(shù)據(jù)中心能完成過(guò)去需要大型組織才能完成的科研工作，而現(xiàn)在可能只需幾個(gè)人”。這種能力集中、影響力巨大的系統(tǒng)將對(duì)社會(huì)和政策帶來(lái)新挑戰(zhàn)。

面對(duì)這種力量的崛起，帕喬基預(yù)測(cè)，即使到2028年，AI系統(tǒng)仍不會(huì)在所有方面都像人類一樣聰明，但這并不妨礙它產(chǎn)生巨大的變革作用。這需要社會(huì)、政策制定者和科研機(jī)構(gòu)共同參與監(jiān)管，而非僅靠OpenAI一家公司。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.