![]()
來(lái)源:科技日?qǐng)?bào)
記者:張佳欣
在人工智能(AI)競(jìng)逐日益白熱化的今天,OpenAI再次拋出了一個(gè)震撼業(yè)界的宏大藍(lán)圖。近日,OpenAI首席科學(xué)家雅各布·帕喬基在接受《麻省理工科技評(píng)論》獨(dú)家專訪時(shí)透露,他們正瞄準(zhǔn)一個(gè)前所未有的科研目標(biāo):在2028年前,打造一個(gè)能夠自主解決復(fù)雜問(wèn)題的“AI研究員”。
這是一套全自動(dòng)的多智能體研究系統(tǒng),能夠獨(dú)立完成從數(shù)學(xué)、物理到生物、化學(xué),乃至政策分析的各類科研任務(wù)。OpenAI表示,實(shí)現(xiàn)“AI研究員”計(jì)劃是該公司未來(lái)幾年的方向。今年9月,第一階段目標(biāo)將率先落地,屆時(shí),OpenAI將先行推出“自主AI研究實(shí)習(xí)生”。
這一計(jì)劃標(biāo)志著OpenAI在推動(dòng)AI技術(shù)應(yīng)用方面的新嘗試,同時(shí)也是其在面對(duì)Anthropic、“深度思維”等競(jìng)爭(zhēng)對(duì)手時(shí)的重要戰(zhàn)略部署。
“我們正接近這樣一個(gè)階段:我們的模型能夠像人一樣,以連貫的方式無(wú)限期地工作。”帕喬基表示,“當(dāng)然,仍然需要有人負(fù)責(zé)并設(shè)定目標(biāo)。但我認(rèn)為,我們將最終達(dá)到這樣的境界:在數(shù)據(jù)中心里擁有一個(gè)完整的研究實(shí)驗(yàn)室。”
從Codex開始“進(jìn)化”
OpenAI并非在空中樓閣上構(gòu)筑夢(mèng)想。今年1月,OpenAI發(fā)布了Codex,這是一款能即時(shí)生成代碼、執(zhí)行復(fù)雜計(jì)算任務(wù)的智能體應(yīng)用。它能分析文檔、生成圖表、整理郵件和社交媒體摘要等。時(shí)至今日,Codex已經(jīng)成為其內(nèi)部員工的標(biāo)配,輔助開發(fā)代碼并解決問(wèn)題。帕喬基表示,可以把Codex看作是“AI研究員”的雛形。未來(lái),Codex將實(shí)現(xiàn)顛覆性革新。
作為OpenAI首席科學(xué)家和公司長(zhǎng)期研究目標(biāo)的制定者,帕喬基已經(jīng)觀察到,在技術(shù)演進(jìn)上,模型的“長(zhǎng)程工作能力”正隨著參數(shù)規(guī)模和邏輯深度的增加而呈線性提升。
從GPT-3到GPT-4,模型在無(wú)干預(yù)情況下處理復(fù)雜問(wèn)題的時(shí)長(zhǎng)實(shí)現(xiàn)了質(zhì)的飛躍。而2024年推出的“推理模型”技術(shù),通過(guò)引入“思維鏈”訓(xùn)練,讓AI學(xué)會(huì)了像人類一樣步步為營(yíng)、遇錯(cuò)回溯。目前,OpenAI正在利用數(shù)學(xué)和編程競(jìng)賽的難題對(duì)模型進(jìn)行“魔鬼訓(xùn)練”,旨在提升其處理超長(zhǎng)文本和拆解多重子任務(wù)的能力,最終能夠解決現(xiàn)實(shí)世界的科研難題。
帕喬基認(rèn)為,自動(dòng)化科研的關(guān)鍵在于系統(tǒng)能夠長(zhǎng)期運(yùn)行,減少人工干預(yù)。帕喬基解釋說(shuō):“我們的目標(biāo)是開發(fā)一個(gè)研究實(shí)習(xí)生系統(tǒng),可以把本來(lái)需要幾天的人力任務(wù)交給它完成。”通過(guò)訓(xùn)練模型逐步解決問(wèn)題、回溯錯(cuò)誤,推理模型能夠在較長(zhǎng)時(shí)間內(nèi)保持連貫工作。
艾倫人工智能研究所的研究科學(xué)家道格·唐尼表示,自動(dòng)化科研是令人興奮的探索。“想象一下,明天早上我們回到實(shí)驗(yàn)室,智能體已經(jīng)完成了一系列科研工作,并產(chǎn)生可供分析的新結(jié)果,這將極大加速科研進(jìn)程。”
AI科研能力進(jìn)入驗(yàn)證階段
OpenAI目前更專注于與現(xiàn)實(shí)世界相關(guān)的研究。據(jù)介紹,研究人員已經(jīng)利用驅(qū)動(dòng)Codex的GPT-5模型,發(fā)現(xiàn)了多個(gè)未解數(shù)學(xué)問(wèn)題的解決方案,并在生物、化學(xué)和物理學(xué)的若干難題中取得了進(jìn)展。
這種生產(chǎn)力的飛躍,甚至改變了那些最“硬核”程序員的職業(yè)習(xí)慣。帕喬基坦言,由于對(duì)代碼精準(zhǔn)度有著近乎苛刻的追求,他一年前甚至拒絕使用最基礎(chǔ)的自動(dòng)補(bǔ)全功能,更傾向于在Vim編輯器(一款深受資深程序員喜愛的文本編輯器)中手動(dòng)輸入每一個(gè)字符。但隨著模型能力的迭代,他的看法發(fā)生了根本性改變。他發(fā)現(xiàn),盡管復(fù)雜的架構(gòu)設(shè)計(jì)仍需由人主導(dǎo),但在實(shí)驗(yàn)驗(yàn)證階段,AI可以在一個(gè)周末內(nèi)完成他以前需要一周才能編寫完的代碼。
針對(duì)OpenAI樂觀的預(yù)期,學(xué)術(shù)界仍有不同聲音。艾倫人工智能研究所的研究員指出,在去年的測(cè)試中,當(dāng)任務(wù)需要多個(gè)復(fù)雜的邏輯步驟耦合時(shí),現(xiàn)有模型極易因?yàn)槊恳粋€(gè)微小錯(cuò)誤的累積,導(dǎo)致最終結(jié)果崩潰。對(duì)此,OpenAI正在不斷迭代模型,例如近期發(fā)布的GPT-5.4版本,旨在進(jìn)一步增強(qiáng)邏輯穩(wěn)定性和任務(wù)處理的連貫性。OpenAI希望通過(guò)這種不斷地迭代,證明“AI研究員”在真正深度介入現(xiàn)實(shí)世界的科研之前,是具備科學(xué)意義上的可靠性的。
需共同應(yīng)對(duì)“集中化力量”的挑戰(zhàn)
然而,當(dāng)科研的“方向盤”逐漸移交給算法,安全與倫理的圍欄必須同步加固。帕喬基指出,一個(gè)能運(yùn)行整個(gè)研究計(jì)劃的強(qiáng)大AI,可能會(huì)伴隨一些尚未解決的重大問(wèn)題,例如系統(tǒng)失控、遭受黑客攻擊,或者可能僅僅是誤解了自身的指令。為了應(yīng)對(duì)這些挑戰(zhàn),OpenAI正在推廣“思維鏈監(jiān)控”技術(shù),即訓(xùn)練模型在“草稿本”中記錄工作筆記,以便研究人員實(shí)時(shí)審計(jì)其行為是否符合預(yù)期。
帕喬基認(rèn)為,在能夠完全信任這些系統(tǒng)之前,必須設(shè)置嚴(yán)格的限制,例如將極強(qiáng)大的模型部署在與外界隔絕的“沙箱”中。他還提醒道,“想象一下,一個(gè)數(shù)據(jù)中心能完成過(guò)去需要大型組織才能完成的科研工作,而現(xiàn)在可能只需幾個(gè)人”。這種能力集中、影響力巨大的系統(tǒng)將對(duì)社會(huì)和政策帶來(lái)新挑戰(zhàn)。
面對(duì)這種力量的崛起,帕喬基預(yù)測(cè),即使到2028年,AI系統(tǒng)仍不會(huì)在所有方面都像人類一樣聰明,但這并不妨礙它產(chǎn)生巨大的變革作用。這需要社會(huì)、政策制定者和科研機(jī)構(gòu)共同參與監(jiān)管,而非僅靠OpenAI一家公司。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.