OpenAI 最近很動蕩,模型能力被吐槽、多位高管離職,眼瞅著要被 Anthropic 各種超越了。
當(dāng)然他們也有各種動作,GPT 5.5 據(jù)說很快要發(fā)布,產(chǎn)品側(cè) ChatGPT、Atlas、Codex 據(jù)說要合體。
也因此,Sam Altman、Greg Brockman 這次一起出席的這期播客,更為值得一看。這也是 OpenAI 成立 10 年來,兩位聯(lián)合創(chuàng)始人,Sam Altman、Greg Brockman,首次在播客中一同接受采訪。
在「Core Memory Podcast」上,兩人聊了一個多小時,談到了近期的產(chǎn)品戰(zhàn)略調(diào)整、最新發(fā)布的圖像生成模型 ChatGPT Images 2.0,以及 OpenAI 目前的戰(zhàn)略優(yōu)先級。
在對談中,Sam Altman 提到,「砍掉 Sora 不是因為它不好,是因為它在另一個技術(shù)分支上,和 GPT 系列沒有統(tǒng)一,使用場景也不在核心路徑上。」
OpenAI 現(xiàn)在的三大優(yōu)先級是:構(gòu)建極致的 Agent 平臺、推出面向所有人的 Codex、以及實現(xiàn) Personal AGI。
其中,實現(xiàn) Personal AGI 是 OpenAI 內(nèi)部現(xiàn)在的目標(biāo)。「很快會有一個模型真正了解你的所有上下文。它知道你是誰,知道你的生活,知道你在做什么、在乎什么,知道你生活中的人。它能訪問你的電腦和瀏覽器。這將徹底改變使用電腦和使用 AI 的感受。」
此外,Greg Brockman 提到,算力是機會,也是一門生意。「OpenAI的商業(yè)模式極其簡單,租或買算力,加利潤率賣出去。需求無限,只要有正毛利就能無限擴展。算力對我們來說不是成本中心,是利潤中心。」
以下是訪談的精華內(nèi)容。
??關(guān)注 Founder Park,最及時最干貨的創(chuàng)業(yè)分享
Founder Park 正在持續(xù)尋找值得被看見的 AI 團隊與項目。
我們將通過「AI 產(chǎn)品市集」、內(nèi)容報道、社群分發(fā)等方式,幫你觸達(dá)早期用戶、獲得真實反饋,以及建立關(guān)鍵連接。
如果你正在做 AI 相關(guān)的事,歡迎和我們聊聊。
01十年搭檔,分歧才是讓我們強大的原因
主持人:你們是OpenAI僅剩的兩位創(chuàng)始人搭檔,我很好奇這十年你們之間的關(guān)系是怎么樣的?
Brockman:在一個充滿混亂、戲劇性、權(quán)力斗爭的世界里,有一個擁有完整上下文的人可以依靠,這是 OpenAI 最珍貴的事情之一。
OpenAI 真正意義上的第一個時刻,是 2015 年 7 月那頓晚餐之后。Sam 和我一起開車回城,看著對方說:「我們必須做這件事。」當(dāng)時大家一直在討論,現(xiàn)在再創(chuàng)辦一個 AGI 實驗室是不是太晚了。
Altman:現(xiàn)在回想起來太荒謬了,我們居然那么擔(dān)心太晚了。
Brockman:那頓晚餐的結(jié)論是:這件事并不是不可能。而且我們都覺得,這太重要了,必須去做。
我當(dāng)時沒工作,所以第二天就全職投入了。Sam 當(dāng)時還有正職(Y Combinator 總裁),但我們每天至少打 5 個電話。這種節(jié)奏一直保持到現(xiàn)在。每天保持同步,每次兩三分鐘、五分鐘。我們并不總是意見一致,但這恰恰是我們強大的原因。
Sam 會提出一個想法,我會想「也許我們可以換個角度」或者「這跟我們在想的另一件事有什么關(guān)系」。我特別欣賞 Sam 的一點是,他總能看到不同想法之間的關(guān)聯(lián),始終聚焦在大圖景上。然后我們一起想辦法怎么落地。把宏大愿景和執(zhí)行連接起來,這是 OpenAI 一直以來最突出的特質(zhì)。
主持人:十年里,你們在哪些關(guān)鍵問題上產(chǎn)生過最大分歧?
Altman:Greg 做得最好的一件事,就是不斷推動聚焦,這是我不太擅長做的。他會問:「這是最重要的事嗎?」有時候我想做更多的事,Greg 就會把公司拉回來。這對 OpenAI 非常重要。
Brockman:反過來說,Sam 在算力上不斷提高野心。有時候我覺得我們已經(jīng)有這么多大型計算集群了,還在部署中,已經(jīng)忙不過來了。然后 Sam 說:還要更多。你需要在細(xì)節(jié)中游泳,但不能被細(xì)節(jié)淹沒。這種平衡是 OpenAI 走到今天的關(guān)鍵。
02砍掉 Sora,第一優(yōu)先級是構(gòu)建 Agent 平臺
主持人:最近OpenAI做了很多聚焦和裁撤。什么留下了?什么被砍了?為什么?
Altman:Greg 最近接管了產(chǎn)品和研究整合的工作。他才上任幾周,但公司內(nèi)部的能量和興奮感是難以置信的。
Brockman:我們現(xiàn)在清楚地處在向 Agent 轉(zhuǎn)型的時刻。在軟件工程領(lǐng)域,過去六個月大家已經(jīng)感受到了這個變化:從自動補全,到編輯器側(cè)邊欄,到現(xiàn)在,你真正需要的是像 Codex 這樣的 Agent 管理平臺,Agent 處理所有細(xì)節(jié)和具體代碼,人類負(fù)責(zé)大約 20% 的高層架構(gòu)決策。
目前,我們的三大優(yōu)先級是:
第一,構(gòu)建極致的 Agent 平臺。這是第一優(yōu)先級。模型已經(jīng)從「就是產(chǎn)品本身」轉(zhuǎn)變?yōu)椤府a(chǎn)品的一部分」。以前模型上面只有一層很薄的軟件,現(xiàn)在是一層很厚的軟件,skill、連接器、計算機操作、上下文管理、記憶。這就像我們有了大腦(模型),現(xiàn)在在造身體。兩者都很難,必須協(xié)同設(shè)計。
第二,把 Agent 應(yīng)用到所有「computer work」上。我特意用 computer work 而不是「知識工作」,是因為沒人覺得自己是「知識工作者」,但每個人都在做大量電腦工作:坐在桌前、弓著背、敲鍵盤。Codex 不再只是給軟件工程師的,而是給所有人的。而且不只是軟件,我們對每一個垂直行業(yè)都看到了清晰的路徑:法律、金融、寫作、做表格、做 PPT,甚至一些機械性的技能。
方法論很明確:跟領(lǐng)域?qū)<液献鳎a(chǎn)評估數(shù)據(jù),生產(chǎn)訓(xùn)練數(shù)據(jù),讓 AI 把它強大的領(lǐng)域知識真正應(yīng)用到這些垂直場景里、積累經(jīng)驗、學(xué)會什么叫「做得好」。
第三,Personal AGI。ChatGPT 現(xiàn)在有 10 億用戶,最終地球上每個人都會想要一個代表自己的 AI,它有你的上下文,你信任它,它不僅僅是你一對一交談的對象,還能在外面替你做事。比如它知道你喜歡某個音樂人,發(fā)現(xiàn)這個人要來你所在的城市,有很便宜的好票,它就直接幫你買了。它知道跟你的信任度已經(jīng)到了可以直接行動的程度,或者它會說「我不太確定,我還是先問問你」。
主持人:Sora 呢?
Brockman:Sora 是最明顯被砍掉的。原因是它在另一棵技術(shù)樹上,驅(qū)動 Sora 的模型跟核心 GPT 系列沒有統(tǒng)一,使用場景也不在我們的核心路徑上。團隊做了很出色的工作,這項技術(shù)會以其他方式延續(xù),但它不符合我們接下來 3 到 12 個月要交付的產(chǎn)品矩陣。
主持人:砍掉 Sora 是不是也為了騰出算力?有媒體報道說,它消耗了大量算力。
Brockman:這個領(lǐng)域里任何成功的東西都會消耗大量算力。但我想說一點:算力對我們來說不是成本中心,是利潤中心。當(dāng)你把算力部署到產(chǎn)品中去的時候。我們的生意其實極其簡單,我們租或買算力,然后加上利潤率賣出去。只要有正利潤率,就能無限擴展,因為需求是無限的。
主持人:但外界報道說你們在縮減 Stargate 的基礎(chǔ)設(shè)施投入。
Altman:我不知道這種報道從哪來的。可能某個具體站點只有風(fēng)冷,對我們不如另一個站點有價值,這種調(diào)整是有的。但媒體總想寫「縮減」的故事。很快它們又會寫「OpenAI 太魯莽了怎么能花這么多錢」。我們會繼續(xù)盡最大可能地建設(shè)算力。
主持人:自研芯片呢?數(shù)據(jù)中心硬件還在全力推進(jìn)嗎?
Altman:對我們的芯片非常興奮。我們的團隊非常出色。
主持人:機器人、瀏覽器、超級 App 這些呢?
Altman:超級 App、瀏覽器,都在繼續(xù)。社交網(wǎng)絡(luò),不做。機器人,距離那個「ChatGPT 時刻」還要一段時間,但方向非常明確。
Brockman:「超級 App」是我們的內(nèi)部簡稱,有時候我們跟團隊溝通的話傳出去,就變成了對外傳播,但本意并不相同。它真正的含義是統(tǒng)一的 Agent 基礎(chǔ)設(shè)施。你會看到 Codex 應(yīng)用本身的升級,讓 Codex 面向所有人。
很多人問我們怎么看 To C 和 To B。答案是:如果按現(xiàn)有的定義,兩個我們都非常重視。但這兩個詞的含義會發(fā)生改變和模糊。我們即將釋放新一波創(chuàng)業(yè)浪潮,小公司能夠獲得以前不可能的收入規(guī)模。這個趨勢已經(jīng)存在一段時間了,只是會急劇加速。這算 To B 還是 To C?都不算。所以我們真正聚焦的是:在所有場景下幫用戶達(dá)成目標(biāo)。這是我們看一切的鏡頭。
主持人:砍掉這么多東西,是因為業(yè)務(wù)約束了你們的野心?
Altman:這種說法很奇怪。我不覺得被業(yè)務(wù)約束了,我覺得是被業(yè)務(wù)賦能了。正是因為有了這個不可思議的收入引擎,我們才能說服所有人我們需要這么多算力。沒有這個收入,沒有人會相信我們該拿到這些算力。
03AI 的能力邊界是鋸齒狀的
主持人:我是做文字出身的,但 AI 的寫作到現(xiàn)在還是沒有靈魂。這讓我忍不住懷疑:LLM 真的能到達(dá)你們描述的那個未來嗎?
Altman:LLM 能到達(dá)那里。但你要把它理解為能力邊界是鋸齒狀的。
Brockman:你看,就在過去幾天,我們的 AI 解決了一個長期懸而未決的數(shù)學(xué)問題。陶哲軒也在說,這似乎揭示了不同數(shù)學(xué)領(lǐng)域之間一種此前未被發(fā)現(xiàn)的聯(lián)系。我們開始從這些機器里看到真正的美。
你想想 AlphaGo 的第 37 手,不僅僅是一步深刻的棋,它改變了人們對圍棋的理解,甚至讓更多人開始下圍棋。我們正在構(gòu)建的東西也會是這樣的。
主持人:推理模型和深度研究我承認(rèn)很驚艷,確實幫我省了大量時間。但寫作呢?你們當(dāng)初承諾過 GPT-5 會寫得很好。
Brockman:從技術(shù)上講,我們的技術(shù)分兩步。第一步是無監(jiān)督學(xué)習(xí),模型看遍所有公開數(shù)據(jù),學(xué)會預(yù)測下一個詞會是什么。第二步是強化學(xué)習(xí),模型真正去嘗試各種想法,然后根據(jù)表現(xiàn)得到正面或負(fù)面的信號。不是在懲罰它,就是一個信號。
難點在于「如何評判」。數(shù)學(xué)和科學(xué)有明確的對錯,但開放性領(lǐng)域,比如寫作,判斷的標(biāo)準(zhǔn)要模糊得多。我們正在擴展可以被評分的任務(wù)集合,AI 自身也越來越擅長提供這種獎勵信號。這些東西其實很多可以追溯到 OpenAI 最初的構(gòu)想,我們當(dāng)時就有一幅圖景是這么走的。但我承認(rèn)我們確實還需要更多進(jìn)展。
在這個領(lǐng)域,不要看當(dāng)前位置,要看斜率,而且要把它擬合到一條指數(shù)曲線上。我認(rèn)為我們對如何改進(jìn)每一個應(yīng)用場景,都有清晰的路線。
Altman:這里有一個內(nèi)在挑戰(zhàn)是,你想要的寫作風(fēng)格跟大多數(shù)人想要的完全不同。我們必須做一個 10 億人都覺得好用的模型。我們真正想做的是讓個性化好到這種程度,你覺得它是個好作家,另一個生活和需求完全不同的人也覺得它是個好作家。
我們還沒有嘗試讓模型成為「Ashlee Vance 認(rèn)為的好作家」。我們一直在嘗試讓它解決全世界最聰明的數(shù)學(xué)家都解不了的開放問題。
Brockman:順便說一下,我們在這個維度上也有新模型即將發(fā)布。
主持人:Greg 提到的新圖像模型,它能做什么?
Altman:它能生成極其出色的圖像。
主持人:文字渲染也行嗎?因為我一直在試著用 AI 做 Core Memory 的周邊設(shè)計。
Altman:很快,再試試。團隊這次做得非常好。
但我想先說一個容易被忽略的事實。ChatGPT 遠(yuǎn)不是我們做過的最令人印象深刻的技術(shù)。在它之前,我們贏了電子游戲競賽,有了能用一只手解魔方的機器人,做了各種令人驚嘆的事。《紐約時報》都報道了,我們覺得自己做得挺棒。但說實話,沒有人在意,那些東西沒有產(chǎn)生任何實際影響。
然后我們發(fā)布了 ChatGPT,一旦人們能親手感受到它,反應(yīng)就是:「好吧,我理解了。」編程模型也一樣。Greg 說的那個故事就很典型:他一個朋友的姐姐在描述一個她希望有人做出來的 App,朋友一邊聽一邊把她說的話打進(jìn) Codex,幾小時后把結(jié)果給她看,就是她描述的那個東西。她問:「這誰做的?」他說:「你做的。」每個人都會經(jīng)歷這種 aha 時刻。
再說一個更大的現(xiàn)象。當(dāng)我們把 GPT-4 放進(jìn) ChatGPT 的時候,很多我認(rèn)識的聰明人說:「這就是 AGI 了。不需要更聰明,只要更便宜就行。」現(xiàn)在你回去用 2023 年 3 月版本的 GPT-4,你會覺得:這也太差了。但當(dāng)時人們覺得問題已經(jīng)解決了,通過了圖靈測試,不可能更好了。
這種模式反復(fù)出現(xiàn):世界覺得你做了一個很棒的東西,已經(jīng)到頭了。然后每個月或每個季度,能力和期望值都以巨大的幅度提升。
而且現(xiàn)在的模型相對于未來還是很笨的,更關(guān)鍵的是,它們對你的生活幾乎一無所知。你還在不斷地引導(dǎo)它們、哄它們、嘗試讓它們做你想要的事情。
其實我們已經(jīng)不遠(yuǎn)了,很快會有一個模型真正了解你的所有上下文。它知道你是誰,知道你的生活,知道你在做什么、在乎什么,知道你生活中的人。它能訪問你的電腦和瀏覽器。那將徹底改變使用電腦和使用 AI 的感受。
04在風(fēng)險升高的過程中,讓產(chǎn)品變得越來越安全
主持人:你們現(xiàn)在談?wù)摪踩蛯R的方式,跟 2022、2023 年相比已經(jīng)完全變了。如果能重來,你們會做什么不同的選擇?
Altman:甚至在談安全之前,我覺得我們作為技術(shù)極客,犯了一個錯誤:我們總是說「我們要構(gòu)建超級智能……它會對你很好」,但中間的省略號從來沒填上過。
很多人現(xiàn)在的反應(yīng)是:「好吧,看起來你們確實要造出這個東西了。但我為什么要它?它能給我什么?」行業(yè)說的「它會治愈癌癥,你會很開心」,顯然沒有引起共鳴。
我認(rèn)為人們真正想要的是:繁榮、主體性,以及繼續(xù)擁有有意義的工作。我最近看到一篇帖子讓我印象深刻,講的是「逆境的權(quán)利」,人們實際上需要挑戰(zhàn),你不想每天都完美、所有事都被代勞。
當(dāng)我跟學(xué)齡期孩子的家長聊天,他們最常問的是「我孩子應(yīng)該學(xué)什么?」但他們真正想問的是:「我的孩子在這個新世界里怎么擁有一個充實的人生?」你可以從經(jīng)濟角度回答,但并不能真正安撫他們。
Brockman:我們其實有很多視角可以貢獻(xiàn)。在 ChatGPT 上,有無數(shù)用戶告訴我們,他們自己或家人的生命因為 ChatGPT 提供的信息而被挽救。有一個家庭,孩子一直嚴(yán)重頭痛,保險公司拒絕給他做 MRI。他們用 ChatGPT 研究癥狀,據(jù)理力爭拿到了 MRI 授權(quán)。結(jié)果發(fā)現(xiàn)是腦瘤,及時干預(yù)救了命。這個家庭說:「沒有 ChatGPT,我們完全不知道該怎么辦。」
人們更容易注意到什么在消失,但更難看到的是什么在到來。這是我們越來越意識到需要講清楚的事情。
Altman:關(guān)于安全,我們以前被這個領(lǐng)域的傳統(tǒng)框架裹挾了。我們從來在安全的重要性上沒有過分歧,但這個領(lǐng)域與安全的關(guān)系一直很扭曲,安全在多大程度上變成了關(guān)于權(quán)力,而不是真正保障安全?
Greg 在這件事上非常堅定:我們不能落入傳統(tǒng)的恐懼框架。我認(rèn)為OpenAI迄今為止最大的貢獻(xiàn)之一,就是找到了一種不同的方式來談?wù)摪踩?/strong>不僅僅是構(gòu)建產(chǎn)品和部署產(chǎn)品的方式,還有「迭代部署」的整個理念:在風(fēng)險逐步升高的過程中,讓產(chǎn)品變得越來越安全。Greg 在巨大的壓力下堅守了這條線,這對我們的整個戰(zhàn)略都至關(guān)重要,不僅是我們怎么說,更多是我們怎么構(gòu)建和發(fā)布產(chǎn)品。
Brockman:你看 OpenAI 基金會,也就是管理 OpenAI 的非營利機構(gòu),它的核心支柱之一叫「AI 韌性」(AI resilience)。這個詞的真正含義是:怎么讓 AI 成為對世界有正面意義的東西。答案不是某一個單點干預(yù),不是說你有了思維鏈監(jiān)控就算完成使命了。它必須是一整套深層的、社會層面的調(diào)整,是整個世界圍繞這項技術(shù)的重新定位。
這個視角在我們十年前剛開始的時候完全不被理解。很容易掉進(jìn)一個思維陷阱:我們是技術(shù)人員,在造技術(shù),技術(shù)就是唯一需要解決的問題。但你不可能靠一篇論文就解決「AGI 對世界有利」這個問題。這必須是一個全球性的努力,來自社會各方的貢獻(xiàn)。
我們花了大量時間去做第一性原理思考:怎樣才能把變革性的技術(shù)以真正幫助人們?nèi)粘I畹姆绞浇桓冻鋈ィ磕銜庾R到一個道理,如果你手里有一項非常強大的、會改變世界的技術(shù),那么在此之前先用一項不那么強大的技術(shù),已經(jīng)幫世界做出了正面改變,事情大概率會順利得多。一旦你這樣想,你就會自然而然地走向韌性思維、走向迭代部署。
Brockman:回頭看,早期的恐懼?jǐn)⑹赂覀儺?dāng)時設(shè)想的技術(shù)路線有關(guān)。2017、2018 年,我們腦中構(gòu)建 AGI 的畫面是競爭式多智能體模擬,想象一座島上有一千個 Agent,它們互相戰(zhàn)斗、爭奪生存和復(fù)制權(quán)。你可以想象,如果往里面砸足夠多的算力,也許能產(chǎn)出某種非常聰明的東西。但那個東西不會與人類價值觀有任何聯(lián)系。你甚至需要一個額外的步驟來搞清楚怎么跟它對話,它沒有語言概念,沒有任何與我們現(xiàn)實世界的連接,只是「聰明且強大」。那是一個非常可怕的系統(tǒng)。你的出發(fā)點就是試圖弄清楚怎么可能對齊它。
但后來我們走上了語言模型路線,這條路線扎根于人類價值觀,扎根于對人類的理解。我們有思維鏈可以監(jiān)控,如果技術(shù)方向正確,你有可能讓它「忠實地」反映 AI 真正的內(nèi)部推理過程。這是一條完全不同的技術(shù)路徑,也是一條樂觀得多的路徑。
Brockman:再說一件事來說明我們?yōu)槭裁磳ΜF(xiàn)在的方向這么興奮。
我們曾經(jīng)有一個 20 人的團隊,花兩周時間、大量算力,專門訓(xùn)練模型去參加計算競賽,拿了銅牌。而現(xiàn)在,有人隨手用 GPT-5.4 Pro 指向一個問題,就解決了 Erd?s 猜想。
如果你把同樣的能力指向藥物發(fā)現(xiàn)呢?如果你真的把那 20 個人和所有算力投入到科學(xué)發(fā)現(xiàn)呢?現(xiàn)在沒有人在為這種可能性定價。
所以當(dāng)人們問「你們砍掉了 Sora 去做什么」,答案是我們在抓住這個 Agent 的時刻,同時為更強大的模型鋪路。我們不僅要做幾個標(biāo)桿 Agent,Codex 就是其中之一,還要建生態(tài),如果你是開發(fā)者,你應(yīng)該能構(gòu)建自己的 Agent,用在你關(guān)心的特定問題上。
05AI 本質(zhì)上是機會,但前提是你得有訪問權(quán)
主持人:即使一切順利,最聰明的人開發(fā)出這些技術(shù),感覺它還是會不成比例地讓少數(shù)人受益。雖然每個人可能都會被抬升一點,但差距只會更極端。
Altman:那用不那么官方的表述,說下我能看到幾種未來。第一種:地板會大幅抬升,每個人主觀上覺得自己富了 10 倍,物質(zhì)極大豐裕。但同時,那些真正學(xué)會使用 Agent、有大量算力的人,我們會出現(xiàn)萬億富翁,也許 10 個。所以地板大幅上升,但因為這是一個人可以真正利用的杠桿,不平等也變得更嚴(yán)重。
第二種:通過各種手段,地板沒上升那么多,但不平等也沒那么大。也許十年后人們覺得自己富了 2 倍,但基尼系數(shù)下來了。
我和 Greg 覺得人們顯然應(yīng)該更想要第一種。但在情感上,很多人不在那個位置。
主持人:前幾天我們吃飯,你描述自己怎么用 Agent 工作,我說實話,有點被嚇到了。我突然意識到:會有一批人因此變成某種意義上的「超級人類」。這種感覺讓我很不安。
Altman:他們真正恐懼的是:如果我們放任不平等,這個工具的復(fù)利效應(yīng)是我們還不理解的。
但不管選哪種未來,有一點應(yīng)該是所有人的共識:需要更多算力、更多基礎(chǔ)設(shè)施,以及盡可能便宜的 AI 訪問。否則就是在加劇不平等,如果 AI 是有限資源,價格被供需推高,只有富人能用。
Brockman:我想在 Sam 說的基礎(chǔ)上延伸。他列了兩個選項,但我當(dāng)時的反應(yīng)是:這就是僅有的兩個選項嗎?有沒有我們沒看到的第三條路?
Sam 最后說的那一點恰恰是解鎖思路的關(guān)鍵,AI 本質(zhì)上是機會。但前提是你有訪問權(quán)。如果你沒有算力,再擅長使用 Agent 也沒用。
OpenAI 基金會(OpenAI Foundation)持有公司大約 25% 到 30% 的股權(quán),價值超過 1500 億美元。如果 OpenAI 成功,所有這些價值都鎖在非營利架構(gòu)里,用于造福世界。
我那一代人用電腦比父母強太多了,因為我們是「數(shù)字原住民」。而現(xiàn)在正在成長的這一代人使用 Agent 的能力會比我強 10 倍。
06在編程領(lǐng)域,確實比 Anthropic 慢了一步
主持人:有些模型現(xiàn)在被認(rèn)為太強大了,只對特定公司開放。Claude 和 Mythos 引起了很大爭議。你們怎么看?
Altman:世界上一直有人想把 AI 控制在少數(shù)人手里。你可以用很多方式為此辯護,其中一些是真實的安全考量。但如果你真正想要的是「我們需要控制 AI,只有我們是值得信任的人」,那么恐懼營銷大概是為此辯護最有效的方式。
這種營銷本質(zhì)上是在說:「我們造了一顆炸彈,馬上要扔到你頭上。花 1 億美元我們賣你一個防空洞。你需要買,但前提是我們選中你做客戶。」
這并不意味著每種情況下都沒有合理性。但我們一直在網(wǎng)絡(luò)安全方面有應(yīng)對框架,一直在構(gòu)建緩解措施,如何發(fā)布、如何通過「可信訪問計劃」分層部署、如何把更強的模型逐步交到所有人手里。
主持人:在編程這個維度上,你們跟 Anthropic 的競爭怎么樣?
Brockman:競爭確實幫我們看清了一些東西。在編程方面有一個例子,我們在「真實世界代碼」上起步比 Anthropic 慢了。我們一直在編程競賽的抽象指標(biāo)上拿最高分,但把模型應(yīng)用到混亂的真實代碼庫、真實世界數(shù)據(jù)上,這是 Anthropic 比我們早認(rèn)識到的。但這也反過來提升了我們的執(zhí)行力,現(xiàn)在 Codex 對比 Claude,我們在很多維度上已經(jīng)領(lǐng)先了。
主持人:你覺得 Mythos 就是營銷嗎?
Altman:我相信它在網(wǎng)絡(luò)安全方面是個好模型。但 Anthropic 的應(yīng)對框架里之前并沒有網(wǎng)絡(luò)安全這個類別。我們有,而且我們對如何把這類能力部署到世界有一套我們有信心的方案。
主持人:早年微軟對抗所有人,那時候也有口水仗和陣營之爭。但現(xiàn)在 AI 這些太多東西跟你、Elon、Zuck、Dario、Demis 這些人的個性和恩怨糾纏在一起,簡直是莎士比亞式的大戲。我們怎么走出來?
Altman:某些參與者只相信自己能做對這件事。因為他們覺得賭注是無限的,而且出于各種原因,他們不認(rèn)為其他任何人能做對,或者他們不想讓其他人做。這導(dǎo)致了一些非常有害的行為。我們無法控制別人的行為,但我們會繼續(xù)倡導(dǎo):這必須是人類的集體項目,而不是某一個人或某一種意識形態(tài)的勝利。
主持人:你覺得 Anthropic 在與美國聯(lián)邦政府的公開沖突事件中,受到公平對待了嗎?
Altman:沒有。雖然各方都有不好的行為,但我不認(rèn)為 Anthropic 被公平對待了。
用國防生產(chǎn)法(DPA)來威脅、動用供應(yīng)鏈風(fēng)險認(rèn)定,這不是我們的政府和 AI 行業(yè)應(yīng)該有的關(guān)系。我們非常重視支持美國政府,而且隨著模型越來越強大,這會越來越重要。但我也不認(rèn)為實驗室應(yīng)該說「我們有超級武器,但不跟你合作來保衛(wèi)國家」。我看不到任何好的未來,是領(lǐng)先的 AI 實驗室不協(xié)助美國政府的。如果我們真的相信自己說的那些關(guān)于模型未來走向的話,我確實相信,那么政府需要我們的幫助,而我們也很榮幸能提供這種幫助。
OpenAI 一直試圖保持溫和、中立、理性。這也是我們在與美國政府關(guān)系中努力做到的事。
主持人:現(xiàn)在幾家頭部的 AI 公司都有可能到達(dá) AGI,你最希望哪家先實現(xiàn)?
Brockman:關(guān)鍵不在于誰先到達(dá)。缺失的那一環(huán)是:怎么幫助人們真正理解這項技術(shù)能為他們做什么。
每一家公司都可以為此做貢獻(xiàn)。這也是所有試圖創(chuàng)造這項技術(shù)的人的責(zé)任, 不僅要展示技術(shù)的能力,還要展示人們?yōu)槭裁磻?yīng)該想要它、為什么應(yīng)該保護和捍衛(wèi)創(chuàng)造它的權(quán)利。為什么這對你個人、你的未來、你孩子的未來都是好事?這是我們每天醒來就在想的事情,我覺得說「每天」不算夸張。如果其他人也想為此貢獻(xiàn), 越多越好。
07OpenAI 的內(nèi)部目標(biāo),是實現(xiàn)Personal AGI
Brockman:我覺得我們在 OpenAI 面臨的最大技術(shù)挑戰(zhàn)之一,是機會太多了。AI 是一個無邊界的機會場。不管你在哪個維度上擴展,都會有前所未有的、令人驚嘆的東西出現(xiàn)。所以關(guān)鍵是有一個清晰的愿景, 我們到底要聚焦在哪里,才能獲得最大的回報和最大的收益。
想想你現(xiàn)在花多少時間跟 ChatGPT 解釋上下文。就好像你有個同事,你得不停地跟他解釋:「不是,我想要的是這個,情況是這樣的。」這不是這些系統(tǒng)應(yīng)該有的交互方式。
我們內(nèi)部開始把目標(biāo)稱為「Personal AGI」。一個真正了解你、擁有你的上下文、你可以信任的 AI。你問它關(guān)于理財或健康的問題,它能給出可靠的信息。
說一個我自己的故事。我的祖母患有阿爾茨海默癥。那段時間對所有人來說都很艱難。但有一件事深深觸動了我,她能用 Alexa 播放音樂,而且還記得歌詞,能跟著唱。她通過技術(shù)與自己的身份保持了連接。如果你能構(gòu)建足夠直覺化的界面,讓任何人都能以自己的方式與技術(shù)產(chǎn)生連接,而不是被迫去學(xué)一堆跟你真正想做的事無關(guān)的技術(shù)細(xì)節(jié),那才是我們要去的方向。
你會發(fā)現(xiàn),一個用于深度電腦工作的 AI 和一個用于個人生活的 AI,在技術(shù)層面其實是模糊的。即使你可能想要不同的系統(tǒng),一個只知道工作上下文,一個只知道私人上下文,它們可以并行推進(jìn),建立在同樣的技術(shù)基礎(chǔ)上。
最讓我驚嘆的是,我們構(gòu)建的所有這些東西,核心就是一個神經(jīng)網(wǎng)絡(luò)。還是深度學(xué)習(xí),還是在擴展規(guī)模。一個系統(tǒng),可以應(yīng)用到所有這些不同的場景。
如果你把鏡頭快進(jìn)到終局,你不想要一個「語言模型」,不想要「對話線程」,不想要任何這些技術(shù)細(xì)節(jié)。你想要的就是一個在幫你、代表你行動、知道你的目標(biāo)、能在工作和生活場景中幫你達(dá)成目標(biāo)的 AGI。這就是我們在做的。
08回應(yīng) Elon Musk 訴訟,Elon 要絕對控制權(quán)
主持人:你怎么看這場即將到來的 Elon Musk 訴訟審判?
Altman:我其實覺得這是一個機會。如果你看 OpenAI 的歷史,每次出現(xiàn)分裂,我們都讓對方去講故事,盡量不說「事實不是那樣的」。這次我們別無選擇,我們必須為自己辯護,必須講出真相。
我花了很多時間回顧歷史上的各種消息記錄。是的,總有些東西可以被斷章取義,但那些被挑出來的句子基本上就是對方能找到的「最糟糕」的內(nèi)容了,看完你只會覺得:就這?而且全是脫離上下文的。
Brockman:讓我講一下那段從沒公開講過的故事。
當(dāng)時我們所有人,Sam、Ilya、我、Elon,都同意 OpenAI 必須轉(zhuǎn)型為營利性結(jié)構(gòu),這是完成使命的唯一路徑。然后就是瘋狂的談判。Elon 要多數(shù)股權(quán),要當(dāng) CEO,要完全控制權(quán)。
我們一步步退讓。「好吧,不做平等合伙人了。你要這么大的股份?如果你說你需要,我們可以談。我們希望你參與。」「好吧,Elon 當(dāng) CEO。」但到了「絕對控制權(quán)」這一步,即使他說以后會稀釋、會讓出來,我們停下來問自己:我們的使命是什么?我們真的相信不應(yīng)該有任何一個人掌控整個未來嗎?不管這個人是誰?
那是分裂的臨界點。那是我們說「不」的原因。
我們從來沒講過這個故事。現(xiàn)在終于要講了。老實說,我現(xiàn)在唯一擔(dān)心的是他在開庭前撤訴,讓我們沒機會把這些全說出來。
主持人:上周發(fā)生在你身上的事,科幻小說里寫過很多類似的情節(jié),當(dāng)反對技術(shù)進(jìn)步的力量變得極端時會發(fā)生什么?
Altman:我想它會起起落落,但總體方向是越來越極端。
那是一個瘋狂的早晨。第一天我處于腎上腺素休克狀態(tài),只是在處理各種后勤。第二天我真正進(jìn)入了一個抑郁的周期,以后還會有更多這樣的事,這讓人極度沮喪。這非常可怕。我覺得自己沒什么深刻的話好說。末日論的言論沒有幫助。某些實驗室談?wù)?OpenAI 的方式也沒有幫助。我其實不想搞對立,但我認(rèn)為 Anthropic 談?wù)?OpenAI 的方式是有害的。我希望更冷靜的時代終究會到來。
說一件事。就在這件事發(fā)生的前一天晚上,我跟同事吃飯。他們說「你最近在媒體上確實很艱難,但也算某種意義上的好事吧。」我說:「至少沒有人試圖殺我。」
然后第二天早上就出事了。
但這確實讓很多事情有了不同的視角:只要人們只是說難聽話,那其實不算什么大事。你繼續(xù)往前走就是了。
Brockman:我想說一件事。就在出事那天,Sam 就在處理那些絕對需要他的事情。他不斷地推動使命前進(jìn)。這種韌性是極端的,我認(rèn)為被嚴(yán)重低估了。
![]()
轉(zhuǎn)載原創(chuàng)文章請?zhí)砑游⑿牛篺ounderparker
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.