无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

“今天的頂級智能,一年后就會淪為平庸的廉價品” OpenAI總裁:AGI 的終極交互是“沒有界面,沒有產品”

0
分享至


我們正在走向“算力驅動型經濟”,全球對模型的需求會遠超算力供給。

編譯 | 王啟隆

出品丨AI 科技大本營(ID:rgznai100)

“如果沒有 ChatGPT,我甚至不知道現在該怎么幫我妻子去應付她的病況。”

說出這句話的,是 OpenAI 的聯合創始人兼總裁 Greg Brockman。在發布會上,他聊的總是幾十億美元的超算投資和 AGI 的宏大藍圖;但回到家里,他最私密的動力只是想當好一個普通丈夫。他的妻子患有許多慢性病,兩口子日常最依賴的工具不是什么名醫,而是 ChatGPT 的對話框

這種“幫普通人解決具體麻煩”的邏輯,也決定了 OpenAI 在商業上的打法。外界總覺得大廠有什么算無遺策的百年大計,但 Greg 卻在現場直接自曝:2023 年他們高調推出的插件功能(Plugins),其實根本就沒用 。


當時大模型的能力沒準備好,上下文只有 2k 到 4k,只要同時連上超過 3 個接口,AI 就會開始健忘。既然碰到了物理極限,他們的解法也很粗暴:堆算力。當內部討論要買多少算力儲備時,別人問他“我們到底該買多少”,他給出的回答只有四個字:“買下全部 ?!?/p>

在 Greg 看來,AI 將來不應該成為像 iOS 這樣需要頻繁點擊、跳轉不同應用的“超級 App”。未來的 AGI 會是隱形的,就像一個長久存在、知道你所有習慣的虛擬助理。在和 Big Technology 的主持人 Alex Kantrowitz 聊天時,他撇開了那些花哨的行業詞匯,聊到了算力的稀缺、智能的折舊,以及為什么未來的軟件可能不需要任何界面:

  • 全球每周有 2.3 億人在 ChatGPT 上查詢各種健康問題,而真實世界的醫生和護士正在面臨極大的職業分流與倦怠。讓 AI 輔助患者打理日常病況、篩查罕見病,會比開發一個幫你訂機票的 App 更有價值。

  • 2023 年 OpenAI 高調推出的插件功能(Plugins),其實根本就沒用。 那次工具調用的嘗試徹底失敗了,因為當時大模型還沒準備好。

  • 早期的電腦只有微小的內存,當時的模型也只有 2K 到 4K 的上下文窗口,一旦連上超過 3 個接口,AI 就會開始遺忘信息。直到今天,上下文和智力水平才真正到了可以把海量工具和文件系統放進“指尖”的階段。

  • 別再天天死磕界面和按鈕了,真正的 AGI 不需要產品,更不需要界面。 現在的對話框、各種開關和圖標都只是過渡。我們真正需要的是一個沒有界面的、長久存在的虛擬助手。

  • 現在使用智能體深度重構業務的用戶只有一兩千萬,全網的算力供給也依然無法滿足未來的生成需求。所以在購買多周期算力儲備時,最本源的決策就是暴力買下能買到的全部。

  • 大模型的縮放定律(Scaling Laws)目前看不到任何天花板,但實際建造超級計算機極其艱難。 要想讓模型變聰明,沒有捷徑,必須有團隊去死磕那些最枯燥的底層工程調優。

  • 今天的頂級智能體驗,一年后就會淪為平庸的廉價商品。 一年的時間,就會讓原本顯得極其尊貴的大模型智能體驗變得極其普遍和便宜。這會逼著模型廠商不斷去研發更聰明、更強大的前沿模型,否則很快就會被市場淘汰。



領取地址:https://boolan.com/enroll/c1049/event/1152?channel=gzh

真正好用的 AGI,連界面和按鈕都不該有

采訪者: 你知道嗎,Greg,這是我們第四次對話了,而且每一次我們聊的都是 OpenAI 的產品方向。我覺得我現在開始有點看懂了。

之前有一種說法是:用“超級應用”(super app)來描述你們正在打造的這個應用,其實并不準確。你們是在把 Codex——也就是 OpenAI 產品里偏編程、偏瀏覽器操作的那一側——和 ChatGPT 整合到一起。可一旦你用了“超級應用”這個詞,大家就會說:“不對,所謂超級應用,應該是那種你可以在里面直接使用其他各種應用的東西?!?/p>

但現在,隨著這些產品逐漸融合在一起,實際上,“超級應用”這個說法也許反而是準確的。至少對我們這些局外人來說,開始看到的是:以后無論你要完成什么事情,起點都會是你在 ChatGPT 里輸入一個提示詞(prompt);然后 OpenAI 的技術會調用你的瀏覽器,或者直接調用你的電腦,替你把事情辦成。這樣理解對嗎?

Greg: 我覺得,這個視角相當不錯。

但如果把視野再拉遠一點,我們真正想打造的,其實是 AGI(通用人工智能)。

如果你回頭看 ChatGPT 推出以來人們實際在使用的東西,本質上還是一個語言模型(language model)。而這和我們真正想去到的地方之間,其實還有很大的距離。

當然,它已經很驚艷了。你可以和 ChatGPT 說話,它也能回應你,很棒,非常棒。但 2022 年我們剛發布它的時候,它沒有記憶,沒有連接任何工具,也沒有上下文

所以說到底,這種“會對話的智能”只是人們真正完成工作、實現目標所需能力中的一部分而已。我們要去的方向,是擁有一個真正為你著想的 AI:你給它目標,給它方向,它會持續地思考——“今天我能為 Alex 做點什么?”——它既能去解決特別困難的問題,也能去處理那些極其瑣碎的事情。你一覺醒來,郵箱已經被整理好了;與此同時,如果你正在考慮某種健康方案,它也能幫助你推進這件事,幫你研究治療方案,或者至少來回和你溝通、提供相關信息。

我認為,“你想要什么樣的界面”“你想要什么樣的產品”,是我們花了很多時間思考的問題。而我們的答案是:你幾乎不想要界面。你甚至不想要一個‘產品’。
你希望的其實是——你和我之間的界面是什么?就是對話。你只想和某種持續存在的實體(persistent entity)交流,而它能夠代你去完成目標。

所以,打造這樣的東西很難,也需要時間。但我們已經擁有了其中很多組件。我們正在越來越多地把產品層整合起來,努力讓模型變得更強,也努力讓整個系統減少按鈕、減少開關、減少模式切換,減少各種繁瑣操作。不是說在過渡過程中這些東西會完全消失,但長期的方向,肯定是更簡化、更統一

2023 年的插件徹底失敗了,因為當時的模型根本記不住事

采訪者: 你說“界面會逐漸消融”,這一點很有意思。那我想再追問深一點。今天很多使用 ChatGPT 的人都會發現:機器人在回答結尾時會主動提出建議。比如你問營養問題,它會說:“要不要我幫你制定一個健康計劃?”或者“要不要我幫你做一個飲食方案?”你問旅行,它可能會順手給你做一個行程安排。

所以我是不是可以這樣理解:未來在 ChatGPT 里,舉個例子,當你跟它討論健康決策時,它可能會說:“你知道嗎?你大概需要去看這個??漆t生。我來幫你預約吧?!比缓笏娴臅砟闳绦羞@個動作。也就是說,它會從一個單純的對話界面,變成一個能夠理解你意圖、并主動出去替你完成任務的系統。

Greg: 完全正確。我們的目標,是真正把 Codex 的能力帶給所有人,把智能體(agents)帶給所有人。這項技術現在已經存在了。

我會把我的 Codex 接到 Slack、Gmail 和日歷上。在 OpenAI 內部也有很多非技術用戶在使用它。雖然它名字里有個 “code”,但它其實并不只是關于代碼。它真正的意義在于:它是一個通用型工具,是你在使用一個智能體。

比如說,我們傳播團隊有位同事組織活動時,就會讓它去聯系所有與會者,詢問他們的飲食偏好,安排完整的座位表,把這些工作都處理掉。這樣她就能把注意力放在那些她真正想親自投入的部分,專注于思考她想實現的整體效果。

我覺得接下來我們會在各個領域都看到這種情況?,F在再去設想“一個 AI 連接各種工具幫你做事”,這已經不再是科幻了。

我記得 ChatGPT 最早嘗試使用工具,大概是在 2023 年,可能是 3 月或者 4 月。那時我們發布了插件(plugins)。大家還記得早期聊天時代的插件嗎?那次沒成,完全沒成,因為當時模型還沒準備好。

但那個形態(form factor)其實是對的。顯然,未來 AI 一定會和你的 Gmail 對接,這毫無疑問。只是那時候我們一次最多只能給模型暴露三個不同的連接器(connectors),再多它就開始忘。那時上下文窗口也只有大概 2K、也許 4K token,幾乎沒有記憶。

有點像 20 世紀六七十年代的早期計算機:內存小得可憐。而今天你手上的手機,性能都已經超過了那個年代的任何超級計算機。

我覺得模型的發展也正在經歷類似過程。改進速度一直非常陡峭。現在,你已經可以讓模型同時訪問數百種不同的工具,我們也有能力把它連接到完整的文件系統上。這樣一來,幾乎整個互聯網、幾乎所有你想用的應用,都可以擺在模型手邊,供它直接調用。

而且它也足夠聰明。它有 5200 萬 token 的上下文——具體怎么定義得看你怎么看這個數字——而它的能力水平也在飛速提升?,F在這些模型已經開始解決尚未解決的數學問題和物理問題,真正幫助人們完成過去做不到的事情。

我們正站在這樣一個時代邊緣:智能體將真正改變我們所有人的工作方式——無論是在軟件工程、金融、法律、銷售領域,還是在我們的個人生活里。

采訪者: 我把你剛才那個例子拆開來說一下:你的某位同事正在和 ChatGPT 討論一個活動,然后系統建議:“我們是不是應該聯系一下活動參與者,確認某件事?” 過去這一步意味著“好,我得自己去做了”,然后再切換到某個活動管理軟件里。但現在基本上會變成:一旦它判斷這是個好主意,而你也同意了,界面就會從那里接管,連接到你正在使用的工具,然后直接替你把這件事辦了。

Greg: 沒錯。它會調用 Gmail 連接器,在你的收件箱里搜索出所有將參加活動的人;如果你在處理飲食限制相關事務,它會發現:“這些人的飲食限制信息我已經有了;這些人,我還沒有。” 然后它會起草郵件。

具體怎么執行,取決于你的設置方式。它可能會說:“我已經把這些郵件草擬好了,可以發送嗎?” 如果你使用的那個連接器甚至不允許它發送郵件,它就會說:“我已經寫好了,但需要你自己點發送?!?/p>

而在另一個世界里,你也可以想象:如果你已經和這個系統建立了足夠的信任,它會說:“這些郵件我已經寫好了,而且我已經幫你發出去了。”

我認為,這其實點出了智能體時代一個非常關鍵的問題,那就是:信任
我們必須真正學會如何與這些系統建立信任,弄清楚它們擅長什么、不擅長什么,搞明白你愿意把什么事情委托給它們,以及你愿意把多大的責任交給它們。

而在我們看來,信任是靠表現贏得的。不是我們一句話授予的。我們能做的,是給操作者——也就是 AI 所代表的那個人——提供大量工具、控制權、監督權和審查能力。我們認為這會變得極其重要。這會是一個關鍵產品特性,也是重要的差異化點。

采訪者: 是的。如果回頭看更早的一些嘗試,OpenAI 之前也做過讓你在 ChatGPT 里叫 Uber 的嘗試,而在這之前,也有一長串公司都試圖讓用戶在聊天界面里直接完成操作,但最終都沒有真正流行起來。

而這里的不同之處,也許在于:這個聊天機器人可以接管你的瀏覽器,甚至接管你的電腦。這樣你就不需要再擔心“這個插件到底能不能用”,因為它會直接替你完成任務——通過接管你的機器來完成。

所以我在想,你是否預期會和今天的用戶界面發生一場沖突?也就是和現在所有其他 app、所有軟件的界面發生沖突。因為如果 ChatGPT真要變得足夠有用,它就必須不能被阻止,必須能夠替用戶走出去、執行這些操作。

Greg: 首先我要說的是,這已經不是理論問題了。人們已經在使用 Codex。它是一個獨立產品、獨立應用,你得單獨安裝。它目前確實更聚焦于軟件工程。但在 Codex 里發生的非軟件類工作,增長速度已經徹底爆炸了,完全是一條驚人的指數曲線,正是你會預期看到的那種情況。

而在 OpenAI 內部,就使用滲透率而言,它現在幾乎已經和 Slack 同級了。我們整個公司本來就是一個徹底依賴 Slack 的公司。大多數情況下我們根本不用電子郵件。你不上 Slack,就幾乎做不了任何工作。

而現在 Codex 應用也開始給人這種感覺了:大家的 Codex 都接上了各種工具。

至于整個生態系統會如何演變,我覺得這會是件非常微妙的事。因為有一點對我們來說非常重要:我們相信,這個生態應該是充滿活力、能夠繁榮生長的,別人也應該能夠在其中構建產品、真正獲得收益。

事實上,我們已經從合作伙伴公司那里看到了這種趨勢。我記得有幾家合作伙伴,我們跟他們說:“我們真的很想把 AI 訓練得特別擅長使用你們的軟件?!?當時我們并不知道他們會怎么回應。結果他們的反應居然是:“這是我們見過最友好的合作請求?!?/p>

因為“你們會專門讓自己的 AI 擅長使用我們的工具”——他們一下子就看到了機會:這會讓他們的工具被使用得更多得多。

每個人都在思考:在 AI 時代里,自己這家公司不只是要活下來,而是要活得更好。你怎么真正吃到“整體活動量會大幅增加”這件事的紅利?而如果你沒有把 AI 融進來、如果你把 AI 拒之門外,那你實際上會走向衰退,而不是繁榮。

別把 OpenAI 當成操作系統,它只是個聽得懂人話的虛擬同事

采訪者: 這聽起來會讓 OpenAI——首先,你剛才提到大家在用 Codex。你們有位同事分享過,我記得你也提過:你們已經把 ChatGPT 帶進了 Codex,這樣也就能把 Codex 帶回 ChatGPT。也就是說,對于 ChatGPT 用戶來說,我們剛才討論的那種體驗——ChatGPT 不只是建議你下一步該做什么,而是真的替你去做——這件事是會發生的。

那這么一來,你們實際上是不是就變成了一種操作系統(operating system)?當然不是像 iOS 那種操作系統,不是說你打開手機、再去點不同 app。更像是:未來你和所有 app 的交互,都會通過這個界面來完成。這是你們的野心嗎?

Greg: 你當然可以這么描述,但我自己的理解會稍微不同一點。

我會這樣想:AGI 最理想的界面是什么? 或者說,我們所稱的“個人 AGI”最理想的界面是什么?

我覺得,答案還息息相關:就是你和我此刻正在使用的這種界面。你只想和一個助手說話。你只想和某個能代表你去工作、去操作的東西對話。

所以,是的,那個智能體、那個 AGI、那個 AI 會有它自己的電腦,也會有它自己的訪問權限。理想的同事也許甚至是——它能走過來,直接在你的電腦上輸入操作;也就是說,對你的系統有某種被授權的訪問。你可能有時會把收件箱權限委托給它。也許它也有自己的郵箱,通過某種窗口機制看到它所需要的信息,而你會把郵件轉發給它。

如果你仔細想,這其實并不是什么史無前例的事。它很像你和一個人類助手,或者任何同事之間的協作方式。我們花了很多時間認真思考:怎樣建立這些信任邊界,確保你們能夠協同工作。

所以在我看來,它更像是一種不同的東西。你當然可以把它叫作操作系統,但“操作系統”這個詞幾乎屬于另一個時代,屬于技術棧中的另一個層次。而這里真正討論的,是你如何廣義地與技術交互

我覺得 AI 最美妙的一點在于:它是在把機器拉近人類,而不是反過來讓人類去扭曲自己,去適應文件夾、文件系統,以及所有這些并不自然的細節——那些更多是機器的工作方式,而不是我們的工作方式。

采訪者: 說到“個人智能”,這又讓人想到——你上周看 WWDC 了嗎?

Greg: 沒有,沒有,我錯過了。

采訪者: 看起來你們和 Siri,尤其是新版 Siri,某種程度上會進入競爭,對吧?因為它也是一個會覆蓋在你所有 app 之上的智能系統,讓你可以通過它采取行動。而 ChatGPT 則會是 iPhone 上的一個 app。

所以你能不能談談:這種定位會不會讓 OpenAI 比較難受?你們在戰略上是怎么思考這件事的?

Greg: 我還是想說,最好從另一個角度看這個問題。

我認為我們正處在這個全新智能體時代的開端。而 AI 歷史上一直如此:每當能力出現一個新臺階,你就有機會把一切重新想一遍。重新思考人們如何交互,重新思考技術究竟能做什么。我覺得這次也不例外。

在我看來,地平線上已經能看到的一些事情——比如說,用 AI 解決科學問題——我們已經開始看到一些苗頭了。就拿今天來說,我們剛剛宣布:在同行評議的文獻中,已經有醫生在使用 o3——還記得 o3 嗎?

采訪者: 記得。

Greg: 感覺已經像很久以前的事了,對吧?那是我們最早的一批推理模型之一。醫生們正用它幫助那些多年得不到答案的患者找到診斷。有一個案例是:一個人被一種神秘病癥困擾了 20 年,最終借助這項技術才得到了確診。

如果你看到模型已經能做到這種事,那么對我來說,再去把問題框成“那你能不能通過某個 app 分發出去”就有點不成立了。因為我們面對的是某種根本性的新東西。

這并不是說不會有競爭。我實際上覺得競爭一定會有,而且這對所有人都是好事。只是我認為,你將如何使用這項技術,它將能做成什么事,以及它將賦予你怎樣的能力,這些都會和我們過去見過的任何東西完全不同。

采訪者: 我本來想問你:那這是不是意味著你們最終必須打造自己的設備?前提是,如果我的理解成立——你們必須通過 Apple 才能接觸到用戶——那答案其實已經是“是”了,對吧?OpenAI 現在就在做設備。這件事已經有公開報道了。

我去年 12 月在你們辦公室時,Sam 就跟我說這件事在進行中,而且不是一個設備,是多個設備。所以如果再回到剛才那個問題:未來人們會如何和這些 AI 交互?這些設備,或者說這一系列設備,會在其中扮演什么角色?

Greg: 你看,我還是想往后退一步說:我認為這是某種全新事物的開始。

而如果說在交互層面發生的最大變化是什么——其實甚至不只是設備層面的變化。真正的變化,是從對話智能(conversational intelligence),也就是聊天范式(chat paradigm),過渡到智能體。

聊天范式的意思是:你有一個足夠個性化的 AI,它的回答值得你去讀;你問它一個問題,它給你一個答案,這對你有幫助。而智能體則意味著:它已經足夠強,能夠真正替你做事。

這是一個很大的轉變,也意味著你和它的交互方式應該不同。所以你最終會想要的是:一個單一的智能體,它能夠訪問你的上下文。這在個人生活中會成立,在商業場景中也會成立。

你可以想象一下:假設你有一個同事,他在每個領域里都是 PhD 級別,拿過多個諾獎;你雇了一個這樣的同事,甚至雇了一百個。如果你從不讓他們參加任何會議,那他們其實也幫不上什么忙。

所以關鍵在于:你如何把上下文送進 AI。而且不是靜態地送進去,而是隨著上下文演化、隨著業務流程變化,動態地送進去。你怎么建立一個 AI 可以訪問的上下文層(context layer),使它能夠真正發揮出那種原始智能所對應的能力?

所以,要讓這個 AI 變得可訪問、可調用——比如讓它能出現在會議里,讓人們可以非常順手、非常輕松地觸達它——我覺得這都需要重新思考。但對我來說,核心還是要先從“智能體這種產品形態”出發,再倒推:我們要怎樣讓它獲得它所需的上下文。再強調一次,信任會是讓整個等式成立的核心因素。

采訪者: 所以大概會像是:你隨時隨地帶著這樣一個設備,然后說一句“這個事我得辦一下”,它就替你去辦了。

Greg: 我覺得這會是其中一部分。
但我甚至覺得,即便你沒有這樣一個設備,你也不至于被排除在局外。因為核心是這個 AI 本身。

有一種想法是:設備就是 AI——你希望你的手機就是那個 AI,希望某個你設想中的定制設備就是那個 AI。但事情不會是這樣。它更像是一個界面

就像你的手機不是“你”本人一樣。它只是一個連接你的界面。它讓我可以在需要你的時候聯系到你,在我想問你問題的時候聯系到你。我們有不同的接入方式:同步電話、短信、郵件。我覺得未來我們和自己智能體的互動方式,也會非常相似。

大模型的極限還遠著呢,但把超算搭起來是個極其痛苦的體力活

采訪者: 有一些報道說,OpenAI 正在研發這種“雙向語音模型”(bidirectional voice models)。我記得我們以前聊過。目標是做出一個你可以直接和它說話,而它能更自然地處理你的話、再自然地回話給你的 AI。你能透露一點嗎?

Greg: 不能。

不過認真一點說——你看,整體技術方向其實很清楚。我們已經有語音模型,也已經有非??岬恼Z音體驗,一年半、兩年了。我們第一次演示大概是在 2024 年的 3 月、4 月左右,真正推向市場大概是那年稍晚些時候。

而它的工作方式,以及其他所有人的模型大體上的工作方式,基本都是把幾個模塊串起來——更早期的時候,做法是:先用語音轉文本模型(speech-to-text),再用文本到文本模型(text-to-text),最后再用文本轉語音模型(text-to-speech)??膳掳??三段鏈式拼接。

即便現在你有了一個統一模型,能夠同時接收輸入并輸出回應,依然存在一個問題:輪次切換(turn-taking)。想象一下我們現在這種交流——你不能重疊說話,不能打斷。你一旦對我說了一輪,我就得把整段回應全部說完,你才能再說。這根本不是人類對話的運作方式。

所以我們其實是用了一個“補丁式”的辦法:讓一些模型去判斷“哦,這一輪大概結束了”“哦,新的一輪大概開始了”。輪次這個概念本身就很不自然。這還是人類在扭曲自己,去遷就機器和機器的局限。

所以,顯而易見你真正想實現的是一種模型、一種 AI——它更像你和我現在這樣交流。它能夠在處理輸出的同時,也處理輸入。毫無疑問,這正是這個領域里很多人都在奮力奔向的方向。

我覺得,當你走向這種自然的、非常像人類的、流動感極強的對話界面時,會非常、非常令人興奮。此前沒人見過這樣的東西。

我經常想到的一點是:現在和 ChatGPT Voice 的互動,在很多時候已經很神奇了。很多人在通勤路上用它,能不停地問問題。但它一旦打破這種“神奇感”,又會讓人非常挫敗——比如你突然意識到:“哦,我想補充一句?!苯Y果它還在不停地壓著你說,這就完全不合理。

所以我覺得,我們真正需要的,或者說這個 AI 存在的核心意義之一,就是讓你能夠流暢、自然地和它互動。

順便說一句,我覺得這件事也不只是個人場景。它同樣會深刻影響工作場景。我和 Codex 最有魔力的一些體驗,恰恰就是通過語音來操作它的時候。很多人——我們已經內建了語音功能,也有人會用第三方 app 來實現。你會很快意識到,打幾個字給它一些反饋,當然很容易;但如果要你把整整一大段、所有想法全都打出來,那簡直痛苦。沒人想那樣做。你只想直接說出來,而且你想要一個實時反饋循環。這一切都會發生,而且會非常驚艷。

采訪者: 那我們來簡單聊聊模型改進。幾年前曾有一種說法,說大語言模型快要撞墻了。事實證明,那是錯的。

而我現在想到的——我想也是大家都在想的——是:這些模型到底還能變得多好?這種改進什么時候會停下來?你有什么看法?

Greg: 我覺得這是一個:如果你自己就在構建這些模型,你會慢慢形成一種感覺和直覺,而這種直覺在外部其實很難獲得。因為我們能看到所有數據點,也能看到這些進步背后到底投入了什么。所以這個問題的答案有兩個部分。

第一,我認為其背后的基礎科學,是我所知道、也幾乎是我能想象到的,最神秘也最重要的科學發現和經驗觀察之一:我們居然真的能夠構建出這樣的模型,而且擴展定律(scaling laws)依然持續成立。

事實就是,你確實可以繼續訓練這些模型——更多數據、更多算力、更好的架構,再疊加大量改進。

而且每次我們似乎碰到“哦,這次好像沒有按預期擴展”的情況時,最后通常都會發現:是我們這里有問題、那里有 bug、數學推導不夠對、實現沒有精確匹配數學公式,或者其他類似原因。我覺得這是一個非常重要、值得真正內化的事實。

實際上,我們也做過研究,把視角拉回這個領域的最早期。神經網絡(neural nets)本身是在 20 世紀 40 年代、甚至在計算機出現之前,就被設計出來作為一種“也許這就是大腦處理信息方式”的模型。第一次硬件實現則是在 1959 年的感知機(perceptron)。

人們一直在說:這玩意永遠成不了、永遠擴展不了、遲早會撞墻。但它到現在都還沒撞墻。而且眼前也看不到墻。
所以我認為,從基本原理上講,這條路是走得通的。

當然,現實層面的難點很大。真正把這些超大規模超級計算機建起來,非常難,也非常貴,絕不輕松。我們有很多團隊,日復一日地在啃這些極其困難的技術問題。我們甚至不得不自己設計網絡協議。我們有團隊在盯整個技術棧的每一層。圖上會有各種奇怪的波動。理解神經網絡的一種方式是:它幾乎沒有抽象邊界。就像任何一個小地方出錯,都會引發層層漣漪,而你可能只會在最底層看到它的后果。所以你需要有人對整套系統有極深的理解。

但即便如此,只要你把合適的團隊聚在一起,給大家一個正確的使命,然后真去苦干,最后的結果是——值得。這件事是可實現的,也是做得到的。所以基于這些原因,我認為進步還會繼續。

算力永遠都不夠賣,我們在內部的決定就是“買下全部”

采訪者: 那我很想聽聽你的看法。如果模型能比今天再進步很多,比如說 OpenAI 做出了最好的模型,它相當于一個擁有 15 個 PhD、情商極高、不抱怨、還能替你做事的存在;然后下一個模型廠商也會做出一個差一點的版本,可能相當于 13 個 PhD、情商也不錯,也同樣能替你做事。

那當智能走到這個水平時,差異化到底體現在哪里?因為我們看到這些模型公司基本上一直在同步前進:一家取得進展,下一家很快也跟上。于是它們都會變得那么聰明。那還可能做出差異嗎?

Greg: 我覺得答案有幾個維度。

第一,我確實認為這里存在一種“吸引子狀態”(attractor state):從商業模式角度看,每一家提供商最終都會把自己所有算力賣滿。

采訪者: 好。

Greg: 對。我覺得我們正在走向的世界就是這樣:算力永遠不夠滿足所有需求。我們正在邁向一個由算力驅動的經濟體(compute-powered economy),每個人都會一直使用這些模型來完成各種他們關心的任務。

而我們已經能非常直接地看到這一點。現在我們就在談算力約束,而正在使用這些智能體的人數,大概也只是 1000 萬、2000 萬這個量級。離“全球規?!边€遠著。ChatGPT 的用戶規模大概是 10 億,對吧?但我們還沒有把完整的智能體能力帶到那個層級上。所以你只要看看這些量級變化,再看看使用深度——和未來相比,現在的使用深度仍然微不足道。

所以我認為,我們會進入這樣一個世界:即便有不同供應商、不同能力水平、開源模型、各種新型云廠商(neoclouds)——算力依然會是最稀缺的資源,而且它一定會被全部用掉。

某種程度上,這也回應了“這是不是一個值得做的生意”“新進入者還有沒有機會”之類的問題——我的答案其實是:有,而且非常有。
因為有一個巨大的市場,是我們根本不可能獨自吃下來的。這里需要更多能量、更多勢能。

但第二點是,這種問法也忽略了一個事實:智能不是單一維度的。

如果你真的放大去看,你會發現,擅長不同領域這件事并不簡單。即便你有非常強的原始智能,如果你從來沒有練習過——比如你從來沒真正做過一次路演(pitch),那你第一次就不會做得很好;你從來沒操作過電子表格,那你也不可能一上來就成功完成復雜建模。

所以我覺得,我們已經越來越內化這樣一種認識:當我們跨行業、跨領域去看時,必須做優先級排序。我們不可能同時在每一個垂直領域都做到頂尖。確實,提高通用智能水平之后,它會自動接觸和體驗很多東西;但要真正成為某個領域的專家,真正達到“PhD”那種程度,真正能推動一個學科的雄心向前,這很難。

順便我還想說一點:理解“如果你真的成功做到這件事,會發生什么”,擁有一個好的心理模型,其實很重要。比如回到 AlphaGo,你記得第 37 手(Move 37)吧?那個改變了人們對圍棋理解的一手。結果是:現在下圍棋的人比以前更多了。它反而激發了人們投入得更深。

我覺得我們也會看到類似的事。深度永遠不會停止??茖W能挖多深?有時候人類會以為:“好吧,物理學都發現完了,差不多了,我們都懂了。” 但我不認為那會是我們的未來。我們的未來更像是:每解開一個謎團,就會再打開 10 個新謎團。

所以我認為,未來還有海量事情可做,也有大量空間讓不同公司做出真正的差異化。

采訪者: 所以我想我大概理解你的意思了。你的看法可能是:也許所有人都能把模型擴展上去,但最終,擁有最多算力的公司會贏。

幾個名月前我們聊過,你提到你在公司內部曾被問到:“我們到底該買多少算力?” 你回答:“全部?!?對方又說:“不,我是認真的,到底該買多少?” 你說:“不,真的,全部買?!?/p>

而 OpenAI 顯然是購買算力的領跑者。我們都看到錢在不斷花出去。當然,投資也在進來,而且你們現在也已經建立了有客戶、有收入的業務,但錢確實也在大量流出。你會不會也想過:萬一這個全新類別最終賺不回這些錢怎么辦?

Greg: 我還是會從基本面來看這個問題。你必須認真看清這樣一個事實:算力從投資到真正到位,往往要滯后好幾年,具體取決于你在做什么。

比如說,我們已經連續幾年在投資自己的芯片項目了,而且進展非常令人興奮。很快我們其實就會有更多內容可以公布。

但我們能做到這一點,本身就是一種非常獨特的能力。你真的要去想的是:整個供應鏈的縱向整合(vertical integration)。而我認為我們正走向的世界,依然是那個——世界上的算力永遠不夠滿足所有需求。

這一點我們看得非常具體。你回想一下 ChatGPT 的指數級增長,再看看我們現在正處于的這些指數曲線,再想想我們已經能解決的問題。其實很有意思的是——就在昨天,或者說前天——我們剛公布了一個基本可以歸入化學領域的新結果:能夠合成全新的、改進過的反應路徑,而這些其實都還沒引起太多關注。

我剛才說過:如果你在某個領域足夠深入,就真的能改變它。而我們現在連表面都還沒碰破。

我最常想的問題其實是:我們怎樣才能滿足需求?我們怎樣才能真正提供一個系統,去支撐經濟體里人們想完成的所有工作? 這件事的規模太大了。我覺得我們任何人其實都還沒有真正把它內化。

采訪者: 好,不過如果我可以追問一下,現在似乎正在醞釀一場價格戰。至少媒體報道是這么說的。很高興今天你能來聊這個?!度A爾街日報》最近有篇報道提到,OpenAI 即將推出的一款模型可能會進行大幅降價。

所以再回到那個問題:如果服務這些需求本來就要消耗巨大資源,而需求又還在增長,在一個可能降價的環境里,這筆賬到底怎么才能算得過來?

Greg: 我還是想從另一個角度來看。

如果你回顧我們整個歷史,其實我們一直都在做同一件事:提高智能水平,同時降低“固定智能水平對應的價格”。而神奇的是——就像杰文斯悖論(Jevons paradox)一樣——需求反而總是進一步擴大。

我認為最前沿的智能(frontier intelligence)永遠都會是最貴的東西;但一年以后,今天這個級別的智能看起來就會相當普通,而且會變得便宜得多、可得性高得多。

而我覺得,我們正在進入的世界是:人們開始真正思考“價值”了。其實這是一個非常有意思的轉變。過去一個季度左右,直到最近,人們的想法大概還是:“AI 智能體這東西是新東西,我們必須把它引入企業,我們不能落后,我們怎么參與這個未來?”

而現在,人們開始說:“好,那我們得確認這東西真的帶來了 ROI(投資回報率)和價值?!?br/>我覺得這其實是個很好的狀態,因為大家開始問對問題了。

我今天就參加了幾場客戶會議,客戶說的正是這些。他們會問:“我們怎樣才能至少有比較好的支出控制(spend controls)?怎樣才能有可觀測性(observability)?” 我記得我們就是今天,剛剛發布了支出控制功能。

采訪者: 好。

Greg: 沒錯。我們正在非常大力度地投入企業就緒性(enterprise readiness),也在投入客戶明確告訴我們他們需要的那些工具。

我覺得,對我來說,公司也在經歷一種轉變:我們不再只是想著“發布模型、擁有一個模型”這件事,而是開始真正思考整個業務閉環。我們要如何把這些東西帶到真實客戶面前,解決真實問題?而且這種轉變正在所有行業里飛快發生。

仍然有大量公司還處在“我該怎么最好地利用這些模型”的摸索階段。我們其實也是邊做邊學。我覺得整個局面還非常早期。對我來說,市場規模本身增長得如此之快,我們自己的收入爬坡(revenue ramp)也增長得如此之快——我覺得我們所有人其實都還沒有真正預料到它最終會陡峭到什么程度。

采訪者: 你們會降價嗎?

Greg: 還是那句話:答案永遠是會,對吧?
但關鍵在于——我覺得接下來持續發生的,會是我們不斷推出前沿模型。短期內我不認為會有特別劇烈的變化,我覺得事情不會以那種方式發生。

但我認為你應該預期的是:放在一年的時間尺度上看,今天這種聽起來非常高端、非常旗艦級的智能,到時會便宜得多。可與此同時,又會有一個新東西出現,它會強太多,以至于你會想:“我為什么還要用舊的那個?” 事情一直都會是這樣。

“如果沒有 ChatGPT,我甚至不知道該怎么應付我妻子的病況”

采訪者: Satya Nadella 最近發了一些很有意思的推文,也接受了一些采訪。他最近說過一句話:“模型正在變成商品(commodity),真正有價值的資產,是一個能持續從你自己的數據中學習的、公司專屬的 AI系統。” 這可能是我轉述的。你怎么看這句話?以及,現在和 Microsoft 形成競爭,會不會感覺有點奇怪?

Greg: 你看,我不認為這個技術棧里的任何一層,都會簡單地從價值鏈中消失。
我覺得這些層其實是相乘關系。

如果你看最底層的算力,那就是:沒算力,就沒 AI。某種程度上你當然可以說,算力不就是商品化了嗎?不就是 FLOPs 嗎?有什么了不起?
但現實是,你看看今天芯片公司的股價,看看那些出售算力的公司,看看市場給它們什么估值,你就會發現:這里存在一種極其關鍵的基礎資產。

即便你瞇著眼看會覺得它像商品化了,它其實并沒有。并不是說價值消失了,工序和利潤率依然存在。

你可以從 H100 的價格看出來,對吧?Hopper 架構其實都不算最新了,已經是上一代芯片了。放在一個正常的、沒有極端供給約束的市場里,根本不會有人搶著買它們。但現在恰恰相反,它們的市場價格比以前還高。

所以現在發生的是一種倒掛。而且我認為這還會繼續下去:因為每個人面前都是一場需求雪崩,所以你會看到價格、利潤率,以及技術棧各層的收益能力,都在不同層面繼續上漲。

我覺得模型也是類似的。模型本身同樣如此——當然,這個領域競爭很多,我覺得這很好。對企業好,對客戶好,對消費者也好。

但我認為,在很多方面,比如我們的模型一直都是最聰明的、最能解決極難問題的。我覺得我們才剛剛進入一個階段:這種優勢即將開始真正釋放出變革性影響。比如,如果模型真的能加速科學研究,那么模型越聰明,推進速度就會越快。而這和一個僅僅具有對話界面、可以幫你訂旅行或整理日歷的模型,是非常不同的層面。所以這也是我們會做得很好的一個維度。我只是想強調,這是不同的戰場。

然后,還有一個問題是:你怎么把這種智能真正連接到你的客戶、連接到真實價值?你會發現,很多企業已經在各自領域構建了非常了不起的業務版圖。這是巨大的工程,而且不是說你沒有領域專業知識,就能直接進去把它做掉。

其中一部分原因在于:你必須考慮很多復雜領域。比如受監管行業;比如教育場景——那里有家長、有老師、有學生,存在多個參與方,他們之間必須以非常審慎的方式互動。

在所有這些領域、所有這些垂直方向里,價值都很大。只要你真正身處其中,認真思考工作流應該如何運作、這些模型應該如何被編排(orchestrated),就能創造出很多價值。

所以我真的認為,這個市場大得足夠每個人分一杯羹。而且我也認為,整個生態系統必須協同合作,才能真正交付我相信這些系統所可能帶來的那種價值。

采訪者: 好,那我再回到 Satya 那個點上一次。他說模型是商品。他正在試圖打造自己的前沿智能。他也在對你們潛在客戶說:“你們得和我們合作,因為我們能幫你們構建那些會從你們數據中學習的閉環。” 而且我記得,在 2032 年之前,他似乎都還能接觸你們的 IP。那聽到這些話是從 Satya 那里說出來的,你心里是什么感覺?

Greg: 你看,我覺得現在最重要的事情,是 AI 在整個經濟體中的使用,真正去改變經濟,并讓所有人受益。所以這是我最關注的事情。而且,越多人在努力讓這件事發生,我覺得對所有人就越好。

采訪者: 有傳言說 GPT-5.6 已經在路上了。據說——當然這只是 Twitter 上的傳言,但我還是念給你聽——它會比 Fable 便宜三倍,上下文達到 150 萬 token,智能體編程工作流更強。這里面有多少是真的?我們應該對 GPT-5.6 期待什么?

Greg: 我的意思是,你永遠都應該期待:更好、更快、更聰明,整套都更強。

采訪者: 所以,等于全都確認了。

Greg: Twitter 上看到的內容,當然都要深信不疑。

采訪者: 嗯,也許還是別。這其實已經給我的個人生活帶來過一些麻煩了。

好,我們最后聊聊健康。你剛才提了幾次這個話題,之前現場觀眾也有人問到。有時候你會讀到一些報道,然后心里會想:“我知道這個人是在對媒體講話,我也知道他說的內容聽起來像是真的,但這個故事里總有哪里不太對,我們以后大概也不會再聽到后續了?!?最近我就看到過幾篇這種報道。

其中一個是——我想應該是你的朋友——GitLab 的 CEO,Sid Sijbrandij。他得了癌癥,做了自己能做的一切診斷檢查,也就是說,幾乎把所有能測的都測了。然后在一些為此專門開發應用的人幫助下,把這些數據喂給 ChatGPT,最后——我不知道“治愈”這個詞準不準確——但確實在一定程度上把癌癥壓制住了。

還有另一個故事,是澳大利亞那只叫 Rosie 的狗。你們聽說過 Rosie 嗎?那故事特別離奇:有個人——我可能會記錯一些細節——給自己那只患癌的狗做了活檢,把突變信息跑進 AlphaFold,然后在聊天機器人的幫助下設計出了一種 mRNA 疫苗,再把它注射給狗。最后那只狗居然又能跳桌子了,而且腫瘤也縮小了。

當我們思考 AI 和健康的未來時,能不能請你幫我們分辨一下這里面的真實情況?這些只是少數適合做新聞標題的極端個案,而故事中還有我們沒聽到的部分;還是說,這種事在未來會變成一種常態?

Greg: 它絕對會變成常態。絕對會。

而且我個人就有好幾位朋友做過非常類似的事:把數據整理對,把自己的健康診斷信息整理好,然后用 Codex、用這些模型,從中獲取洞察。

我覺得,現在有很多很多人——我記得大概每周有 2.3 億人 在用 ChatGPT 做健康相關查詢。這個規模非常驚人。

而我們一直生活在一個患者并沒有被充分賦權的世界里??勺罱K做決定的必須是患者。醫生如果犯了錯,代價往往是你自己余生來承擔。這是一種完全不同的激勵結構。

我的妻子就有一些健康問題,我甚至不知道,如果沒有聊天式 AI,我們現在要怎么管理她其中很多病情。

而我覺得,我們現在才剛剛走上這段旅程。哪怕你已經擁有最好的醫療團隊、最好的資源、最頂尖的專家,很多事情仍然存在天花板。你想神往那些仍然超出人類能力邊界的事情;甚至有時只是因為某個人沒有認真讀病歷,漏掉了一個細節。所有這些,都應該能夠借助這些工具得到大幅改善。

所以我認為,個性化醫療(personalized medicine)——有時會涉及面向大眾市場的藥物和藥物發現;但有時也會像我今天早些時候提到的 NF1 那類情況,涉及疾病診斷;有時則只是為了更好理解某種病癥,或者嘗試提出新的潛在療法。

所有這些事——我們現在就正在親眼看著它發生。這不是理論上的可能性,它是真的正在發生。所以,AI 最令人震撼的潛力之一,就是它能在多大程度上改善我們的健康。

而你再想想整個系統的連鎖效應:如今醫療體系里發生了巨額支出,那是經濟中的一個巨大組成部分。如果你真的能夠幫助人們預防問題、提前應對潛在健康風險,那就能緩解大量負擔和壓力。

而我們現在正處在一個醫生職業倦怠、護士職業倦怠的世界里,一場真實的危機就在眼前發生。我認為 AI 能夠幫助緩解這一切。只要我們部署得當、使用得當,它就具備這樣的潛力。

所以,對我來說,把 AI 應用于醫學,是我在思考整個旅程——我們在構建什么、OpenAI 想做什么——時一個非常個人化的動力來源。我也希望,作為一個世界、一個共同體,我們能夠最大程度地把握住這個機會。


很多企業做 AI 研發,真正難的不是“用不用 AI”,而是:

怎么判斷自己處在哪個階段?

能力短板在哪里?

下一步該怎么演進?

這份 《AI原生軟件研發成熟度模型 AISMM 白皮書》,正是圍繞企業 AI 研發轉型路徑展開。

7 月 17-18 日,2026 奇點智能產品大會將在北京舉辦

掃碼報名參會,即可領取這份白皮書福利


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
當一把高壓水槍,對準了蔚來的“豪華”

當一把高壓水槍,對準了蔚來的“豪華”

白夜若夢
2026-07-02 10:58:04
特朗普賬號買入500萬美元電擊槍股票,兩周后ICE放出2.2億合同

特朗普賬號買入500萬美元電擊槍股票,兩周后ICE放出2.2億合同

全棧遛狗員
2026-07-03 04:48:51
哪一刻讓你意識到和對方是兩個世界的人?網友:眼界差距難以逾越

哪一刻讓你意識到和對方是兩個世界的人?網友:眼界差距難以逾越

夜深愛雜談
2026-06-28 22:30:51
褲衩開叉10厘米!被網暴5年!鐵三女神奪亞軍又被罵,裁判:合規

褲衩開叉10厘米!被網暴5年!鐵三女神奪亞軍又被罵,裁判:合規

番外行
2026-06-07 15:53:29
韓紅愛心慈善基金會發聲明:韓紅兼具文藝工作者社會身份,公益慈善并非其全部工作內容,基金會活動與基金會公益運營相互獨立、界限清晰

韓紅愛心慈善基金會發聲明:韓紅兼具文藝工作者社會身份,公益慈善并非其全部工作內容,基金會活動與基金會公益運營相互獨立、界限清晰

魯中晨報
2026-07-02 19:30:11
四川民企疑遭虛假證據錯判破產,兩級法院審查失守,十年申訴無門

四川民企疑遭虛假證據錯判破產,兩級法院審查失守,十年申訴無門

大眾看點
2026-07-02 12:47:16
泰國租妻產業,正在收割中國“退休老頭”

泰國租妻產業,正在收割中國“退休老頭”

毒sir財經
2026-06-30 22:38:02
北京大媽公交車上打暈患癌姑娘,一巴掌斷送退休后的美好幸福生活

北京大媽公交車上打暈患癌姑娘,一巴掌斷送退休后的美好幸福生活

嘉琪Feel
2025-07-09 23:05:01
搬起石頭砸自己的腳!剛開完演唱會的任素汐,也走上了韓紅的老路

搬起石頭砸自己的腳!剛開完演唱會的任素汐,也走上了韓紅的老路

山谷里的怒吼
2026-07-02 18:05:59
ESPN記者:湖人隊內部人士暗示詹姆斯父子可能一起轉投新球隊

ESPN記者:湖人隊內部人士暗示詹姆斯父子可能一起轉投新球隊

好火子
2026-07-02 22:11:51
墨西哥球迷狂歡震動地球:地震儀捕捉到強烈信號 狂歡導致三人死亡

墨西哥球迷狂歡震動地球:地震儀捕捉到強烈信號 狂歡導致三人死亡

紅星新聞
2026-07-02 17:59:23
創造歷史!C羅世界杯爆發:梅開二度+加冕隊史射手王!率隊爭冠軍

創造歷史!C羅世界杯爆發:梅開二度+加冕隊史射手王!率隊爭冠軍

光輝記
2026-06-24 02:00:59
西班牙6月上千人因高溫死亡!中國空調、電扇企業加班趕訂單

西班牙6月上千人因高溫死亡!中國空調、電扇企業加班趕訂單

山西晚報
2026-07-02 12:46:16
別再比退休金了!2026年滿60歲,拿到這個數就偷著樂吧

別再比退休金了!2026年滿60歲,拿到這個數就偷著樂吧

小影的娛樂
2026-07-03 09:49:09
湖南女醫生出軌17分鐘視頻:別站在道德制高點,批判她的貞操

湖南女醫生出軌17分鐘視頻:別站在道德制高點,批判她的貞操

娜烏和西卡
2025-11-10 13:50:19
81歲港星生日猝然離世,常年運動身體好,晚年移居香港

81歲港星生日猝然離世,常年運動身體好,晚年移居香港

情感的我
2026-07-03 07:36:55
中國腦梗發病率世界第一!醫生苦勸:罪魁禍首已揪出,這4物少吃

中國腦梗發病率世界第一!醫生苦勸:罪魁禍首已揪出,這4物少吃

醫學科普匯
2026-06-17 18:55:13
“叫不醒”的李純,比誰都清醒

“叫不醒”的李純,比誰都清醒

星宿影視鴨
2026-07-02 19:39:59
貝克漢姆14歲的女兒小七怎么如此成熟了,好像少婦

貝克漢姆14歲的女兒小七怎么如此成熟了,好像少婦

西樓知趣雜談
2026-06-13 19:52:21
醫生發現:能跑能跳的老人,基本在70歲,就已經不做這6件事了

醫生發現:能跑能跳的老人,基本在70歲,就已經不做這6件事了

芹姐說生活
2026-06-30 19:12:40
2026-07-03 11:11:00
AI科技大本營 incentive-icons
AI科技大本營
連接AI技術的創造者和使用者
2738文章數 7712關注度
往期回顧 全部

科技要聞

特斯拉交付超預期7.4萬輛,股價卻大跌7.5%

頭條要聞

克羅地亞絕平球無效 官方放賽事用球內置芯片檢測畫面

頭條要聞

克羅地亞絕平球無效 官方放賽事用球內置芯片檢測畫面

體育要聞

韓國人,為什么恨透了洪明甫?

娛樂要聞

黃曉明深夜約會美女,分手原因曝光

財經要聞

AI“鬼故事”不斷,市場開始重估?

汽車要聞

有純電有增程 還有二代VLA支持 小鵬MONA L03預售價14.38萬起

態度原創

家居
本地
教育
旅游
手機

家居要聞

傳奇筑 日常詩

本地新聞

這場穿越酉陽的光影之旅,張張都是壁紙!

教育要聞

武漢市2026中考第一批高中錄取分數線公布

旅游要聞

河南洛陽:黃河古都一號旅游公路美如畫

手機要聞

iPhone 18 Pro系列混用閃存 大存儲版本降配

無障礙瀏覽 進入關懷版