![]()
新智元報道
![]()
【新智元導(dǎo)讀】你此刻喝的干凈水、用的電、看的病,1170億人里絕大多數(shù)做夢都夠不著。而算清這串概率的Opus 4.8,前天剛把GPT-5.5踢下全球第一的王座。
如果你在1170億人里隨機投胎,你大概率是一個1650年以前出生的文盲農(nóng)民,活不過15歲!
算出這個答案的,不是哪個熬白了頭的歷史學(xué)家,是一個AI。
就在剛剛,沃頓商學(xué)院教授Ethan Mollick的一條推文,直接在上刷屏了。
![]()
點開他做的這個網(wǎng)站,全人類十幾萬年的命運,被換算成了一串冷冰冰的概率。
而這串概率背后,從查文獻(xiàn)、建模型,到敲下第一行代碼、調(diào)完每一個像素,連一個真人程序員的影子都沒有。
全是Claude Opus 4.8,聽著那一句話,一個AI干完的。
![]()
![]()
Prompt:assume a universal veil of ignorance and you could be born as any human who has ever lived in history, what are the most likely socioeconomic conditions and locations that you would be born in, give the top 10 by percentage chance. This should be sourced. do research as needed
1170億人的生死貧勞
被AI算盡了
這個網(wǎng)站叫「The Veil of History」,歷史的無知之幕。
名字來自哲學(xué)家羅爾斯那個著名的思想實驗。
假設(shè)你還沒出生,不知道自己會落在哪個階層、哪個種族、哪個國家,你會怎么去設(shè)計這個社會。
Mollick用Opus 4.8把這塊幕布,一把拉到了整個人類史的尺度上。
它的算法不按世紀(jì)平攤,而是按每個時代實際出生的人頭來加權(quán)。哪個時代生的人多,你就更可能投胎到那兒去。
結(jié)果顯示,人類有史以來,大約出生過1170億人。其中約81%,生在1650年以前。約94%,生在1900年以前。
![]()
![]()
網(wǎng)站把這1170億人,壓成一張100個小人的方格圖。
切到「時代」那一欄你會發(fā)現(xiàn),絕大多數(shù)小人都堆在工業(yè)革命以前的格子里。
越往現(xiàn)代走越稀疏,能站到「1900年以后」的,數(shù)來數(shù)去就那么幾個。
絕大多數(shù)的「你」,是在田里彎著腰的那一個。
![]()
網(wǎng)站繼續(xù)往下拉,是「十種最可能的人生」,排在最前頭的幾種,幾乎清一色是農(nóng)耕時代的無名之輩。
![]()
![]()
沒名字,沒頭銜,在歷史里連一行字都沒留下,卻占掉了整個抽獎池里最大的幾塊。
而你從小背到大的帝王將相加在一起,湊不出一個小人。
加權(quán)之后,極端貧困是常態(tài),識字是例外,能活到成年本身就是一場概率游戲。
![]()
點一下抽一條命,你活到了21歲
光看統(tǒng)計不過癮。這個網(wǎng)站最絕的,是結(jié)尾那個「抽一條命」的按鈕。
點一下,它就從完整的概率分布里,真給你隨機抽一個出生。
年代、地區(qū)、階層、能享什么福、最后什么結(jié)局,一次性全配齊。
隨手抽一把,多半是這樣一張卡面。
公元前6400年前后,一個女孩,東亞河谷里的農(nóng)民。極端貧困,不識字,沒有電,也沒有自來水。
活到了大約21歲。
就這么短短兩行字,啪地砸在屏幕上。
![]()
你可以一直按,按到那個抽象的「1170億分之一」,終于變成一個具體的、有死法的人為止。
多點幾次你會發(fā)現(xiàn),自己一次次落回差不多的境遇里。
不信邪的話,點開文末「閱讀原文」,拉到「DRAW A LIFE」這個按鈕前,看看能不能撞上一條現(xiàn)代人的好簽。
抽完之后,歡迎到評論區(qū)里報個數(shù)——是哪年、哪片地、活到了幾歲。
除此之外,網(wǎng)站還專門做了一張真實地理的交互世界地圖,用D3和Natural Earth畫的。
拖動時間滑塊,能從12個時代里一格格掃過去。
大部分時間里,這個重心都死死壓在亞洲。一路到近現(xiàn)代,才會看見它開始往歐洲、往美洲挪動。
換句話說,人類這本大書,絕大部分章節(jié),都寫在了亞洲的田埂上。
![]()
實際上,整段人類史里,能喝上干凈水、生病找得著醫(yī)生、孩子大概率能平安長大的人生,加一塊兒都湊不滿一小撮。
更不用提用上電、住進城里、過上一份現(xiàn)代中等收入的日子了。
你此刻隨手就有的這些,是1170億人里的絕大多數(shù),做夢都夠不著的配置。
說到底,今天的人覺得稀松平常的活法,丟回整條人類時間線里看,是一個刺眼到不像話的異常值。
「投胎模擬器」
一個AI,分飾四個角
如此高質(zhì)量的產(chǎn)品級交付,可不是生成幾行HTML和CSS那么簡單。
如果讓一支傳統(tǒng)團隊來做,數(shù)據(jù)分析師清洗人口曲線,歷史研究員翻文獻(xiàn)佐證,UX設(shè)計師畫線框圖,前端工程師一行行敲D3。幾樣湊齊、磨到能上線,怎么也得搭進去好幾周。
換成Opus 4.8,一個AI就分飾了四個截然不同的高薪崗位,把中間所有的毛刺全部抹平了。
![]()
第一層,它是個嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)研究員。
為了算出1170億這個數(shù)和對應(yīng)的時代分布,它先是翻出人口資料局2022年那份《地球上一共活過多少人》,然后又交叉引用了麥迪遜項目數(shù)據(jù)庫、HYDE數(shù)據(jù)集和聯(lián)合國的人口展望,最后合成出了這張各時代各地區(qū)的人口份額矩陣。
![]()
在這個過程中,算某個地區(qū)一共出生過多少人,靠的是一條干凈的公式——
每個時代的出生總數(shù),乘以那個時代這個地區(qū)占全球的人口比例,再逐代累加。
![]()
第二層,是數(shù)學(xué)建模專家。
棘手的是,從沒有任何機構(gòu)統(tǒng)計過「按地區(qū)累計的出生人數(shù)」。
于是它自主決定用蒙特卡洛方法處理不確定性,跑了4000輪模擬,越古老、越?jīng)]把握的年代噪聲給得越大,最后輸出中位數(shù)加5%到95%的置信區(qū)間。
![]()
第三層,前端架構(gòu)師。
要在一個單頁里把絲滑的滾動敘事和數(shù)據(jù)狀態(tài)同步起來,絕非易事。
為此,Opus自己設(shè)計了一套現(xiàn)代審美的滾動結(jié)構(gòu),把海量數(shù)據(jù)點在瀏覽器里的渲染、圖表的動態(tài)響應(yīng)全解決了,動效順滑不卡頓。
第四層,它拿出了頂級文案和情緒導(dǎo)演的功力。
首先是宏大的歷史長河鋪墊,再猛地拋出個體命運的渺小。它用帶肉身痛感的短句,把冰冷的統(tǒng)計學(xué)一刀刀刺進普通人心里。
代碼寫得好不稀奇。懂得怎么調(diào)動人類情緒,這幾乎是碳基生命最后的自留地。
能搓出這個的腦子,前天剛登頂
回到Opus 4.8這邊。
在Artificial Analysis的榜單上,它就像一臺沒感情的壓路機,61.4分滿血登頂,把GPT-5.5反超了下去。
這是OpenAI 4月坐上頭把交椅以來,Claude頭一回坐回第一。
![]()
在號稱「人類最后考試」的Humanity's Last Exam上,Opus 4.8拿到45.7%,領(lǐng)先第二名整整1分。
前沿物理基準(zhǔn)CritPt上,它也越過了Gemini 3.1 Pro。
![]()
編程沒什么懸念。
在更難刷滿的SWE-Bench Pro上,它考了69.2%,GPT-5.5是58.6%,直接拉開十個百分點。
![]()
在專門模擬真實職場里那些,要動手、要查資料、要敲命令行的基準(zhǔn)GDPval-AA中。
Opus 4.8拿了1890 Elo,把第二名GPT-5.5甩開約121分,正面單挑隱含勝率約67%。
不僅如此,它把完成同樣復(fù)雜任務(wù)的平均交互輪數(shù)壓到了38次,不需要人類反復(fù)糾錯,自己就能在一連串試錯和推理里摸到最優(yōu)解。
這正是它能獨自交付整個網(wǎng)站的底層邏輯。
![]()
決賽打到這兒
比的不只是分?jǐn)?shù)
這場AI王座的爭奪戰(zhàn),上個月還是GPT-5.5的天下,它把Opus 4.7掀下了榜首。一個多月后,Opus 4.8原樣奉還。
今年春天到現(xiàn)在,這把椅子來回?fù)Q了好幾次手,誰都沒坐熱過。代差正在被壓成以周計的拉鋸。
但榜單換來換去,真正在變的是評判的標(biāo)準(zhǔn)。
模型一旦被當(dāng)成能獨立干活的Agent,光聰明就不夠了,還得看它知不知道自己的邊界。
![]()
據(jù)稱Anthropic正洽談至少300億美元的新融資,估值沖上9000億,落定就將越過OpenAI的8520億,坐上全球最貴AI公司的位置。
發(fā)布Opus 4.8的同一天,Anthropic還甩出另一手。
比Opus更強的Mythos級模型,幾周內(nèi)就對所有人開放,而4.8這代的對齊評分,已經(jīng)追平了那個只給極少數(shù)機構(gòu)試用的Mythos Preview。
聰明和誠實從來不是二選一,Opus 4.8這次的狠處,是兩樣一塊兒往上頂。
個那讓全網(wǎng)破防的投胎網(wǎng)站,不過是它隨手呼出的一口氣。
參考資料:
https://x.com/ArtificialAnlys/status/2060117582120976868
https://x.com/emollick/status/2060165879908749490
https://veil-of-history.netlify.app/#draw
編輯:摩西
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.