亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI 強(qiáng)到這一步了?發(fā)布上線,但不敢讓普通人用

0
分享至

我覺(jué)得,人類或許正在以一種超出常規(guī)認(rèn)知的速度在被 AI 追趕。

不知道你們的現(xiàn)狀是怎樣的,至少我現(xiàn)在已經(jīng)完全離不開(kāi) AI 了,我每天的工作中至少有 50% 是 AI 輔助完成的。

而且,這個(gè)比例還在持續(xù)提升。

與此同時(shí),隨著一代又一代新模型的推出,不管是我的工作效率和質(zhì)量,還是我在 Token 上的每月消費(fèi),都在快速增長(zhǎng)。

昨晚我看了個(gè)消息,Anthropic 發(fā)布了一個(gè)連他們自己都不敢公開(kāi)給所有人使用的模型,因?yàn)檎娴奶珡?qiáng)了。

這個(gè)新模型的名字叫「Mythos」,翻譯成中文就是「神話」的意思。

目前是預(yù)覽版,所以官方叫它「Mythos Preview」。不過(guò),這次是以一個(gè)叫「Project Glasswing」的項(xiàng)目形式推出的。

關(guān)于這個(gè)項(xiàng)目,我后面會(huì)講。


上個(gè)月,Anthropic 一份內(nèi)部文檔意外泄露,里面提到有一個(gè)比 Opus 更大、更強(qiáng)的模型正在開(kāi)發(fā),代號(hào)就是 Mythos。

隨后,Anthropic 把這次泄露歸因于「人為錯(cuò)誤」,也沒(méi)有進(jìn)一步說(shuō)明理由。

現(xiàn)在,這個(gè)代號(hào)是 Mythos 的模型算是正式官宣了。

官宣歸官宣,但它并沒(méi)有公開(kāi)發(fā)布上線。也就是說(shuō),普通用戶還不能使用。

原因很直接,Anthropic 覺(jué)得這個(gè)模型太強(qiáng)了,在安全機(jī)制到位之前不適合向所有人開(kāi)放。

我覺(jué)得,這句話值得停下來(lái)想一秒。

通常,一家 AI 公司發(fā)布新模型巴不得第一時(shí)間上線搶占市場(chǎng),但這次 Anthropic 的做法明顯有點(diǎn)反常。

在我看來(lái),不是他們不想發(fā),而是不敢發(fā)。

因?yàn)?,這個(gè)叫 Mythos 的模型的確很強(qiáng)大。

先看幾個(gè)官方公布的測(cè)試數(shù)據(jù)。

在編碼能力上,Mythos 和目前公開(kāi)最強(qiáng)的 Claude Opus 4.6 之間的差距不小,在各項(xiàng)基準(zhǔn)測(cè)試中,Mythos 基本是完勝 Opus 4.6。


推理能力上,在 GPQA Diamond(研究生水平科學(xué)問(wèn)答)測(cè)試中,結(jié)果是 94.6% vs 91.3%,Mythos 勝。

在 Humanity's Last Exam 有工具和無(wú)工具測(cè)試中,也都是 Mythos 完勝。


跟 Agent 有關(guān)的計(jì)算機(jī)操作能力上,OSWorld-Verified(自主完成電腦任務(wù)),Mythos 以 79.6% 超過(guò) Oputs 4.6 的 72.7%。

每一個(gè)維度上,Mythos 都強(qiáng)于 Opus 4.6,有些甚至是碾壓式超過(guò)。


在一些任務(wù)表現(xiàn)上,差距已經(jīng)不是小步迭代,而是大幅躍升。比如 SWE-bench Multimodal 從 27.1% 跳到 59%,幾乎翻了一倍。

讓他們不敢上線 Mythos 的一個(gè)最核心原因,就是它突破軟件世界的安全防線能力太強(qiáng)了。

說(shuō)白了,全世界所有的系統(tǒng)和軟件都有漏洞,而 Mythos 可以用超過(guò)人類的水平發(fā)現(xiàn)并攻擊這些漏洞。

假設(shè),這種能力被黑客掌握,那全世界的操作系統(tǒng)和軟件都會(huì)遭殃,尤其是一些公共基礎(chǔ)設(shè)施和國(guó)家安全。

Anthropic 在公告里有這么一句話,看完后我覺(jué)得細(xì)思極恐。


翻譯過(guò)來(lái)就是:「 AI 模型的編碼能力已經(jīng)達(dá)到了極高水平,在發(fā)現(xiàn)和利用軟件漏洞方面,它們幾乎可以超越除最熟練的人類之外的所有人」。

關(guān)于這句話,我想多展開(kāi)一下。

我是程序員出身,所以我知道軟件的構(gòu)建方式是怎樣的,以及不同人寫(xiě)出來(lái)的代碼差異有多大。

還有,沒(méi)有哪個(gè)軟件敢說(shuō)自己沒(méi)有漏斗,即便這個(gè)漏洞從來(lái)沒(méi)被發(fā)現(xiàn)過(guò)。

以前的漏洞之所以能幾十年安靜地躺在系統(tǒng)里,并不是因?yàn)橄到y(tǒng)足夠安全。

而是因?yàn)檎衣┒催@件事,需要極高的專業(yè)能力,極大的耐心和精力,以及大量的時(shí)間。

會(huì)的人太少,敢投入的人就更少了。

這種「能力稀缺」,構(gòu)成了整個(gè)軟件安全世界的隱性前提。AI 介入之后,這個(gè)前提就開(kāi)始松動(dòng)了。

AI 能以超過(guò)大多數(shù)非頂尖人類能力的方式開(kāi)展工作,我們可以用它來(lái)攻擊漏洞,當(dāng)然也可以用它來(lái)堵住漏洞。

為了解決這個(gè)問(wèn)題,接下來(lái)我說(shuō)下 Anthropic 搞的這個(gè) Project Glasswing 是什么。

簡(jiǎn)單說(shuō),這是一個(gè)利用 Mythos 的能力幫全世界基礎(chǔ)設(shè)施系統(tǒng)找 bug 的項(xiàng)目。

參與方包括 AWS、蘋(píng)果、微軟、谷歌、英偉達(dá)、思科、Linux 基金會(huì)等共計(jì) 12 家機(jī)構(gòu)。


這個(gè)陣容覆蓋了云計(jì)算、操作系統(tǒng)、芯片、瀏覽器、金融基礎(chǔ)設(shè)施、網(wǎng)絡(luò)安全和開(kāi)源生態(tài)。

換句話說(shuō),全球數(shù)字基礎(chǔ)設(shè)施的核心參與者幾乎都在這個(gè)項(xiàng)目里了。

這個(gè)項(xiàng)目的核心邏輯只有一條,讓防守方先用上這個(gè)頂級(jí) AI 模型的能力。

因?yàn)槿绻舴较饶玫酵燃?jí)的工具,窗口一旦打開(kāi)就很難關(guān)上。Anthropic 承諾提供 1 億美元的模型使用額度,覆蓋研究預(yù)覽期。

除了 12 家核心機(jī)構(gòu),還有超過(guò) 40 個(gè)維護(hù)關(guān)鍵軟件基礎(chǔ)設(shè)施的組織獲得了訪問(wèn)權(quán)限,可以用 Mythos 掃描自家系統(tǒng)和開(kāi)源項(xiàng)目。

同時(shí),Anthropic 向 Linux 基金會(huì)捐了 250 萬(wàn)美元,向 Apache 軟件基金會(huì)捐了 150 萬(wàn)美元,這二者都是軟件世界的基礎(chǔ)設(shè)施。

這么說(shuō)吧,我們現(xiàn)在使用的各種 App、網(wǎng)站、系統(tǒng),基本上都是以他們?yōu)榈讓蛹軜?gòu)的。

在我看來(lái),Anthropic 這次算是干了件好事,不僅推出了更強(qiáng)的模型,還花錢(qián)給全球信息基礎(chǔ)設(shè)施讓他們來(lái)完善自己。

畢竟,如果裸上的話,對(duì)誰(shuí)都沒(méi)有好處。

可能說(shuō)到這你還是感覺(jué)不到 Mythos 到底有多強(qiáng),我從官方原文里看到了三個(gè)具體案例,我覺(jué)得比數(shù)字更能說(shuō)明問(wèn)題。


第一個(gè),OpenBSD。

這是公認(rèn)安全性極高的操作系統(tǒng),很多關(guān)鍵基礎(chǔ)設(shè)施會(huì)跑在上面,包括我們用的蘋(píng)果手機(jī) iOS 系統(tǒng)、Android 系統(tǒng)、甚至一些企業(yè)和機(jī)構(gòu)內(nèi)部系統(tǒng)。

Mythos 在里面發(fā)現(xiàn)了一個(gè)存在了 27 年的漏洞,攻擊者只要連上目標(biāo)機(jī)器,就能讓它遠(yuǎn)程崩潰。

27 年!不是沒(méi)人在意,是壓根沒(méi)人找到。

第二個(gè),F(xiàn)Fmpeg。

幾乎所有需要處理視頻的軟件都依賴它,你們用的各種視頻播放軟件基本上都有它的身影。

有個(gè)漏洞躲在一行寫(xiě)于 16 年前的代碼里,自動(dòng)化測(cè)試工具反復(fù)攻擊了整整 500 萬(wàn)次,每次都沒(méi)找到。

但是,Mythos 找到了。

第三個(gè),Linux 內(nèi)核。

這個(gè)就不用多說(shuō)了,基本上可以說(shuō)是整個(gè)互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施,也最值得警惕。

Mythos 不只是發(fā)現(xiàn)了幾個(gè)獨(dú)立漏洞,而是把多個(gè)漏洞串聯(lián)成一條攻擊鏈。

從普通用戶權(quán)限開(kāi)始,一路提權(quán),最終實(shí)現(xiàn)對(duì)整臺(tái)機(jī)器的完全控制。

關(guān)于 Linux 這個(gè),和前兩個(gè)案例的性質(zhì)完全不一樣。

找漏洞,是分析能力。

但串漏洞,就是策略能力了。

就像很多產(chǎn)品經(jīng)理,會(huì)畫(huà)原型圖會(huì)寫(xiě)文檔會(huì)做數(shù)據(jù)分析,這些是單點(diǎn)能力。但把業(yè)務(wù)、產(chǎn)品、商業(yè)串起來(lái),就是策略能力了。

一個(gè)能規(guī)劃攻擊路徑的模型,已經(jīng)不只是審計(jì)工具了,它更接近于一個(gè)可以在數(shù)字環(huán)境里主動(dòng)行動(dòng)的智能體。

以上三個(gè)案例,Anthropic 采取的都是先發(fā)現(xiàn)、先報(bào)告、先修復(fù)、再披露的方式,目前均已修復(fù)。

看到這,你就知道 Mythos 有多強(qiáng)了,就像一頭暫時(shí)不敢被放出籠的猛獸,現(xiàn)實(shí)世界需要先做好適應(yīng)它的準(zhǔn)備。

我想在這里說(shuō)幾個(gè)觀察,或許也是接下來(lái)真正變化的開(kāi)始。

第一,軟件世界的安全假設(shè)正在失效。

今天我們習(xí)以為常的軟件穩(wěn)定性,并不完全來(lái)自系統(tǒng)設(shè)計(jì)足夠好。很大程度上,它依賴的是攻擊能力的稀缺。

說(shuō)得直白點(diǎn),不是軟件足夠強(qiáng),而是人不夠強(qiáng)。

找漏洞需要成本,構(gòu)造利用鏈需要時(shí)間,大規(guī)模掃描需要資源。所以很多技術(shù)債、陳年 bug、老舊系統(tǒng)就那樣活著,從沒(méi)被認(rèn)真清理過(guò)。

就像我們做產(chǎn)品一樣,我們覺(jué)得邏輯閉環(huán)了,沒(méi)問(wèn)題了,并不代表真的萬(wàn)事無(wú)憂了,很可能是我們的能力上限到了。

Mythos 展現(xiàn)的能力,是漏洞從被發(fā)現(xiàn)到被利用的時(shí)間窗口從過(guò)去的幾個(gè)月被壓縮到了幾分鐘。

幾分鐘意味著什么?

意味著補(bǔ)丁的節(jié)奏,修復(fù)的流程,已經(jīng)開(kāi)始跟不上攻擊的速度了。

第二,開(kāi)源世界會(huì)最先感受到壓力。

今天大多數(shù)現(xiàn)代軟件,底下都?jí)褐罅块_(kāi)源依賴。平時(shí)看不見(jiàn),一旦被打穿,就是全行業(yè)同時(shí)受影響。

可能有讀者不是很了解這個(gè)邏輯,用大白話說(shuō),就是我們現(xiàn)在使用的所有軟件都有開(kāi)源項(xiàng)目作為底層,而這些項(xiàng)目的源代碼是對(duì)所有人可見(jiàn)的。

以后當(dāng)模型能持續(xù)地、大規(guī)模地掃描開(kāi)源項(xiàng)目,開(kāi)源社區(qū)維護(hù)者們面對(duì)的壓力級(jí)別會(huì)完全不一樣。

這也是為什么 Anthropic 要給 Linux 基金會(huì)和 Apache 基金會(huì)捐錢(qián)的原因。

不是做公益,而是承認(rèn)開(kāi)源基礎(chǔ)設(shè)施是 AI 時(shí)代整個(gè)數(shù)字世界最脆弱、也最不能倒的那層地基,他們不想被當(dāng)做壞人和惡人而已。

第三,人會(huì)被弱化,AI 開(kāi)始和 AI 博弈。

以前互聯(lián)網(wǎng)產(chǎn)品安全團(tuán)隊(duì)的價(jià)值,在于人的判斷力、經(jīng)驗(yàn)積累和對(duì)系統(tǒng)的深度理解。

未來(lái),這件事會(huì)換個(gè)邏輯。

比的是誰(shuí)的模型更強(qiáng),誰(shuí)的工具接得更快,誰(shuí)能把 AI 審計(jì)嵌進(jìn)開(kāi)發(fā)流程的最前端。

這不是程序員被替代的問(wèn)題,而是安全行業(yè)本身的生產(chǎn)方式會(huì)重組。

好的那面,是數(shù)千個(gè)高危漏洞可以在幾周內(nèi)被找出來(lái)。麻煩的是,攻擊方遲早也會(huì)有同等級(jí)的工具。

到那個(gè)時(shí)候,軟件產(chǎn)品的安全不再是人和人的對(duì)抗,而是模型和模型之間的攻防博弈。

這次,Anthropic 不只發(fā)布了能力,還發(fā)布了風(fēng)險(xiǎn)??赡苁悄壳斑@個(gè)階段,整個(gè)行業(yè)最需要看到的那種誠(chéng)實(shí)。

所有人都在談 AI 如何改變工作效率,這沒(méi)毛病。

但 Mythos 也在提醒我們,AI 能力的躍最終會(huì)從內(nèi)容世界傳導(dǎo)到軟件世界,再傳導(dǎo)到整個(gè)數(shù)字世界的基礎(chǔ)設(shè)施。

內(nèi)容世界被改寫(xiě),影響的是流量邏輯。

軟件世界被改寫(xiě),動(dòng)的是地基。

此時(shí),我想起了電影《2012》里的一句臺(tái)詞,也作為這篇文章的結(jié)尾吧。

「無(wú)論你是誰(shuí),不分種族,不分國(guó)家,明天我們都沒(méi)有區(qū)別!」

PS:我很少寫(xiě)這種長(zhǎng)文,看到這你至少已經(jīng)花了10分鐘,說(shuō)明你是擁抱變化喜歡思考的人。那么,就來(lái)個(gè)點(diǎn)贊、在看、轉(zhuǎn)發(fā),讓更多人加入對(duì)明天的期待中。

················· 唐韌出品 ·················

安可時(shí)刻

昨天看完 Mythos 的官方介紹后,我起身走到窗邊發(fā)了一會(huì)兒呆。

沒(méi)想什么,只是有點(diǎn)恍惚,而我的幾個(gè) AI 員工還在電腦上幫我干活,有的在分析數(shù)據(jù)、有的在搭建文章框架、有的在寫(xiě)項(xiàng)目文檔。

昨天我還新招了個(gè) AI 員工,取名唐小藝,以后我所有的封面圖、海報(bào)、甚至我的日常攝影需求都交給他了。


以下,就是他給我「拍」的一張照片,還原了上面我描述的場(chǎng)景。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
歐戰(zhàn)實(shí)時(shí)積分榜:英超25.8分領(lǐng)跑,鎖定下賽季額外歐冠名額

歐戰(zhàn)實(shí)時(shí)積分榜:英超25.8分領(lǐng)跑,鎖定下賽季額外歐冠名額

懂球帝
2026-04-16 08:07:04
5406萬(wàn)元!成都麓山國(guó)際一別墅拍出四川住宅法拍第二高價(jià)

5406萬(wàn)元!成都麓山國(guó)際一別墅拍出四川住宅法拍第二高價(jià)

上游新聞
2026-04-16 11:46:06
女兒考上北大親爸不出錢(qián),繼父賣房供她,9年后親爸別墅繼父100塊

女兒考上北大親爸不出錢(qián),繼父賣房供她,9年后親爸別墅繼父100塊

奶茶麥子
2026-04-15 10:27:27
烏干達(dá)總司令向土耳其通牒:10億美金加美女,不給就開(kāi)戰(zhàn)

烏干達(dá)總司令向土耳其通牒:10億美金加美女,不給就開(kāi)戰(zhàn)

南風(fēng)不及你溫柔
2026-04-14 09:16:06
中國(guó)電動(dòng)汽車就是燃煤汽車?美財(cái)長(zhǎng)氣急敗壞,演播廳鴉雀無(wú)聲

中國(guó)電動(dòng)汽車就是燃煤汽車?美財(cái)長(zhǎng)氣急敗壞,演播廳鴉雀無(wú)聲

安安說(shuō)
2026-04-16 11:05:59
汪寶失寵了!馬筱梅回京后深夜大哭,曝張?zhí)m3大改變,筱梅媽表態(tài)

汪寶失寵了!馬筱梅回京后深夜大哭,曝張?zhí)m3大改變,筱梅媽表態(tài)

好賢觀史記
2026-04-14 16:35:33
白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

白人女性與黑人女性的體味差異,網(wǎng)友真實(shí)分享引發(fā)熱議

特約前排觀眾
2025-12-22 00:20:06
佛山一大橋存在安全隱患,將封閉施工

佛山一大橋存在安全隱患,將封閉施工

南方都市報(bào)
2026-04-15 19:36:09
進(jìn)15球的姆巴佩被淘汰,進(jìn)12球的凱恩沖擊本賽季歐冠最佳射手

進(jìn)15球的姆巴佩被淘汰,進(jìn)12球的凱恩沖擊本賽季歐冠最佳射手

懂球帝
2026-04-16 06:31:42
中國(guó)女子在澳遭小孩挑釁后被其母毆打,中使館:已第一時(shí)間聯(lián)系澳大利亞警方,要求徹查嚴(yán)懲

中國(guó)女子在澳遭小孩挑釁后被其母毆打,中使館:已第一時(shí)間聯(lián)系澳大利亞警方,要求徹查嚴(yán)懲

觀威海
2026-04-16 10:20:07
1930年,剛進(jìn)入政治局的基洛夫挺身而出,反對(duì)斯大林極刑處置柳京

1930年,剛進(jìn)入政治局的基洛夫挺身而出,反對(duì)斯大林極刑處置柳京

云霄紀(jì)史觀
2026-04-13 17:22:20
范瑋琪自曝被罵怕了!被網(wǎng)曝到恐懼鏡頭不敢上臺(tái),葉一茜稱太懂了

范瑋琪自曝被罵怕了!被網(wǎng)曝到恐懼鏡頭不敢上臺(tái),葉一茜稱太懂了

絢麗的畫(huà)卷
2026-04-14 22:11:28
蔣雯麗和家人合影,蔣長(zhǎng)像隨媽媽,不得不說(shuō)她媽媽的基因真是強(qiáng)大

蔣雯麗和家人合影,蔣長(zhǎng)像隨媽媽,不得不說(shuō)她媽媽的基因真是強(qiáng)大

草莓解說(shuō)體育
2026-04-13 16:41:50
美國(guó)拒食毒性最大農(nóng)作物,中國(guó)年消費(fèi)超300萬(wàn)噸

美國(guó)拒食毒性最大農(nóng)作物,中國(guó)年消費(fèi)超300萬(wàn)噸

阿銍武器裝備科普
2026-02-18 06:16:41
這是張雪峰創(chuàng)業(yè)初期和女兒張姩菡的舊合照

這是張雪峰創(chuàng)業(yè)初期和女兒張姩菡的舊合照

歲月有情1314
2026-04-04 10:26:01
劉亦菲調(diào)侃姚安娜:這次代言華為代言費(fèi)免費(fèi)嗎?姚安娜回復(fù)超好笑

劉亦菲調(diào)侃姚安娜:這次代言華為代言費(fèi)免費(fèi)嗎?姚安娜回復(fù)超好笑

喜歡歷史的阿繁
2026-04-16 09:59:27
從上海弄堂到新西蘭首富:35 歲華裔女性劉月婷的金融傳奇

從上海弄堂到新西蘭首富:35 歲華裔女性劉月婷的金融傳奇

北有南梔
2026-04-15 18:25:03
許家印,KTV豪情終成妄念

許家印,KTV豪情終成妄念

哲空空
2026-04-15 11:40:51
終于來(lái)了!焦泊喬聯(lián)手徐昕逼走杜鋒,廣東隊(duì)教練組面臨大洗牌?

終于來(lái)了!焦泊喬聯(lián)手徐昕逼走杜鋒,廣東隊(duì)教練組面臨大洗牌?

林子說(shuō)事
2026-04-16 00:06:25
白宮:正在討論美伊再次會(huì)談 伊朗:是否延長(zhǎng)?;鸩淮_定

白宮:正在討論美伊再次會(huì)談 伊朗:是否延長(zhǎng)?;鸩淮_定

新華社
2026-04-16 08:11:54
2026-04-16 13:56:49
唐韌 incentive-icons
唐韌
用產(chǎn)品思維解決難題
1453文章數(shù) 2026關(guān)注度
往期回顧 全部

科技要聞

39.98萬(wàn)!小鵬GX預(yù)售“純電增程同價(jià)”

頭條要聞

伊朗媒體:美以襲擊后 伊朗經(jīng)濟(jì)可能需要12年才能修復(fù)

頭條要聞

伊朗媒體:美以襲擊后 伊朗經(jīng)濟(jì)可能需要12年才能修復(fù)

體育要聞

很快,亞洲籃球要有自己的NCAA了?

娛樂(lè)要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財(cái)經(jīng)要聞

一季度GDP,5.0%!

汽車要聞

空間大五個(gè)乘客都滿意?體驗(yàn)嵐圖泰山X8

態(tài)度原創(chuàng)

時(shí)尚
本地
家居
手機(jī)
數(shù)碼

赫本愛(ài)穿的傘裙,好優(yōu)雅!

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

家居要聞

智能舒適 簡(jiǎn)約風(fēng)尚

手機(jī)要聞

華為Pura 90系列全球代言人易烊千璽,演繹純粹治愈松弛美學(xué)

數(shù)碼要聞

微星18寸游戲本更新:搭載最新酷睿Ultra 200HX Plus:220W功耗地表最強(qiáng)!

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版