无主之地2配置高吗|看真人裸体BBBBB|秋草莓丝瓜黄瓜榴莲色多多|真人強奷112分钟|精品一卡2卡3卡四卡新区|日本成人深夜苍井空|八十年代动画片

網易首頁 > 網易號 > 正文 申請入駐

AI 強到這一步了?發布上線,但不敢讓普通人用

0
分享至

我覺得,人類或許正在以一種超出常規認知的速度在被 AI 追趕。

不知道你們的現狀是怎樣的,至少我現在已經完全離不開 AI 了,我每天的工作中至少有 50% 是 AI 輔助完成的。

而且,這個比例還在持續提升。

與此同時,隨著一代又一代新模型的推出,不管是我的工作效率和質量,還是我在 Token 上的每月消費,都在快速增長。

昨晚我看了個消息,Anthropic 發布了一個連他們自己都不敢公開給所有人使用的模型,因為真的太強了。

這個新模型的名字叫「Mythos」,翻譯成中文就是「神話」的意思。

目前是預覽版,所以官方叫它「Mythos Preview」。不過,這次是以一個叫「Project Glasswing」的項目形式推出的。

關于這個項目,我后面會講。


上個月,Anthropic 一份內部文檔意外泄露,里面提到有一個比 Opus 更大、更強的模型正在開發,代號就是 Mythos。

隨后,Anthropic 把這次泄露歸因于「人為錯誤」,也沒有進一步說明理由。

現在,這個代號是 Mythos 的模型算是正式官宣了。

官宣歸官宣,但它并沒有公開發布上線。也就是說,普通用戶還不能使用。

原因很直接,Anthropic 覺得這個模型太強了,在安全機制到位之前不適合向所有人開放。

我覺得,這句話值得停下來想一秒。

通常,一家 AI 公司發布新模型巴不得第一時間上線搶占市場,但這次 Anthropic 的做法明顯有點反常。

在我看來,不是他們不想發,而是不敢發。

因為,這個叫 Mythos 的模型的確很強大。

先看幾個官方公布的測試數據。

在編碼能力上,Mythos 和目前公開最強的 Claude Opus 4.6 之間的差距不小,在各項基準測試中,Mythos 基本是完勝 Opus 4.6。


推理能力上,在 GPQA Diamond(研究生水平科學問答)測試中,結果是 94.6% vs 91.3%,Mythos 勝。

在 Humanity's Last Exam 有工具和無工具測試中,也都是 Mythos 完勝。


跟 Agent 有關的計算機操作能力上,OSWorld-Verified(自主完成電腦任務),Mythos 以 79.6% 超過 Oputs 4.6 的 72.7%。

每一個維度上,Mythos 都強于 Opus 4.6,有些甚至是碾壓式超過。


在一些任務表現上,差距已經不是小步迭代,而是大幅躍升。比如 SWE-bench Multimodal 從 27.1% 跳到 59%,幾乎翻了一倍。

讓他們不敢上線 Mythos 的一個最核心原因,就是它突破軟件世界的安全防線能力太強了。

說白了,全世界所有的系統和軟件都有漏洞,而 Mythos 可以用超過人類的水平發現并攻擊這些漏洞。

假設,這種能力被黑客掌握,那全世界的操作系統和軟件都會遭殃,尤其是一些公共基礎設施和國家安全。

Anthropic 在公告里有這么一句話,看完后我覺得細思極恐。


翻譯過來就是:「 AI 模型的編碼能力已經達到了極高水平,在發現和利用軟件漏洞方面,它們幾乎可以超越除最熟練的人類之外的所有人」。

關于這句話,我想多展開一下。

我是程序員出身,所以我知道軟件的構建方式是怎樣的,以及不同人寫出來的代碼差異有多大。

還有,沒有哪個軟件敢說自己沒有漏斗,即便這個漏洞從來沒被發現過。

以前的漏洞之所以能幾十年安靜地躺在系統里,并不是因為系統足夠安全。

而是因為找漏洞這件事,需要極高的專業能力,極大的耐心和精力,以及大量的時間。

會的人太少,敢投入的人就更少了。

這種「能力稀缺」,構成了整個軟件安全世界的隱性前提。AI 介入之后,這個前提就開始松動了。

AI 能以超過大多數非頂尖人類能力的方式開展工作,我們可以用它來攻擊漏洞,當然也可以用它來堵住漏洞。

為了解決這個問題,接下來我說下 Anthropic 搞的這個 Project Glasswing 是什么。

簡單說,這是一個利用 Mythos 的能力幫全世界基礎設施系統找 bug 的項目。

參與方包括 AWS、蘋果、微軟、谷歌、英偉達、思科、Linux 基金會等共計 12 家機構。


這個陣容覆蓋了云計算、操作系統、芯片、瀏覽器、金融基礎設施、網絡安全和開源生態。

換句話說,全球數字基礎設施的核心參與者幾乎都在這個項目里了。

這個項目的核心邏輯只有一條,讓防守方先用上這個頂級 AI 模型的能力。

因為如果攻擊方先拿到同等級的工具,窗口一旦打開就很難關上。Anthropic 承諾提供 1 億美元的模型使用額度,覆蓋研究預覽期。

除了 12 家核心機構,還有超過 40 個維護關鍵軟件基礎設施的組織獲得了訪問權限,可以用 Mythos 掃描自家系統和開源項目。

同時,Anthropic 向 Linux 基金會捐了 250 萬美元,向 Apache 軟件基金會捐了 150 萬美元,這二者都是軟件世界的基礎設施。

這么說吧,我們現在使用的各種 App、網站、系統,基本上都是以他們為底層架構的。

在我看來,Anthropic 這次算是干了件好事,不僅推出了更強的模型,還花錢給全球信息基礎設施讓他們來完善自己。

畢竟,如果裸上的話,對誰都沒有好處。

可能說到這你還是感覺不到 Mythos 到底有多強,我從官方原文里看到了三個具體案例,我覺得比數字更能說明問題。


第一個,OpenBSD。

這是公認安全性極高的操作系統,很多關鍵基礎設施會跑在上面,包括我們用的蘋果手機 iOS 系統、Android 系統、甚至一些企業和機構內部系統。

Mythos 在里面發現了一個存在了 27 年的漏洞,攻擊者只要連上目標機器,就能讓它遠程崩潰。

27 年!不是沒人在意,是壓根沒人找到。

第二個,FFmpeg。

幾乎所有需要處理視頻的軟件都依賴它,你們用的各種視頻播放軟件基本上都有它的身影。

有個漏洞躲在一行寫于 16 年前的代碼里,自動化測試工具反復攻擊了整整 500 萬次,每次都沒找到。

但是,Mythos 找到了。

第三個,Linux 內核。

這個就不用多說了,基本上可以說是整個互聯網的基礎設施,也最值得警惕。

Mythos 不只是發現了幾個獨立漏洞,而是把多個漏洞串聯成一條攻擊鏈。

從普通用戶權限開始,一路提權,最終實現對整臺機器的完全控制。

關于 Linux 這個,和前兩個案例的性質完全不一樣。

找漏洞,是分析能力。

但串漏洞,就是策略能力了。

就像很多產品經理,會畫原型圖會寫文檔會做數據分析,這些是單點能力。但把業務、產品、商業串起來,就是策略能力了。

一個能規劃攻擊路徑的模型,已經不只是審計工具了,它更接近于一個可以在數字環境里主動行動的智能體。

以上三個案例,Anthropic 采取的都是先發現、先報告、先修復、再披露的方式,目前均已修復。

看到這,你就知道 Mythos 有多強了,就像一頭暫時不敢被放出籠的猛獸,現實世界需要先做好適應它的準備。

我想在這里說幾個觀察,或許也是接下來真正變化的開始。

第一,軟件世界的安全假設正在失效。

今天我們習以為常的軟件穩定性,并不完全來自系統設計足夠好。很大程度上,它依賴的是攻擊能力的稀缺。

說得直白點,不是軟件足夠強,而是人不夠強。

找漏洞需要成本,構造利用鏈需要時間,大規模掃描需要資源。所以很多技術債、陳年 bug、老舊系統就那樣活著,從沒被認真清理過。

就像我們做產品一樣,我們覺得邏輯閉環了,沒問題了,并不代表真的萬事無憂了,很可能是我們的能力上限到了。

Mythos 展現的能力,是漏洞從被發現到被利用的時間窗口從過去的幾個月被壓縮到了幾分鐘。

幾分鐘意味著什么?

意味著補丁的節奏,修復的流程,已經開始跟不上攻擊的速度了。

第二,開源世界會最先感受到壓力。

今天大多數現代軟件,底下都壓著大量開源依賴。平時看不見,一旦被打穿,就是全行業同時受影響。

可能有讀者不是很了解這個邏輯,用大白話說,就是我們現在使用的所有軟件都有開源項目作為底層,而這些項目的源代碼是對所有人可見的。

以后當模型能持續地、大規模地掃描開源項目,開源社區維護者們面對的壓力級別會完全不一樣。

這也是為什么 Anthropic 要給 Linux 基金會和 Apache 基金會捐錢的原因。

不是做公益,而是承認開源基礎設施是 AI 時代整個數字世界最脆弱、也最不能倒的那層地基,他們不想被當做壞人和惡人而已。

第三,人會被弱化,AI 開始和 AI 博弈。

以前互聯網產品安全團隊的價值,在于人的判斷力、經驗積累和對系統的深度理解。

未來,這件事會換個邏輯。

比的是誰的模型更強,誰的工具接得更快,誰能把 AI 審計嵌進開發流程的最前端。

這不是程序員被替代的問題,而是安全行業本身的生產方式會重組。

好的那面,是數千個高危漏洞可以在幾周內被找出來。麻煩的是,攻擊方遲早也會有同等級的工具。

到那個時候,軟件產品的安全不再是人和人的對抗,而是模型和模型之間的攻防博弈。

這次,Anthropic 不只發布了能力,還發布了風險。可能是目前這個階段,整個行業最需要看到的那種誠實。

所有人都在談 AI 如何改變工作效率,這沒毛病。

但 Mythos 也在提醒我們,AI 能力的躍最終會從內容世界傳導到軟件世界,再傳導到整個數字世界的基礎設施。

內容世界被改寫,影響的是流量邏輯。

軟件世界被改寫,動的是地基。

此時,我想起了電影《2012》里的一句臺詞,也作為這篇文章的結尾吧。

「無論你是誰,不分種族,不分國家,明天我們都沒有區別!」

PS:我很少寫這種長文,看到這你至少已經花了10分鐘,說明你是擁抱變化喜歡思考的人。那么,就來個點贊、在看、轉發,讓更多人加入對明天的期待中。

················· 唐韌出品 ·················

安可時刻

昨天看完 Mythos 的官方介紹后,我起身走到窗邊發了一會兒呆。

沒想什么,只是有點恍惚,而我的幾個 AI 員工還在電腦上幫我干活,有的在分析數據、有的在搭建文章框架、有的在寫項目文檔。

昨天我還新招了個 AI 員工,取名唐小藝,以后我所有的封面圖、海報、甚至我的日常攝影需求都交給他了。


以下,就是他給我「拍」的一張照片,還原了上面我描述的場景。


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
48小時內!高市開始反擊:召見中國大使后,日本又爆發一個噩耗

48小時內!高市開始反擊:召見中國大使后,日本又爆發一個噩耗

羽逸地之光
2026-06-30 17:15:53
黃浦江畔,響起AI WAN加速落地的發令槍

黃浦江畔,響起AI WAN加速落地的發令槍

腦極體
2026-06-29 11:33:06
不只DeepSeek,階躍等開源JetSpec:大模型解碼提速近10倍

不只DeepSeek,階躍等開源JetSpec:大模型解碼提速近10倍

機器之心Pro
2026-06-30 17:56:14
六代機,就這么明晃晃的官宣了

六代機,就這么明晃晃的官宣了

俠客棧
2026-06-30 13:35:58
韓紅基金會塌方,數千月捐者退訂,為什么一句話,會引巨大風波?

韓紅基金會塌方,數千月捐者退訂,為什么一句話,會引巨大風波?

貴重物品愛美食
2026-07-01 16:31:40
桃李做快餐、鮑師傅賣西餐,倒閉9萬家后,面包房的盡頭是飯店?

桃李做快餐、鮑師傅賣西餐,倒閉9萬家后,面包房的盡頭是飯店?

藍鯨新聞
2026-07-01 09:45:46
印度裔抱團、代碼被鎖死、公司停擺,張江事件的致命教訓!

印度裔抱團、代碼被鎖死、公司停擺,張江事件的致命教訓!

A活著
2026-07-01 17:03:00
密碼危機:7名印度員工大鬧上海灘,老板以淚洗面哭成狗

密碼危機:7名印度員工大鬧上海灘,老板以淚洗面哭成狗

霧滿攔江
2026-07-01 13:47:50
明天世界杯三場比賽預測:英格蘭加時勝,比利時被淘汰,美國穩贏

明天世界杯三場比賽預測:英格蘭加時勝,比利時被淘汰,美國穩贏

kio魚
2026-07-01 10:32:47
醫生提醒:若長期一天只吃兩頓飯,用不了半年,或患上這4種疾病

醫生提醒:若長期一天只吃兩頓飯,用不了半年,或患上這4種疾病

路醫生健康科普
2026-06-29 12:05:03
韓紅基金會給北京捐救護車?網友追問不斷,窮人給富人捐錢合適嗎

韓紅基金會給北京捐救護車?網友追問不斷,窮人給富人捐錢合適嗎

眼光很亮
2026-07-01 11:18:28
湖南一家5口慘遭滅門案,告破

湖南一家5口慘遭滅門案,告破

南方都市報
2026-06-30 20:08:32
北京大媽公交車上打暈患癌姑娘,一巴掌斷送退休后的美好幸福生活

北京大媽公交車上打暈患癌姑娘,一巴掌斷送退休后的美好幸福生活

嘉琪Feel
2025-07-09 23:05:01
中方接到消息,俄羅斯或斷供柴油,梅德韋杰夫斷言:七大挑戰來臨

中方接到消息,俄羅斯或斷供柴油,梅德韋杰夫斷言:七大挑戰來臨

流史歲月
2026-06-30 20:35:41
萊昂納德重回多倫多!快船猛龍達成1換7交易 鶯歌迪克奔赴洛城

萊昂納德重回多倫多!快船猛龍達成1換7交易 鶯歌迪克奔赴洛城

羅說NBA
2026-07-01 03:59:21
泰山周邊建起135公里刀片刺繩隔離網?多部門回復不了解;此前有文章稱可消除“驢友”非法穿越等隱患

泰山周邊建起135公里刀片刺繩隔離網?多部門回復不了解;此前有文章稱可消除“驢友”非法穿越等隱患

大風新聞
2026-06-30 16:08:36
高速上一特斯拉撞護欄起火,有人拍到一路過的理想車主拼命把特斯拉女司機救了出來,理想官方:我們也贊賞推崇這種善舉

高速上一特斯拉撞護欄起火,有人拍到一路過的理想車主拼命把特斯拉女司機救了出來,理想官方:我們也贊賞推崇這種善舉

都市快報橙柿互動
2026-07-01 17:38:55
為哈梅內伊復仇仍是首要任務?伊朗專家會議中63名成員呼吁暗殺特朗普和內塔尼亞胡

為哈梅內伊復仇仍是首要任務?伊朗專家會議中63名成員呼吁暗殺特朗普和內塔尼亞胡

紅星新聞
2026-07-01 17:22:11
A股重大調整,7月6日起施行

A股重大調整,7月6日起施行

21世紀經濟報道
2026-07-01 17:00:05
楊子家族28億套現的清算開始了?

楊子家族28億套現的清算開始了?

中國新聞周刊
2026-07-01 16:23:03
2026-07-01 19:36:49
唐韌 incentive-icons
唐韌
用產品思維解決難題
1499文章數 2043關注度
往期回顧 全部

科技要聞

Claude Code被曝“植入木馬”識別中國用戶

頭條要聞

特斯拉撞護欄起火 路過車主拼命把特斯拉女司機救出來

頭條要聞

特斯拉撞護欄起火 路過車主拼命把特斯拉女司機救出來

體育要聞

賣球衣救子的門將,把德國撲出了世界杯

娛樂要聞

張凌赫:我連心疼你都隔著時差

財經要聞

新氧貸款:宣傳年化15%,實際頂格24%

汽車要聞

半程收官 上汽集團銷量突破200萬輛

態度原創

旅游
親子
本地
藝術
公開課

旅游要聞

洋面孔成旅游推介官,三亞的“朋友圈”為何越擴越大?

親子要聞

云南文山:托幼一體化破解幼兒入園銜接難題

本地新聞

強烈建議,全國高校都向這所大學看齊!

藝術要聞

這5件2026屆畢業油畫作品,被中國美術學院美術館收藏

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版