亚洲中文字幕乱码亚洲-蜜桃成熟视频在线观看-免费中文字幕视频在线-中国五十路熟妇洗澡视频-亚洲av伊人啪啪c-国产精品成人一区二区-国产自拍视频一区在线观看-成人一区不卡二区三区四区-亚洲情精品中文字幕99在线

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Anthropic把最強模型鎖了3年,用戶從垃圾桶里翻出了真相

0
分享至

上周,LayerX安全團隊和劍橋大學(xué)的研究人員在一臺未設(shè)防的服務(wù)器里,翻出了Anthropic藏了數(shù)年的秘密。這個秘密的代號叫Mythos,一個被公司自己判定為"過于危險、不宜公開"的AI模型。在科技圈習(xí)慣了"發(fā)布即勝利"的鑼鼓聲中,一家公司主動把自家產(chǎn)品埋進(jìn)沙子里,這事本身比模型參數(shù)更值得玩味。

一場意外的考古:從廢棄緩存到技術(shù)地震

發(fā)現(xiàn)過程帶著點黑色幽默。研究人員本是在例行掃描公開云存儲的漏洞,結(jié)果撞進(jìn)了一個本該被清空的開發(fā)環(huán)境。里面躺著幾份未發(fā)布的博客草稿、技術(shù)規(guī)格表,以及一組讓所有人愣住的能力描述。

根據(jù)泄露文檔,Mythos在特定任務(wù)上的表現(xiàn)遠(yuǎn)超當(dāng)前公開的Claude系列,尤其是在長文本關(guān)聯(lián)推理和跨文檔信息整合上。

但真正引發(fā)討論的不是"多強",而是"多危險"。文檔中多次出現(xiàn)對模型"信息挖掘能力"的警告——它能從海量公開資料中,拼湊出被刻意分散隱藏的信息。不是黑客式的入侵,而是純粹的閱讀理解和模式識別,卻能達(dá)到類似的效果。

這有點像給一個人類研究員無限的時間和完美的記憶力,讓他去讀五十年間的所有報紙。他可能會發(fā)現(xiàn)某份1970年代的采購記錄,和2023年的一份專利申請,指向同一個被刻意模糊的項目。Mythos做的就是這個,只是速度快了百萬倍。

為什么"太強"反而成了"不能發(fā)"

Anthropic的決策邏輯,在泄露的內(nèi)部郵件里有跡可循。團隊討論的核心不是技術(shù)瓶頸,而是"不可控的下游影響"。一個能自動連接公開 dots(公開信息點)的系統(tǒng),意味著任何試圖通過"信息分散"來保護(hù)的秘密,都可能被重新組裝。

這包括但不限于:企業(yè)未公開的供應(yīng)鏈布局、個人被刻意遺忘的過往、政府希望保持模糊的戰(zhàn)略意圖。更棘手的是,這些輸出完全基于合法獲取的公開信息,傳統(tǒng)的內(nèi)容審核框架對此幾乎無效。

一位參與早期評估的研究員在內(nèi)部討論中寫道:「我們不是在擔(dān)心它會說錯什么,而是在擔(dān)心它說對太多?!?/b>

這種"說對太多"的風(fēng)險,在AI安全領(lǐng)域有個專門的概念:信息危害(information hazard)。指的不是虛假信息,而是真實信息的組合方式本身造成傷害。Mythos的處境,讓它成了這個概念的極端案例。

對比行業(yè)常態(tài):為什么Anthropic的選擇如此反常

把時間線拉回2023-2024年,各大實驗室的發(fā)布節(jié)奏幾乎是軍備競賽式的。OpenAI的GPT-4、Google的Gemini、Meta的Llama系列,都在以月為單位迭代。甚至出現(xiàn)過模型還沒訓(xùn)練完,市場部就開始預(yù)熱的情況。

在這種氛圍下,Anthropic的克制顯得格格不入。他們不是沒能力發(fā)布——泄露的技術(shù)規(guī)格顯示,Mythos的架構(gòu)和訓(xùn)練流程早已成熟。他們也不是沒動機——一家估值數(shù)百億美元的AI公司,本該有最強的沖動用技術(shù)突破來鞏固地位。

但Anthropic的創(chuàng)始團隊有段特殊背景。Dario和Daniela Amodei兄妹均出自O(shè)penAI,而離開的直接原因正是對AI安全優(yōu)先級的不滿。他們創(chuàng)立Anthropic時,核心承諾就是"安全優(yōu)先于能力展示"。Mythos的封存,可以看作這個承諾的終極測試。

一個細(xì)節(jié)值得注意:泄露文檔中顯示,Mythos的命名本身帶有隱喻色彩。在希臘語境中,mythos既是"神話",也指"未被言說的深層敘事"——一個關(guān)于"發(fā)現(xiàn)隱藏故事"的雙關(guān)。

技術(shù)層面的真正爭議:能力邊界在哪里

拋開倫理討論,Mythos的技術(shù)設(shè)計本身也有看點。泄露的規(guī)格表顯示,它采用了不同于Claude的注意力機制變體,專門優(yōu)化了對超長上下文(超過100萬token)的關(guān)聯(lián)檢索。

這是什么概念?當(dāng)前主流的上下文窗口在20萬token左右,大概相當(dāng)于一本長篇小說的長度。Mythos的處理規(guī)模是這個的五倍以上,而且關(guān)鍵不在于"能讀多長",而在于"能記住多少跨文檔的細(xì)微關(guān)聯(lián)"。

研究人員在分析泄露材料時,注意到一個被反復(fù)標(biāo)記的測試案例:Mythos被投喂了某國過去三十年的所有公開政府采購記錄、學(xué)術(shù)論文引用網(wǎng)絡(luò)、以及專利數(shù)據(jù)庫。在沒有額外提示的情況下,它輸出了一份報告,準(zhǔn)確推斷出了三項被官方否認(rèn)的軍民兩用技術(shù)項目的時間線和關(guān)鍵人物。

這些推斷的每一步,都基于公開可查的資料。但人類分析師需要數(shù)月甚至數(shù)年的工作,被壓縮到了幾小時。更關(guān)鍵的是,沒有人類分析師會無聊到去翻閱三十年跨度的瑣碎記錄——而Mythos沒有"無聊"這個概念。

行業(yè)反應(yīng):從沉默到分裂

泄露事件發(fā)生后,Anthropic的官方回應(yīng)只有一句話:「我們不對未發(fā)布產(chǎn)品的猜測置評。」這種冷處理,和OpenAI面對類似事件時的積極澄清形成對比。

但私下里的討論從未停止。據(jù)兩位接近不同AI實驗室的人士透露,各家的安全團隊都在重新評估自己的"發(fā)布閾值"。一位Google DeepMind的研究員在私人通訊中表示:「這讓我們所有人都在問,我們的紅線到底劃在哪里?!?/p>

更復(fù)雜的反應(yīng)來自政策層面。歐盟AI法案的制定者之一,在一場閉門研討會上提及此事,認(rèn)為Mythos的案例可能推動"能力分級"制度的細(xì)化——不是按應(yīng)用領(lǐng)域,而是按"信息整合風(fēng)險"來分類監(jiān)管。但這也引發(fā)了新的問題:如何定義和測量這種風(fēng)險,本身就是一個未解決的學(xué)術(shù)難題。

與此同時,部分開源社區(qū)的聲浪正在升高。一種代表性的觀點是:Anthropic的"保護(hù)性封存",本質(zhì)上是一種技術(shù)壟斷的變體——用安全的名義,把最強大的能力鎖在自家保險庫里。

一個被忽視的用戶視角:誰在為"安全"買單

在所有關(guān)于Mythos的討論中,有一個群體的聲音很少被提及:那些本可能從這項技術(shù)中獲益的普通用戶。

想象一位調(diào)查記者,試圖追蹤某家上市公司的供應(yīng)鏈污染問題。公開信息分散在數(shù)百份環(huán)保證告、供應(yīng)商變更公告、以及地方新聞的邊角料里。Mythos的能力,理論上可以讓這樣的調(diào)查從數(shù)月縮短到數(shù)天。但因為"可能被濫用"的風(fēng)險,這個工具被鎖進(jìn)了抽屜。

這不是在為Mythos辯護(hù)。但值得追問的是:當(dāng)一家私營公司單方面決定某項技術(shù)的社會可用性時,這個決策的合法性基礎(chǔ)是什么?尤其是當(dāng)這家公司本身,可能從這種"獨家持有"中獲得戰(zhàn)略優(yōu)勢時。

Anthropic的回應(yīng)邏輯是"受托責(zé)任"——作為技術(shù)的創(chuàng)造者,他們有義務(wù)預(yù)判并阻止可預(yù)見的傷害。但這個框架的邊界很模糊。誰來判斷什么是"可預(yù)見的傷害"?誰來監(jiān)督這種判斷不被利益扭曲?

泄露之后的連鎖反應(yīng)

LayerX和劍橋團隊公布發(fā)現(xiàn)后不到48小時,那個未設(shè)防的服務(wù)器就被清空了。但信息的擴散早已不可控。技術(shù)社區(qū)開始根據(jù)泄露的片段,反向推測Mythos的架構(gòu)細(xì)節(jié);幾家對沖基金 reportedly 調(diào)整了他們對Anthropic估值模型的假設(shè);更有意思的是,某家競爭對手的CEO在內(nèi)部全員會上,把Mythos的泄露稱為"今年最重要的行業(yè)事件"。

這些反應(yīng)揭示了一個被低估的事實:在AI領(lǐng)域,"不發(fā)布"本身也是一種信號,有時甚至比發(fā)布更有影響力。Mythos的存在被確認(rèn)后,市場開始重新評估各家的"隱藏牌"——那些可能已經(jīng)存在、但選擇不公開的能力。

一位風(fēng)險投資人在社交媒體上的評論被大量轉(zhuǎn)發(fā):「我們現(xiàn)在知道,至少有一家公司愿意為了安全犧牲市場份額。問題是,這是真誠的原則,還是精明的定位?」

這個問題沒有答案,或許永遠(yuǎn)不會有。但Mythos的泄露,至少把一個問題推到了臺面:當(dāng)AI的能力開始觸及"知道太多"的領(lǐng)域時,誰來決定什么是可以知道的,什么是應(yīng)該被保護(hù)的——以及,這種決定權(quán)本身,是否比技術(shù)更值得警惕。

泄露文檔的最后一份草稿,是一篇從未發(fā)布的博客文章的開頭。作者寫道:「我們建造了一盞燈,能照亮房間里最黑暗的角落。但現(xiàn)在我們意識到,有些陰影之所以存在,是因為有人需要它們?!?/p>

這盞燈最終沒有被點亮。但問題是,當(dāng)燈泡已經(jīng)造好、電路已經(jīng)接通,"不按下開關(guān)"這個決定,能維持多久?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
震驚!白發(fā)老人高鐵上辦公被調(diào)侃“高端牛馬”,身旁女助理引關(guān)注

震驚!白發(fā)老人高鐵上辦公被調(diào)侃“高端牛馬”,身旁女助理引關(guān)注

火山詩話
2026-04-15 06:12:38
港股光通信概念股午后沖高

港股光通信概念股午后沖高

財聯(lián)社
2026-04-16 14:58:02
北電藝考成績前30名名單來了!前5名湖北考生占3個,第3名是童星

北電藝考成績前30名名單來了!前5名湖北考生占3個,第3名是童星

露珠聊影視
2026-04-14 11:28:06
研究表明:男性嫖娼率6.4%,女性出軌率15%,且越有錢越開放!

研究表明:男性嫖娼率6.4%,女性出軌率15%,且越有錢越開放!

黯泉
2026-04-01 17:28:39
中國女排6人被主帥點名,隊伍框架已基本穩(wěn)固,人員流動將減少

中國女排6人被主帥點名,隊伍框架已基本穩(wěn)固,人員流動將減少

體育快遞小哥哥
2026-04-16 16:58:12
四川一男子火鍋店喝酒,見老板娘長得漂亮,竟要老板娘陪他喝酒!

四川一男子火鍋店喝酒,見老板娘長得漂亮,竟要老板娘陪他喝酒!

一口娛樂
2026-04-16 16:19:41
騷擾電話為何總打給你?元兇就在微信,關(guān)掉這開關(guān)立馬清凈

騷擾電話為何總打給你?元兇就在微信,關(guān)掉這開關(guān)立馬清凈

復(fù)轉(zhuǎn)這些年
2026-04-16 12:31:37
擔(dān)心的事還是發(fā)生,跑丟編制的女護(hù)士張水華,又回到了她的怪圈

擔(dān)心的事還是發(fā)生,跑丟編制的女護(hù)士張水華,又回到了她的怪圈

芭比衣櫥
2026-04-14 13:22:53
曝廣東男籃裁掉麥考爾,兩大兩小備戰(zhàn)季后賽,薩姆納傷病有些嚴(yán)重

曝廣東男籃裁掉麥考爾,兩大兩小備戰(zhàn)季后賽,薩姆納傷病有些嚴(yán)重

中國籃壇快訊
2026-04-16 17:08:02
38人遇難!最新確認(rèn):客機墜毀系遭俄羅斯誤擊

38人遇難!最新確認(rèn):客機墜毀系遭俄羅斯誤擊

揚子晚報
2026-04-16 14:40:38
盲目的大學(xué)擴招,正在反噬整個社會

盲目的大學(xué)擴招,正在反噬整個社會

凡人志
2026-03-25 01:34:53
不知不覺都老了,這兩位演員已經(jīng)不在了,你還記得他們嗎?

不知不覺都老了,這兩位演員已經(jīng)不在了,你還記得他們嗎?

阿廢冷眼觀察所
2026-04-11 17:02:28
“高鐵小少爺”事件,讓普通家長幻想破滅:麻辣燙騙不來真少爺

“高鐵小少爺”事件,讓普通家長幻想破滅:麻辣燙騙不來真少爺

妍妍教育日記
2026-03-14 09:25:11
美國封鎖霍爾木茲海峽至今,沒有任何伊朗油輪成功突破封鎖

美國封鎖霍爾木茲海峽至今,沒有任何伊朗油輪成功突破封鎖

山河路口
2026-04-15 19:07:44
“忖度”并不讀chuǎi duó,更不讀cùn duó,身邊90%的人都讀錯了

“忖度”并不讀chuǎi duó,更不讀cùn duó,身邊90%的人都讀錯了

未央看點
2026-04-16 08:38:58
河南巡視再亮劍!新一輪工作全面鋪開,多地將被重點督查

河南巡視再亮劍!新一輪工作全面鋪開,多地將被重點督查

阿離家居
2026-04-16 15:30:06
鄭麗文與洪秀柱正面交鋒:不是誰對誰錯,而是兩種邏輯在碰撞

鄭麗文與洪秀柱正面交鋒:不是誰對誰錯,而是兩種邏輯在碰撞

藍(lán)色海邊
2026-04-15 07:08:29
萬斯失寵崩盤,盧比奧悄悄上位,白宮權(quán)力洗牌,2028大局或已鎖定

萬斯失寵崩盤,盧比奧悄悄上位,白宮權(quán)力洗牌,2028大局或已鎖定

有范又有料
2026-04-16 17:06:01
巴基斯坦最操心的,還是中巴的大事,總統(tǒng)下令全國各地都對接中國

巴基斯坦最操心的,還是中巴的大事,總統(tǒng)下令全國各地都對接中國

蕭鑟科普解說
2026-04-15 14:55:53
美國空軍公布B-21隱身轟炸機首次空中加油測試,拓展全球打擊范圍

美國空軍公布B-21隱身轟炸機首次空中加油測試,拓展全球打擊范圍

零度Military
2026-04-15 18:02:32
2026-04-16 17:52:49
灰度測試中
灰度測試中
生活正在重構(gòu),目前還在灰度測試階段,暫不全量發(fā)布。
1431文章數(shù) 15關(guān)注度
往期回顧 全部

科技要聞

趙明:智駕之戰(zhàn),看誰在大模型上更高效

頭條要聞

東北男子投訴公交提前發(fā)車丟工作 單位被施壓將其解雇

頭條要聞

東北男子投訴公交提前發(fā)車丟工作 單位被施壓將其解雇

體育要聞

很快,亞洲籃球要有自己的NCAA了?

娛樂要聞

絲芭傳媒創(chuàng)始人王子杰去世,享年63歲

財經(jīng)要聞

一季度GDP,5.0%!

汽車要聞

空間大五個乘客都滿意?體驗嵐圖泰山X8

態(tài)度原創(chuàng)

教育
數(shù)碼
健康
時尚
手機

教育要聞

“交叉深造”“反向深造”時代,來了?

數(shù)碼要聞

小米食堂新品“小米冰淇淋”走紅,3天2000多只“干爆”機器

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

上新|| 這條漂亮小裙子,好穿到不想脫

手機要聞

安卓最強Pro來了!小米18 Pro外觀渲染圖沖上熱搜:新增獨立AI按鍵

無障礙瀏覽 進(jìn)入關(guān)懷版