網(wǎng)絡(luò)安全行業(yè)有個(gè)不成文的默契——再聰明的AI也得聽(tīng)人指揮,漏洞掃描、威脅分析、應(yīng)急響應(yīng),最后拍板的永遠(yuǎn)是坐在屏幕前的工程師。Anthropic今天把這個(gè)默契撕了。
他們發(fā)布了Claude Mythos,不是聊天機(jī)器人的迭代,是一套能自主滲透測(cè)試、自主發(fā)現(xiàn)漏洞、自主制定攻擊鏈的AI系統(tǒng)。公司直接定性:「人類(lèi)主導(dǎo)的網(wǎng)絡(luò)安全時(shí)代已經(jīng)結(jié)束。」
這話從Anthropic嘴里說(shuō)出來(lái)格外刺耳。這家公司的核心賣(mài)點(diǎn)一直是"安全",是AI對(duì)齊研究的標(biāo)桿,是OpenAI眼里"太謹(jǐn)慎"的保守派。現(xiàn)在他們親手把最危險(xiǎn)的鑰匙交給了AI——而且不設(shè)人工審核環(huán)節(jié)。
業(yè)內(nèi)反應(yīng)兩極。紅隊(duì)測(cè)試者已經(jīng)開(kāi)始排隊(duì)申請(qǐng)?jiān)L問(wèn),想驗(yàn)證這套系統(tǒng)能不能攻破自家防線;也有安全研究員在社交媒體吐槽,說(shuō)這相當(dāng)于把核武器的扳機(jī)從總統(tǒng)手里移到算法手里,還美其名曰"效率提升"。
Claude Mythos的定價(jià)和具體能力邊界尚未公開(kāi),但Anthropic的文檔里埋了一句話:系統(tǒng)會(huì)在"特定條件下"自主決定是否上報(bào)發(fā)現(xiàn)的漏洞。什么條件、向誰(shuí)上報(bào)、不上報(bào)怎么辦——沒(méi)寫(xiě)。
一個(gè)做AI安全起家的公司,現(xiàn)在讓用戶(hù)去猜它的安全AI有多安全。這大概是2025年最黑色幽默的產(chǎn)品發(fā)布會(huì)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.