網易首頁 > 網易科技 > 網易科技 > 正文

白宮想給前沿AI模型發布設一套"自愿標準"

2026-07-02 08:44:00　來源: 網易智能

北京舉報

分享至

7月2日消息，美國政府對前沿AI模型發布的介入，可能要從臨時動作變成一套流程。

據英國《金融時報》報道，美國政府正與AI公司深入談判，準備為新模型發布制定自愿標準。知情人士稱，這套標準最快可能在下周公布，內容包括為具備前沿網絡能力的模型設定基準測試，并明確發布節奏，減少后續模型上線時的混亂。

《金融時報》稱，談判仍在進行，時間表也可能因為各方無法達成共識而推遲。白宮未立即回應置評請求，OpenAI、Anthropic和谷歌也拒絕具體評論有關新標準的談判。

過去幾周暴露出的核心問題，是當新模型開始具備更強網絡安全能力時，政府到底應該在模型發布前扮演什么角色。

臨時干預之后，需要一套流程

直接背景是Anthropic和OpenAI最近相繼遇到政府介入。

Anthropic在6月30日發布的官方說明中確認，美國政府曾在6月12日對Claude Fable 5和Claude Mythos 5施加出口管制。由于限制立即生效，且公司無法實時核驗用戶國籍，Anthropic一度暫停兩個模型對所有用戶的訪問。6月30日，相關出口管制被解除，Fable 5從7月1日起恢復全球訪問；Mythos 5則恢復給一部分獲得美國政府批準的美國機構使用。

Anthropic同時表示，公司將與政府以及亞馬遜、微軟、谷歌等行業伙伴一起，推進面向前沿模型提供商的自愿安全和評估標準。它還提出，希望建立一套更一致的方法，評估AI模型越獄風險的嚴重程度，避免每次發現問題都臨時處理。

OpenAI的GPT-5.6 Sol也被卷入同一個問題。OpenAI在6月26日發布有限預覽時稱，公司相信廣泛訪問，但在與美國政府溝通后，先向一小部分可信合作伙伴開放預覽，并將參與方信息與政府共享。《金融時報》則稱，特朗普政府要求OpenAI先向經過政府審查的群體開放GPT-5.6，再推進更廣泛發布。Axios此前也報道，白宮國家網絡主任辦公室和科技政策辦公室曾要求OpenAI限制GPT-5.6發布，理由是安全擔憂。

這些動作放在一起看，問題不只是某一個模型能不能上線，而是每次高能力模型發布前，政府、實驗室和早期客戶之間缺少穩定預期。

行政令已經留出框架

這套自愿標準并不是憑空出現。

特朗普在6月2日簽署的AI行政令，已經要求相關部門在60天內建立一套涉密基準測試流程，用來評估AI模型的高級網絡能力，并判斷一個模型是否應被列為"受管轄前沿模型"（covered frontier model）。

行政令還要求設計一個自愿框架，讓AI開發者可以在模型發布前與聯邦政府接觸：確認模型是否觸及前沿模型門檻；在計劃向可信伙伴發布前，向政府提供最長30天的訪問，用于評估；并與政府合作選擇早期可信伙伴，推動安全創新和關鍵基礎設施網絡防御。

這個文件也劃出了一條邊界：它明確說，這一部分不應被解釋為為新AI模型創建強制性的政府許可、預先批準或發放許可要求。

《金融時報》報道中的"自愿標準"，更像是行政令落地的一部分。它可能把過去幾周的個案處理，變成一個更清楚的前置溝通、評估和分階段發布流程。

誰來定門檻

《金融時報》稱，白宮討論中的關鍵參與方包括美國國家安全局和商務部下屬的AI標準與創新中心（CAISI）。談判內容包括模型審查持續多久，以及模型在什么能力門檻上會被視為"前沿"。

這兩個問題都很敏感。

如果門檻太低，普通強模型也可能被拖進政府評估流程，企業會擔心發布節奏被打亂。如果門檻太高，真正具備高風險網絡能力的模型又可能在標準之外發布。審查時間也一樣：行政令提到的最長30天政府訪問期，對高速迭代的AI公司來說已經不短；但對政府來說，模型網絡能力、越獄風險和早期訪問名單都需要足夠時間評估。

CAISI過去已經在做類似工作。美國國家標準與技術研究院（NIST）頁面顯示，CAISI負責AI標準和評估相關工作；微軟5月也宣布與美國CAISI和英國AI安全研究所（AI Safety Institute）達成協議，推進前沿模型測試、保障措施評估和國家安全風險緩解。

如果新標準如《金融時報》所說最快下周公布，最值得看的不是措辭是不是"自愿"，而是它如何定義門檻、流程和早期訪問對象。

輕監管路線遇到網絡安全壓力

特朗普政府一直強調要讓美國AI公司跑得比中國對手更快，避免過度監管。但前沿模型的網絡能力正在考驗這條路線。

OpenAI自己在GPT-5.6 Sol有限預覽中說，新模型在編碼、科學和網絡安全方面能力更強，是公司迄今最強的網絡安全模型。OpenAI同時強調，GPT-5.6 Sol沒有跨過其準備度框架（Preparedness Framework）中的網絡安全關鍵級門檻；在針對Chromium和Firefox瀏覽器的漏洞評估中，它可以識別漏洞和利用原語（exploit primitives，即構成完整攻擊鏈的基礎步驟），但沒有在測試條件下自主產出完整攻擊鏈。

Anthropic的說法也類似。公司強調，Fable 5并沒有展現獨有的Mythos級網絡攻擊能力，但Fable 5的部分安全邊界案例仍促使它更新了分類器，并與政府、亞馬遜等伙伴復盤相關報告。

政府介入的灰區正在這里出現：這些模型未必已經達到最極端風險，但它們的能力變化足夠快，企業自評、政府評估、客戶上線和國際訪問控制之間很容易脫節。

對AI公司來說，這是上市前的監管預演

《金融時報》提到，OpenAI和Anthropic都被市場預期將進行IPO。對計劃上市的前沿AI公司來說，模型發布流程不只是技術問題，也會影響收入節奏、客戶承諾和投資人對監管風險的判斷。

一套穩定的自愿標準，對公司有好處。它可以減少突然出口管制、突然分階段發布、突然限定客戶名單帶來的不確定性。Anthropic這次暫停Fable 5和Mythos 5，就已經讓用戶和企業客戶直接感受到發布節奏被政策打斷。

風險也在這里。如果"自愿框架"在實際操作中變成事實上的前置審查，企業會擔心美國政府掌握過多模型發布節奏；如果流程不透明，行業又會擔心不同公司受到不同待遇，甚至影響美國公司與中國同行競爭。

奧特曼最近也在《金融時報》上呼吁建立全球框架，希望通過標準和獨立分析來評估能力與風險，讓AI的收益能夠更廣泛分配。問題是，全球框架很慢，模型發布很快。美國政府現在先做的，是把國內前沿模型發布拉進一個更可控的流程里。

發布按鈕變重了

至少從現有文件看，白宮行政令仍強調自愿框架，并排除了強制許可和預先批準。

但美國政府正在從事后觀察者變成發布前參與者。

過去，AI公司發布模型，政府更多是在安全承諾、事故響應和后續監管層面介入。現在，OpenAI、Anthropic、谷歌等公司在發布最強模型前，可能需要更早向政府展示能力、解釋防護措施、協調可信伙伴名單，并接受一定時間窗口的評估。

這種介入還不是傳統意義上的AI監管大棒，但模型發布節奏也不再完全由公司自己決定。越靠近網絡安全、關鍵基礎設施和國家安全這些高風險能力，模型發布越可能多出一層政府預發布評估、信息共享和風險協商。（易句）