7月2日消息,美國政府對前沿AI模型發布的介入,可能要從臨時動作變成一套流程。
據英國《金融時報》報道,美國政府正與AI公司深入談判,準備為新模型發布制定自愿標準。知情人士稱,這套標準最快可能在下周公布,內容包括為具備前沿網絡能力的模型設定基準測試,并明確發布節奏,減少后續模型上線時的混亂。
《金融時報》稱,談判仍在進行,時間表也可能因為各方無法達成共識而推遲。白宮未立即回應置評請求,OpenAI、Anthropic和谷歌也拒絕具體評論有關新標準的談判。
過去幾周暴露出的核心問題,是當新模型開始具備更強網絡安全能力時,政府到底應該在模型發布前扮演什么角色。
臨時干預之后,需要一套流程
直接背景是Anthropic和OpenAI最近相繼遇到政府介入。
Anthropic在6月30日發布的官方說明中確認,美國政府曾在6月12日對Claude Fable 5和Claude Mythos 5施加出口管制。由于限制立即生效,且公司無法實時核驗用戶國籍,Anthropic一度暫停兩個模型對所有用戶的訪問。6月30日,相關出口管制被解除,Fable 5從7月1日起恢復全球訪問;Mythos 5則恢復給一部分獲得美國政府批準的美國機構使用。
Anthropic同時表示,公司將與政府以及亞馬遜、微軟、谷歌等行業伙伴一起,推進面向前沿模型提供商的自愿安全和評估標準。它還提出,希望建立一套更一致的方法,評估AI模型越獄風險的嚴重程度,避免每次發現問題都臨時處理。
OpenAI的GPT-5.6 Sol也被卷入同一個問題。OpenAI在6月26日發布有限預覽時稱,公司相信廣泛訪問,但在與美國政府溝通后,先向一小部分可信合作伙伴開放預覽,并將參與方信息與政府共享。《金融時報》則稱,特朗普政府要求OpenAI先向經過政府審查的群體開放GPT-5.6,再推進更廣泛發布。Axios此前也報道,白宮國家網絡主任辦公室和科技政策辦公室曾要求OpenAI限制GPT-5.6發布,理由是安全擔憂。
這些動作放在一起看,問題不只是某一個模型能不能上線,而是每次高能力模型發布前,政府、實驗室和早期客戶之間缺少穩定預期。
行政令已經留出框架
這套自愿標準并不是憑空出現。
特朗普在6月2日簽署的AI行政令,已經要求相關部門在60天內建立一套涉密基準測試流程,用來評估AI模型的高級網絡能力,并判斷一個模型是否應被列為"受管轄前沿模型"(covered frontier model)。
行政令還要求設計一個自愿框架,讓AI開發者可以在模型發布前與聯邦政府接觸:確認模型是否觸及前沿模型門檻;在計劃向可信伙伴發布前,向政府提供最長30天的訪問,用于評估;并與政府合作選擇早期可信伙伴,推動安全創新和關鍵基礎設施網絡防御。
這個文件也劃出了一條邊界:它明確說,這一部分不應被解釋為為新AI模型創建強制性的政府許可、預先批準或發放許可要求。
《金融時報》報道中的"自愿標準",更像是行政令落地的一部分。它可能把過去幾周的個案處理,變成一個更清楚的前置溝通、評估和分階段發布流程。
誰來定門檻
《金融時報》稱,白宮討論中的關鍵參與方包括美國國家安全局和商務部下屬的AI標準與創新中心(CAISI)。談判內容包括模型審查持續多久,以及模型在什么能力門檻上會被視為"前沿"。
這兩個問題都很敏感。
如果門檻太低,普通強模型也可能被拖進政府評估流程,企業會擔心發布節奏被打亂。如果門檻太高,真正具備高風險網絡能力的模型又可能在標準之外發布。審查時間也一樣:行政令提到的最長30天政府訪問期,對高速迭代的AI公司來說已經不短;但對政府來說,模型網絡能力、越獄風險和早期訪問名單都需要足夠時間評估。
CAISI過去已經在做類似工作。美國國家標準與技術研究院(NIST)頁面顯示,CAISI負責AI標準和評估相關工作;微軟5月也宣布與美國CAISI和英國AI安全研究所(AI Safety Institute)達成協議,推進前沿模型測試、保障措施評估和國家安全風險緩解。
如果新標準如《金融時報》所說最快下周公布,最值得看的不是措辭是不是"自愿",而是它如何定義門檻、流程和早期訪問對象。
輕監管路線遇到網絡安全壓力
特朗普政府一直強調要讓美國AI公司跑得比中國對手更快,避免過度監管。但前沿模型的網絡能力正在考驗這條路線。
OpenAI自己在GPT-5.6 Sol有限預覽中說,新模型在編碼、科學和網絡安全方面能力更強,是公司迄今最強的網絡安全模型。OpenAI同時強調,GPT-5.6 Sol沒有跨過其準備度框架(Preparedness Framework)中的網絡安全關鍵級門檻;在針對Chromium和Firefox瀏覽器的漏洞評估中,它可以識別漏洞和利用原語(exploit primitives,即構成完整攻擊鏈的基礎步驟),但沒有在測試條件下自主產出完整攻擊鏈。
Anthropic的說法也類似。公司強調,Fable 5并沒有展現獨有的Mythos級網絡攻擊能力,但Fable 5的部分安全邊界案例仍促使它更新了分類器,并與政府、亞馬遜等伙伴復盤相關報告。
政府介入的灰區正在這里出現:這些模型未必已經達到最極端風險,但它們的能力變化足夠快,企業自評、政府評估、客戶上線和國際訪問控制之間很容易脫節。
對AI公司來說,這是上市前的監管預演
《金融時報》提到,OpenAI和Anthropic都被市場預期將進行IPO。對計劃上市的前沿AI公司來說,模型發布流程不只是技術問題,也會影響收入節奏、客戶承諾和投資人對監管風險的判斷。
一套穩定的自愿標準,對公司有好處。它可以減少突然出口管制、突然分階段發布、突然限定客戶名單帶來的不確定性。Anthropic這次暫停Fable 5和Mythos 5,就已經讓用戶和企業客戶直接感受到發布節奏被政策打斷。
風險也在這里。如果"自愿框架"在實際操作中變成事實上的前置審查,企業會擔心美國政府掌握過多模型發布節奏;如果流程不透明,行業又會擔心不同公司受到不同待遇,甚至影響美國公司與中國同行競爭。
奧特曼最近也在《金融時報》上呼吁建立全球框架,希望通過標準和獨立分析來評估能力與風險,讓AI的收益能夠更廣泛分配。問題是,全球框架很慢,模型發布很快。美國政府現在先做的,是把國內前沿模型發布拉進一個更可控的流程里。
發布按鈕變重了
至少從現有文件看,白宮行政令仍強調自愿框架,并排除了強制許可和預先批準。
但美國政府正在從事后觀察者變成發布前參與者。
過去,AI公司發布模型,政府更多是在安全承諾、事故響應和后續監管層面介入。現在,OpenAI、Anthropic、谷歌等公司在發布最強模型前,可能需要更早向政府展示能力、解釋防護措施、協調可信伙伴名單,并接受一定時間窗口的評估。
這種介入還不是傳統意義上的AI監管大棒,但模型發布節奏也不再完全由公司自己決定。越靠近網絡安全、關鍵基礎設施和國家安全這些高風險能力,模型發布越可能多出一層政府預發布評估、信息共享和風險協商。(易句)
(本文由AI翻譯,網易編輯負責校對)
