美國政府禁止外國人使用 Fable 5,Anthropic 發文駁斥
作者:熊磊
編輯:徐青陽
美國當地時間6月12日,一場AI監管史上罕見的政企正面交鋒,在本週五驟然引爆。
美國政府以國家安全為由,向Anthropic發出出口管制指令,要求立即暫停所有外國主體對Fable 5和Mythos 5兩款AI模型的訪問權限。該指令覆蓋範圍極廣,不僅適用於美國境外的外國用戶,也適用於身處美國境內的外國公民,甚至包括Anthropic公司內部的外籍員工。
作為合規措施,Anthropic不得不對所有用戶全面關閉這兩款模型的訪問入口------這是目前能夠確保合規的唯一可行方案,因為公司無法在技術層面精確區分"外國主體"與"美國公民"的用戶群。公司其他模型的訪問不受影響,用戶將自動回退至Claude Opus 4.8。
這一緊急叫停來得猝不及防。Fable 5和Mythos 5於6月9日正式發布,距今僅三天。兩款模型的突然下架,在科技界和AI社區引發了廣泛震動。
01 兩款模型究竟是什麼
要理解這場風波的核心張力,需要先了解Fable 5和Mythos 5是什麼樣的模型,以及為何它們從一開始就處於監管的聚光燈之下。
Mythos是Anthropic在能力層級上高於Opus系列的全新模型家族,代表了目前Anthropic可公開部署的最高能力水平。第一款Mythos類模型Claude Mythos Preview於今年4月通過"Project Glasswing"項目發布,訪問權限嚴格限定於少數合作夥伴,理由是其在網絡安全領域的能力過於強大,不適合廣泛開放。
Fable 5是首款面向公眾正式開放的Mythos級模型,能力超過Anthropic此前發布的所有可用模型,在軟件工程、知識工作、視覺理解、科學研究等幾乎所有測試基準上均達到業界頂尖水平。
為了實現公開發布,Anthropic為Fable 5配備了專門的安全防護機制------在網絡安全、生物、化學等高風險領域,模型會自動屏蔽響應並回退至Claude Opus 4.8處理。
Mythos 5則是在同一底層模型基礎上、配備較少安全防護的版本,僅向此前已獲得Project Glasswing訪問權限的批准機構開放,定位為面向網絡安全防禦者和關鍵基礎設施運營者的專業工具。兩款模型定價相同,均為每百萬輸入token 10美元、每百萬輸出token 50美元。
02 觸發指令的導火索
據報導,美國商務部長霍華德·盧特尼克(Howard Lutnick)於6月12日向Anthropic首席執行官達里奧·阿莫迪伊(Dario Amodei)發出信函,宣布Mythos 5和Fable 5將受到出口管制。觸發這一決定的直接原因,是另一家公司聲稱能夠對Mythos實施"越獄",令特朗普政府對潛在的國家安全風險產生警覺。
據悉,特朗普政府此前曾嘗試阻止Anthropic發布這兩款模型,但未能成功------這才促使政府隨後採取了出口管制這一更強硬的手段。
面對這道突如其來的指令,Anthropic在合規執行的同時,發布了一份措辭罕見強硬的長篇聲明,對政府的理由提出了系統性反駁。
Anthropic認為,政府所掌握的"越獄"證據,僅涉及一種範圍極窄、無法通用的攻擊方式,本質上是要求模型讀取特定代碼庫並修復其中的軟件漏洞------這類能力在包括OpenAI GPT-5.5在內的其他公開可用模型上同樣存在,且每天都被網絡安全防禦人員用於正常的系統維護工作。
Anthropic在聲明中明確表示,若將"存在範圍有限的潛在越獄"作為召回已部署商業模型的標準,實際上將導致整個行業所有前沿模型的新部署全面停滯。公司同時強調,政府此次行動未遵循此前曾公開呼籲的透明、公正、以技術事實為基礎的法定程序。
Anthropic表示,將遵守政府的合法指令,同時正在積極努力與政府溝通,爭取儘快恢復訪問權限,並將在未來24小時內公布更多技術細節。公司認為此次事件源於誤解,並對給用戶帶來的不便深表歉意。
以下為 Anthropic 發布的題為《关于美国政府暂停 Fable 5 与 Mythos 5 访问权限指令的声明》全文:
美國政府依據國家安全授權,發布出口管制指令,要求暫停所有外國公民訪問Fable 5和Mythos 5的權限,無論其身處美國境內還是境外,包括Anthropic的外籍員工。該指令的實際效果是:我們必須立即對所有用戶關閉Fable 5和Mythos 5,以確保合規。其他Anthropic模型不受影響。
我們於今日美東時間下午5時21分收到該指令。信函未說明具體的國家安全方面的顧慮。據我們了解,政府認為其已掌握一種繞過Fable 5安全防護的方法,即所謂的"越獄"技術。我們審查了該技術的演示,發現其僅能識別少量此前已知的、影響較小的漏洞。這些漏洞均較為簡單,其他公開可用的模型無需越獄也能發現同樣的問題。
Anthropic在Fable發布博客文章中闡述了我們對其安全防護的立場,具體如下:
我們建立了強有力的安全防護機制,大幅降低了Fable被濫用於網絡安全等相關任務的可能性。事實上,部分用戶反映我們的防護措施過於嚴格。
Fable發布前數週,Anthropic與美國政府、英國AI安全研究所、多家第三方機構及內部團隊合作,對Fable的安全防護進行了累計數千小時的紅隊測試。測試結果表明,Fable的安全防護效果明顯優於此前任何已部署的模型。
目前尚無測試人員能夠找到"通用越獄"方法------即一種能夠全面突破模型安全防護、解鎖大範圍網絡攻擊能力的越獄方式。
我們認為,目前任何模型提供商都無法實現完美的越獄防護。業內所有防護機制均存在被"非通用越獄"突破的可能(即在特定情況下獲取部分網絡信息),未來也可能出現通用越獄方法。這一點我們在Fable 5發布時已明確說明。
鑑於完美的越獄防護目前並不可行,Anthropic對Fable 5採取了縱深防禦策略。我們的目標是使越獄攻擊要麼範圍極窄(針對非通用越獄),要麼成本極高(針對通用越獄),並輔以全面監控,以便迅速發現並遏制任何成功的攻擊行為。這也是Anthropic要求客戶數據保留30天的原因------儘管這一政策對我們的客戶關係帶來了實際影響,但它有助於我們研究和應對越獄風險。
我們堅持這一縱深防禦策略。它有效降低了Fable帶來的風險,使其與業內現有已部署模型的風險水平相當。
迄今為止,我們甚至未收到任何關於可能導致有害後果的非通用越獄的正式披露。已披露給我們的潛在越獄案例,要麼完全無害,要麼僅屬於無法體現Mythos專屬能力的輕微發現。
目前,美國政府僅向我們提供了口頭證據,涉及一種潛在的、範圍有限的非通用越獄方式,其本質是要求模型讀取特定代碼庫並修復其中的軟件漏洞。據我們了解,該潛在越獄方式已被分享給政府。我們審查了一份報告------我們認為正是這份報告構成了政府發布該指令的依據------並已核實,報告中所展示的能力水平在其他模型中同樣普遍存在(包括OpenAI的GPT-5.5),且每天都被網絡安全防禦人員用於維護系統安全。我們將在未來24小時內公布更多細節。
我們將遵守政府的合法指令,對所有用戶關閉Fable 5和Mythos 5的訪問權限。但我們不認同發現一個範圍有限的潛在越獄方式就足以構成召回一款已向數億用戶部署的商業模型的理由。若將這一標準適用於整個行業,實際上將導致所有前沿模型提供商的新模型部署全面停滯。
我們曾公開表明,政府應有權依據透明、公正、明確且以技術事實為基礎的法定程序,阻止不安全的模型部署。此次行動並未遵循上述原則。
對於給用戶帶來的不便,我們深表歉意。我們認為此次事件源於誤解,並正積極努力,爭取儘快恢復訪問權限。












