假期讀物 | 芯片禁運狂熱粉Anthropic，遭遇模型封殺

騰訊科技 · 06/19 15:15

來源：騰訊科技

從EUV光刻機，到先進DUV光刻機，再到H100芯片，在半導體禁運這件事情上，硅谷分成了兩派。

黃仁勳、蘇姿豐們一直在爲放松管制奔走呼喊，認爲過度管制相當於把市場拱手讓人，Anthropic CEO阿莫迪則是管制的「狂熱粉」，一度把先進芯片比作核武器。

黃仁勳數次暗諷阿莫迪，認爲他有「上帝情結」。「將AI與核武器、鈾濃縮相提並論就是瘋了，我們不是提煉濃縮鈾，我們做的只是一個小芯片。」《Dwarkesh Patel》播客節目，黃仁勳說。

「狂熱粉」阿莫迪可能怎麼也沒預料到，他一直強調的強監管，有一天會發生在Anthropic身上——Mythos和Fable 5兩個前沿模型，被美國政府禁止向全球任何「外國國民」提供服務。

「阿莫迪對Mythos/Fable（以及整個AI領域）荒謬的恐懼營銷終於得到了回報：美國政府禁止了非美國人使用它，甚至包括在美國本土工作的外籍員工。種瓜得瓜，種豆得豆。」圖靈獎得主楊立昆在臉書上寫道。

「種瓜得瓜，種豆得豆」這句話放在中文語境裏，可謂「求錘得錘」。後來在評論區，楊立昆還挖苦阿莫迪可能會藉着被管制吹噓自家模型有多強。

從美國一些政策口風來看，針對Mythos、Fable兩款模型的禁令不會太久。被稱爲「AI沙皇」的白宮AI顧問大衛·薩克斯表示這只是暫時限制，希望Anthropic儘快修補安全漏洞。

所以在這個時間點上，我們希望通過本文梳理一下，「模型禁令」的來龍去脈，核心的爭議、存在的問題，長期出口管制的可能性，以及對Anthropic乃至整個人工智能產業的潛在影響。

01、「危機72小時」

很多美國電影都喜歡用「小時」命名，以突出在一個較短的時間週期內的劇烈變化，Anthropic新模型從上線到下架，比如Fable 5只有72小時，恰好就在這個敘事框架當中。

6月9日，Anthropic上線其成立以來最強模型，Claude Fable 5和Claude Mythos 5，這是Anthropic首個「Mythos-class」模型。Fable 5是面向公衆的版本，帶有安全分類器：在網絡安全、生物學、化學等高敏感領域，查詢會被自動路由到能力較弱的Opus 4.8。Mythos 5則是同一底層模型，但安全限制解除，僅通過Project Glasswing向約150個經過審查的組織提供。

此時，距離Mythos的首個預覽版亮相，已經過去了2個月。

Anthropic在官方博客中提到，「Fable 5系列在經過測試的所有模型中，具備最嚴格的安全防護」。

只是在一天之後，著名AI越獄者Pliny the Liberator在X上發佈全大寫帖子：「JAILBREAK ALERT, ANTHROPIC PWNED, FABLE-5 LIBERATED」。他聲稱使用Unicode替換、同形字符、長上下文稀釋和分解-重組技術繞過了Fable 5的安全分類器。

當時阿莫迪可能還沉浸在Fable 5模型「秒天秒地」的喜悅中，還沒注意到Pliny預告的風險，洋洋灑灑地在自己的個人博客上發佈了題爲「人工智能指數級增長下的政策應對」的長文，主張政府應該有權阻止不安全的AI模型部署。

和Pliny一樣，$亞馬遜 (AMZN.US)$研究員也發現了模型「越獄」風險，但在處置上略有不同。

亞馬遜CEO安迪·賈西直接選擇跨過Anthropic——這家亞馬遜重金投資的公司——給白宮和美國商務部送去了一份「越獄」報告。

多家外媒披露，在收到亞馬遜「舉報信」的次日（6月12日），Anthropic收到了美國政府的最後通牒，被指示90分鐘內關閉兩款模型的訪問權限，阿莫迪試圖通過一通電話來挽回，但最終還是收到了「緊急出口管制指令」。

6月12日晚間，Anthropic執行了該指令。有意思的是，阿莫迪和他的團隊對指令進行了「加碼」，在全球範圍內對Fable 5和Mythos 5「拔網線」。也就是不管你是不是美國人，全部一刀切不給用。

從6月9日發佈，到6月12日緊急下線，堪稱Anthropic的「危情72小時」。

我在朋友圈轉發這條消息的時候，引述了一句香港電影的經典臺詞——「難辦，那就都別辦了」。

這裏面有一個可以探討的空間——明明要求的是對「非美籍用戶」斷網，爲什麼Anthropic激進地選擇了一刀切？要知道，Anthropic從來就不是「聽話的乖寶寶」，一季度，阿莫迪直接掏出了自己制定的「憲章模型（Constitutional AI）」服務條款，試圖以放棄美國政府合同爲代價，捍衛「AI不能用於軍事和監控」的理念。

關於「一刀切」的處理方式，一些分析認爲Anthropic缺少應對時間，無法在第一時間去篩選用戶，尤其是很多用戶通過API接入，甚至還有一些中轉API，工程難度巨大。

這個說法有合理性，但如果翻開他們官網的政策頁面，你會發現Anthropic早就在這方面做功課了，其最新發布的隱私政策全文裏面就暗示將要求用戶提交年齡、身份等信息，這也被很多人解讀爲Claude後續模型有可能加入「人臉識別」。從這個角度來看，去識別一下用戶身份「美籍」或者「非美籍」，不是什麼難題。

02、難以抗拒的信

「很多人在分析法律基礎，其實就是用了『Is informed letter』（告知函）機制，」一位長期跟蹤出口管制政策的研究員說。

在美國的出口管制體系中，告知函是美國商務部工業與安全局（BIS）常用的非公開、快速下發的行政執法工具。它允許監管機構不通過立法程序修改《出口管制條例》的情況下，致函目標企業執行特定物項、技術等出口必須申請許可證。

2023年底，$英偉達 (NVDA.US)$針對中國市場推出特供H20產品，以規避《出口管制條例》中對GPU的算力、帶寬等進行限制的細則，隨後BIS向英偉達、AMD等企業下發告知函，要求相關A芯片的出口必須額外申請許可，然後在這個過程中去更新《出口管制條例》。

回到Anthropic身上，在收到限制「非美籍」用戶接入的告知函之前，美國政府明確給了「90分鐘下架」的指示，Politico等多家外媒披露，雙方經過了多輪對話交鋒，覆蓋了美國財政部長、美國商務部長、白宮AI政策顧問等多名官員，但上述指示遭到了Anthropic的拒絕。

一開始拒絕下架，到最後「一刀切」拔網線，這樣的反差很難用「工程無法實現」來解釋。

告知函一般是正式出口管制規則出臺的前奏，但前述研究員認爲這次不會更新出口管制條例，「說白了就是先把Anthropic攔下來。」

他認爲，在大模型發佈場景下，要明確到底管制什麼，但這個問題目前並沒有清晰答案。「究竟是模型權重、API訪問、推理服務，還是某種抽象的『模型能力』？」

過去，出口管制更偏向於實物，即便是技術，最終也是實物商品在提，但模型權重一旦生成，在數字空間中就可以傳播，很難在物理上實現絕對意義的「禁運」。

所以，「先把Anthropic攔下來」是一種合理的推測，而攔下來之後，再討論更妥當的治理和對齊方式，也正是基於這種假設，可以進一步推斷Mythos、Fable即將回歸，這也是爲什麼「AI沙皇」大衛·薩克斯強調「禁用」只是暫時限制。

那麼，美國政府爲什麼要動用行政手段去幹預一家AI實驗室前沿模型的發佈？

模型的「漏洞突破」能力。

3月份，在一次和360集團董事長周鴻禕的交流中，他特別提到了「Anthropic基於模型發現漏洞」的能力。「Anthropic通過AI編程、AI查找漏洞，就把很多原來安全上不能解決的問題給解決了。所以我提了一個建議，關注AI（安全）智能體。」

前述研究員也強調，Mythos所涉及的並不是泛泛意義上的聊天機器人能力，而是高度具體的漏洞發現、攻擊路徑分析和進攻性網絡能力。

03、沒有共識的安全

Anthropic不但選擇了「加碼執行」禁令，也發了一份公開聲明。

「爲了確保合規，我們必須立即停止所有用戶的方案。」Anthropic在聲明中寫道，並且補充解釋這是一個誤會，他們認爲美國政府及第三方報告的「越獄」方案，只被用於少量先前已知的輕微漏洞，且這些漏洞看起來都相對簡單。

所以回過頭來看，阿莫迪在個人博客中主張政府應該有權阻止不安全的AI模型部署，以及Anthropic在官方博客把Fable 5定義爲最安全的模型，都透露着對自家產品安全性的絕對自信。

只不過，Anthropic也留了一句鋪墊「目前任何模型提供商都無法實現完全防越獄」，這句話由於與絕對的安全存在矛盾，甚至有詭辯的成分。

大意是：我們的模型是最安全的，那些不安全的模型，主管部門才應該阻止一下；我們的漏洞很少都是已知的輕量級；我們已經盡最大努力來限制「越獄」，但沒有人能絕對封堵「越獄」。

可一個號稱最安全的模型，爲什麼要在已知有漏洞的情況下選擇上線？這難道不是帶傷上陣嗎？既然不能絕對封堵「越獄」，爲什麼要呼籲打壓其他模型呢？

熟悉Anthropic這家公司用戶應該都知道，其不僅模型和產品能力出色，實際上在AI的安全與治理上也表現的非常激進，甚至有一種「AI時代規則制定者」的使命感，不斷給自己貼上「安全」光環。

2023年9月19日，Anthropic發佈了RSP 1.0（負責任擴展政策），呼籲模型能力越強，安全保障必須越強。在證明安全之前，不發佈更強大的模型。該文件中提到了AI安全等級分級機制（ASL），其中ASL-1：無意義災難性風險、ASL-2則顯示出早期危險信號，但無災難性風險、ASL-3顯著增加災難性濫用風險等等。

「如果AI規模擴展超出了我們遵守必要安全程序的能力，ASL框架將要求我們暫時暫停訓練更強大的模型。」Anthropic寫道。

在Fable 5上線之前一週，6月4日，Anthropic發佈了《當AI自我塑造》文章，呼籲「主動暫停」以規避AI遞歸改進的風險。

話音剛落，Fable 5系列模型上線了。

如果倒回去看這個時間線，這表現得非常滑稽，就像是學霸告訴你，「我考試從來不復習」，但實際上有瘋狂補課的畫面感。

如果真有擔憂，爲什麼在呼籲暫停以後又要把自己「最強模型」發出來？這是其一。實際上「Mythos級」模型的預覽版2個月前就已經亮相，既然能力已經如此具有突破性，爲什麼當時不呼籲暫停？

Anthropic看似在安全策略上表現激進，但這種安全呼籲和行動，更像是在約束對手，一邊喊着對不安全的模型監管，呼籲暫停前沿模型訓練，另一邊自己在不斷地迭代、往前推進。

如果說2023年發佈的RSP 1.0，Anthropic當時還是一個理想主義者，到了2025年的RSP 2.2，他們就變成了一個現實主義者。

RSP 2.2的Changelog中提到了一個修改：「將sophisticated insiders和state-compromised insiders排除在ASL-3 Security Standard之外」，並「移除ASL-2對distillation attacks（蒸餾攻擊）的保護承諾」。

我特地查了一下，這個修改的意思就是：以後來自內部攻擊、國家力量攻擊等相關防禦，都不作爲安全的硬性標準。換句話說，Anthropic悄悄「降低」了其安全防禦的標準，不再承諾去抵禦那些「最頂級、最難防」的安全威脅。

2026年2月9日，Anthropic安全最高負責人Mrinank Sharma辭職。他在公開信中寫道：「世界處於危險中。在我任職期間，我反覆看到讓價值觀真正指導組織行動是多麼困難……我們不斷面臨壓力，要放棄最重要的東西。」

Mrinank Sharma辭職幾天後，2月24日，Anthropic發佈了RSP 3.0，全面重寫其安全策略，刪除了所有「暫停」相關的措辭。

本質上就如前面所說，Anthropic從來就沒有觸發過訓練暫停，這其實和2023年3月份那篇知名的「暫停GPT-4以上模型訓練6個月」的公開信一樣，當時馬斯克是重要參與者——先簽署公開信，後宣佈xAI成立，然後11月份就發佈了Grok-1。

所以，各種大模型實驗室根本就沒有「安全共識」，所謂的暫停，全都是商業策略。

04、被資本推着跑

Fable 5上線，輸入和輸出定價是每百萬token是10美元和50美元，堪稱Opus 4.8兩倍，好在緩存命中有90%的折扣。

當時和一位AI領域研究員交流，他給的反饋是「好用是好用，貴是真的貴」。一時間也有各種內涵大模型價格越來越貴的段子、短視頻和gif圖，這其實反映出一個趨勢：只要模型能力強，即便是貴，依舊會有很多人用。

這也是爲什麼這段時間，國產模型都在嘗試「提速」，給用戶提供更快的推理和TPS(Token/s)，同時適當做一些價格上漲的原因。

回到Anthropic身上。2021年5月，阿莫迪帶着親妹妹和14名研究員出走OpenAI，創立Anthropic，並在A輪融到1.24億美元，估值5.5億美元。5年後的2025年，其H輪融資膨脹至65億美元，估值9650億美元——以估值計算，5年增長超過1700倍。

比估值膨脹更快的是收入。

2024年初Anthropic的年收入不到10億美元，這個數字在2025年底達到約90億美元（ARR口徑）。2026年一季度Anthropic的營收爲48億美元，《華爾街日報》獲取的文件顯示，Anthropic向投資者披露的財務數據，預計第二季度營收將達到109億美元。

根據公開資料，6月1日，Anthropic祕密向SEC提交了IPO註冊文件。目標是搶先於OpenAI在今年第四季度上市，募資600億美元。按照單季度100億美元的收入計算，全年ARR預計超過400億美元，9650億美元的估值，意味着投資者爲此要支付24倍ARR估值，這種估值定價要求Anthropic在收入端保持指數級增長。

這種背景下，每一個安全承諾，比如「能力超標就暫停訓練」，都相當於收入增長的剎車。在24倍ARR的估值下，任何「暫停」都會對估值產生災難性影響。

所以，RSP 3.0中刪除暫停字樣，不是像巧合，反而更像是屈服於資本壓力——IPO關鍵階段，任何可能會帶來意外的「剎車」都要被拆除，從招股書的合規性來看亦是如此。

如果不去掉硬性「暫停」指標，招股書中就要明確「本公司承諾模型能力觸發未知安全紅線，無條件暫停商業化部署」這類風險提示。這相當於告訴投資人，公司營收隨時可能無預警「歸零」。

9650億美元估值和IPO壓力下，Anthropic面臨着股東利益可能會壓倒公共利益的難題。

OpenAI調整架構的時候，討論最爲激烈的話題就是PBC——公衆利益公司，Anthropic也是這樣的治理架構。按照這個架構設計，長期利益信託基金（LTBT）有權指派2-3名董事，但直到2024年底，LTBT才任命了1名董事會成員，2025年也只新指派了1名，直到今年上市壓力逼近，$諾華製藥 (NVS.US)$前CEO Vas Narasimhan加入董事會，LTBT的董事席位達到4/7（7個席位到位4人）。

意外就在於，LTBT指派的董事當中，僅任職一年的Jay Kreps（Confluent聯合創始人兼CEO，2024年5月由信託指派加入）官宣辭任相關職務。

「信託派」與「管理層+資方」的投票權比例又退回到了3-3。在下一名LTBT指派的董事就位之前，如果雙方出現明顯分歧，就會出現「治理真空」。

關鍵的「第7人」，會在IPO前到來嗎？

編輯/rice

譯文內容由第三人軟體翻譯。

以上內容僅用作資訊或教育之目的，不構成與象象銀行相關的任何投資建議。象象銀行竭力但無法保證上述全部內容的真實性、準確性和原創性。