share_log

假期讀物 | 芯片禁運狂熱粉Anthropic,遭遇模型封殺

騰訊科技 ·  06/19 15:15

來源:騰訊科技

從EUV光刻機,到先進DUV光刻機,再到H100芯片,在半導體禁運這件事情上,硅谷分成了兩派。

黃仁勳、蘇姿豐們一直在爲放松管制奔走呼喊,認爲過度管制相當於把市場拱手讓人,Anthropic CEO阿莫迪則是管制的「狂熱粉」,一度把先進芯片比作核武器。

Anthropic CEO 阿莫迪「拔線」斷電。圖片由AI生成
Anthropic CEO 阿莫迪「拔線」斷電。圖片由AI生成

黃仁勳數次暗諷阿莫迪,認爲他有「上帝情結」。「將AI與核武器、鈾濃縮相提並論就是瘋了,我們不是提煉濃縮鈾,我們做的只是一個小芯片。」《Dwarkesh Patel》播客節目,黃仁勳說。

「狂熱粉」阿莫迪可能怎麼也沒預料到,他一直強調的強監管,有一天會發生在Anthropic身上——Mythos和Fable 5兩個前沿模型,被美國政府禁止向全球任何「外國國民」提供服務。

bigjpg
楊立昆在臉書評價Fable 5被禁

「阿莫迪對Mythos/Fable(以及整個AI領域)荒謬的恐懼營銷終於得到了回報:美國政府禁止了非美國人使用它,甚至包括在美國本土工作的外籍員工。種瓜得瓜,種豆得豆。」圖靈獎得主楊立昆在臉書上寫道。

「種瓜得瓜,種豆得豆」這句話放在中文語境裏,可謂「求錘得錘」。後來在評論區,楊立昆還挖苦阿莫迪可能會藉着被管制吹噓自家模型有多強。

從美國一些政策口風來看,針對Mythos、Fable兩款模型的禁令不會太久。被稱爲「AI沙皇」的白宮AI顧問大衛·薩克斯表示這只是暫時限制,希望Anthropic儘快修補安全漏洞。

所以在這個時間點上,我們希望通過本文梳理一下,「模型禁令」的來龍去脈,核心的爭議、存在的問題,長期出口管制的可能性,以及對Anthropic乃至整個人工智能產業的潛在影響。

01、「危機72小時」

很多美國電影都喜歡用「小時」命名,以突出在一個較短的時間週期內的劇烈變化,Anthropic新模型從上線到下架,比如Fable 5只有72小時,恰好就在這個敘事框架當中。

6月9日,Anthropic上線其成立以來最強模型,Claude Fable 5和Claude Mythos 5,這是Anthropic首個「Mythos-class」模型。Fable 5是面向公衆的版本,帶有安全分類器:在網絡安全、生物學、化學等高敏感領域,查詢會被自動路由到能力較弱的Opus 4.8。Mythos 5則是同一底層模型,但安全限制解除,僅通過Project Glasswing向約150個經過審查的組織提供。

此時,距離Mythos的首個預覽版亮相,已經過去了2個月。

Anthropic在官方博客中提到,「Fable 5系列在經過測試的所有模型中,具備最嚴格的安全防護」。

bigjpg
Pliny the Liberator披露Fable 5「越獄」風險

只是在一天之後,著名AI越獄者Pliny the Liberator在X上發佈全大寫帖子:「JAILBREAK ALERT, ANTHROPIC PWNED, FABLE-5 LIBERATED」。他聲稱使用Unicode替換、同形字符、長上下文稀釋和分解-重組技術繞過了Fable 5的安全分類器。

當時阿莫迪可能還沉浸在Fable 5模型「秒天秒地」的喜悅中,還沒注意到Pliny預告的風險,洋洋灑灑地在自己的個人博客上發佈了題爲「人工智能指數級增長下的政策應對」的長文,主張政府應該有權阻止不安全的AI模型部署。

和Pliny一樣,$亞馬遜 (AMZN.US)$研究員也發現了模型「越獄」風險,但在處置上略有不同。

亞馬遜CEO安迪·賈西直接選擇跨過Anthropic——這家亞馬遜重金投資的公司——給白宮和美國商務部送去了一份「越獄」報告。

多家外媒披露,在收到亞馬遜「舉報信」的次日(6月12日),Anthropic收到了美國政府的最後通牒,被指示90分鐘內關閉兩款模型的訪問權限,阿莫迪試圖通過一通電話來挽回,但最終還是收到了「緊急出口管制指令」。

6月12日晚間,Anthropic執行了該指令。有意思的是,阿莫迪和他的團隊對指令進行了「加碼」,在全球範圍內對Fable 5和Mythos 5「拔網線」。也就是不管你是不是美國人,全部一刀切不給用。

從6月9日發佈,到6月12日緊急下線,堪稱Anthropic的「危情72小時」。

我在朋友圈轉發這條消息的時候,引述了一句香港電影的經典臺詞——「難辦,那就都別辦了」。

這裏面有一個可以探討的空間——明明要求的是對「非美籍用戶」斷網,爲什麼Anthropic激進地選擇了一刀切?要知道,Anthropic從來就不是「聽話的乖寶寶」,一季度,阿莫迪直接掏出了自己制定的「憲章模型(Constitutional AI)」服務條款,試圖以放棄美國政府合同爲代價,捍衛「AI不能用於軍事和監控」的理念。

關於「一刀切」的處理方式,一些分析認爲Anthropic缺少應對時間,無法在第一時間去篩選用戶,尤其是很多用戶通過API接入,甚至還有一些中轉API,工程難度巨大。

這個說法有合理性,但如果翻開他們官網的政策頁面,你會發現Anthropic早就在這方面做功課了,其最新發布的隱私政策全文裏面就暗示將要求用戶提交年齡、身份等信息,這也被很多人解讀爲Claude後續模型有可能加入「人臉識別」。從這個角度來看,去識別一下用戶身份「美籍」或者「非美籍」,不是什麼難題。

02、難以抗拒的信

「很多人在分析法律基礎,其實就是用了『Is informed letter』(告知函)機制,」一位長期跟蹤出口管制政策的研究員說。

在美國的出口管制體系中,告知函是美國商務部工業與安全局(BIS)常用的非公開、快速下發的行政執法工具。它允許監管機構不通過立法程序修改《出口管制條例》的情況下,致函目標企業執行特定物項、技術等出口必須申請許可證。

2023年底,$英偉達 (NVDA.US)$針對中國市場推出特供H20產品,以規避《出口管制條例》中對GPU的算力、帶寬等進行限制的細則,隨後BIS向英偉達、AMD等企業下發告知函,要求相關A芯片的出口必須額外申請許可,然後在這個過程中去更新《出口管制條例》。

回到Anthropic身上,在收到限制「非美籍」用戶接入的告知函之前,美國政府明確給了「90分鐘下架」的指示,Politico等多家外媒披露,雙方經過了多輪對話交鋒,覆蓋了美國財政部長、美國商務部長、白宮AI政策顧問等多名官員,但上述指示遭到了Anthropic的拒絕。

一開始拒絕下架,到最後「一刀切」拔網線,這樣的反差很難用「工程無法實現」來解釋。

告知函一般是正式出口管制規則出臺的前奏,但前述研究員認爲這次不會更新出口管制條例,「說白了就是先把Anthropic攔下來。」

他認爲,在大模型發佈場景下,要明確到底管制什麼,但這個問題目前並沒有清晰答案。「究竟是模型權重、API訪問、推理服務,還是某種抽象的『模型能力』?」

過去,出口管制更偏向於實物,即便是技術,最終也是實物商品在提,但模型權重一旦生成,在數字空間中就可以傳播,很難在物理上實現絕對意義的「禁運」。

所以,「先把Anthropic攔下來」是一種合理的推測,而攔下來之後,再討論更妥當的治理和對齊方式,也正是基於這種假設,可以進一步推斷Mythos、Fable即將回歸,這也是爲什麼「AI沙皇」大衛·薩克斯強調「禁用」只是暫時限制。

那麼,美國政府爲什麼要動用行政手段去幹預一家AI實驗室前沿模型的發佈?

模型的「漏洞突破」能力。

3月份,在一次和360集團董事長周鴻禕的交流中,他特別提到了「Anthropic基於模型發現漏洞」的能力。「Anthropic通過AI編程、AI查找漏洞,就把很多原來安全上不能解決的問題給解決了。所以我提了一個建議,關注AI(安全)智能體。」

前述研究員也強調,Mythos所涉及的並不是泛泛意義上的聊天機器人能力,而是高度具體的漏洞發現、攻擊路徑分析和進攻性網絡能力。

03、沒有共識的安全

Anthropic不但選擇了「加碼執行」禁令,也發了一份公開聲明。

「爲了確保合規,我們必須立即停止所有用戶的方案。」Anthropic在聲明中寫道,並且補充解釋這是一個誤會,他們認爲美國政府及第三方報告的「越獄」方案,只被用於少量先前已知的輕微漏洞,且這些漏洞看起來都相對簡單。

所以回過頭來看,阿莫迪在個人博客中主張政府應該有權阻止不安全的AI模型部署,以及Anthropic在官方博客把Fable 5定義爲最安全的模型,都透露着對自家產品安全性的絕對自信。

只不過,Anthropic也留了一句鋪墊「目前任何模型提供商都無法實現完全防越獄」,這句話由於與絕對的安全存在矛盾,甚至有詭辯的成分。

大意是:我們的模型是最安全的,那些不安全的模型,主管部門才應該阻止一下;我們的漏洞很少都是已知的輕量級;我們已經盡最大努力來限制「越獄」,但沒有人能絕對封堵「越獄」。

可一個號稱最安全的模型,爲什麼要在已知有漏洞的情況下選擇上線?這難道不是帶傷上陣嗎?既然不能絕對封堵「越獄」,爲什麼要呼籲打壓其他模型呢?

熟悉Anthropic這家公司用戶應該都知道,其不僅模型和產品能力出色,實際上在AI的安全與治理上也表現的非常激進,甚至有一種「AI時代規則制定者」的使命感,不斷給自己貼上「安全」光環。

2023年9月19日,Anthropic發佈了RSP 1.0(負責任擴展政策),呼籲模型能力越強,安全保障必須越強。在證明安全之前,不發佈更強大的模型。該文件中提到了AI安全等級分級機制(ASL),其中ASL-1:無意義災難性風險 、ASL-2則顯示出早期危險信號,但無災難性風險、ASL-3顯著增加災難性濫用風險等等。

「如果AI規模擴展超出了我們遵守必要安全程序的能力,ASL框架將要求我們暫時暫停訓練更強大的模型。」Anthropic寫道。

在Fable 5上線之前一週,6月4日,Anthropic發佈了《當AI自我塑造》文章,呼籲「主動暫停」以規避AI遞歸改進的風險。

話音剛落,Fable 5系列模型上線了。

如果倒回去看這個時間線,這表現得非常滑稽,就像是學霸告訴你,「我考試從來不復習」,但實際上有瘋狂補課的畫面感。

如果真有擔憂,爲什麼在呼籲暫停以後又要把自己「最強模型」發出來?這是其一。實際上「Mythos級」模型的預覽版2個月前就已經亮相,既然能力已經如此具有突破性,爲什麼當時不呼籲暫停?

Anthropic看似在安全策略上表現激進,但這種安全呼籲和行動,更像是在約束對手,一邊喊着對不安全的模型監管,呼籲暫停前沿模型訓練,另一邊自己在不斷地迭代、往前推進。

如果說2023年發佈的RSP 1.0,Anthropic當時還是一個理想主義者,到了2025年的RSP 2.2,他們就變成了一個現實主義者。

RSP 2.2的Changelog中提到了一個修改:「將sophisticated insiders和state-compromised insiders排除在ASL-3 Security Standard之外」,並「移除ASL-2對distillation attacks(蒸餾攻擊)的保護承諾」。

我特地查了一下,這個修改的意思就是:以後來自內部攻擊、國家力量攻擊等相關防禦,都不作爲安全的硬性標準。換句話說,Anthropic悄悄「降低」了其安全防禦的標準,不再承諾去抵禦那些「最頂級、最難防」的安全威脅。

2026年2月9日,Anthropic安全最高負責人Mrinank Sharma辭職。他在公開信中寫道:「世界處於危險中。在我任職期間,我反覆看到讓價值觀真正指導組織行動是多麼困難……我們不斷面臨壓力,要放棄最重要的東西。」

Mrinank Sharma辭職幾天後,2月24日,Anthropic發佈了RSP 3.0,全面重寫其安全策略,刪除了所有「暫停」相關的措辭。

本質上就如前面所說,Anthropic從來就沒有觸發過訓練暫停,這其實和2023年3月份那篇知名的「暫停GPT-4以上模型訓練6個月」的公開信一樣,當時馬斯克是重要參與者——先簽署公開信,後宣佈xAI成立,然後11月份就發佈了Grok-1。

所以,各種大模型實驗室根本就沒有「安全共識」,所謂的暫停,全都是商業策略。

04、被資本推着跑

Fable 5上線,輸入和輸出定價是每百萬token是10美元和50美元,堪稱Opus 4.8兩倍,好在緩存命中有90%的折扣。

當時和一位AI領域研究員交流,他給的反饋是「好用是好用,貴是真的貴」。一時間也有各種內涵大模型價格越來越貴的段子、短視頻和gif圖,這其實反映出一個趨勢:只要模型能力強,即便是貴,依舊會有很多人用。

這也是爲什麼這段時間,國產模型都在嘗試「提速」,給用戶提供更快的推理和TPS(Token/s),同時適當做一些價格上漲的原因。

回到Anthropic身上。2021年5月,阿莫迪帶着親妹妹和14名研究員出走OpenAI,創立Anthropic,並在A輪融到1.24億美元,估值5.5億美元。5年後的2025年,其H輪融資膨脹至65億美元,估值9650億美元——以估值計算,5年增長超過1700倍。

比估值膨脹更快的是收入。

2024年初Anthropic的年收入不到10億美元,這個數字在2025年底達到約90億美元(ARR口徑)。2026年一季度Anthropic的營收爲48億美元,《華爾街日報》獲取的文件顯示,Anthropic向投資者披露的財務數據,預計第二季度營收將達到109億美元。

根據公開資料,6月1日,Anthropic祕密向SEC提交了IPO註冊文件。目標是搶先於OpenAI在今年第四季度上市,募資600億美元。按照單季度100億美元的收入計算,全年ARR預計超過400億美元,9650億美元的估值,意味着投資者爲此要支付24倍ARR估值,這種估值定價要求Anthropic在收入端保持指數級增長。

這種背景下,每一個安全承諾,比如「能力超標就暫停訓練」,都相當於收入增長的剎車。在24倍ARR的估值下,任何「暫停」都會對估值產生災難性影響。

所以,RSP 3.0中刪除暫停字樣,不是像巧合,反而更像是屈服於資本壓力——IPO關鍵階段,任何可能會帶來意外的「剎車」都要被拆除,從招股書的合規性來看亦是如此。

如果不去掉硬性「暫停」指標,招股書中就要明確「本公司承諾模型能力觸發未知安全紅線,無條件暫停商業化部署」這類風險提示。這相當於告訴投資人,公司營收隨時可能無預警「歸零」。

9650億美元估值和IPO壓力下,Anthropic面臨着股東利益可能會壓倒公共利益的難題。

OpenAI調整架構的時候,討論最爲激烈的話題就是PBC——公衆利益公司,Anthropic也是這樣的治理架構。按照這個架構設計,長期利益信託基金(LTBT)有權指派2-3名董事,但直到2024年底,LTBT才任命了1名董事會成員,2025年也只新指派了1名,直到今年上市壓力逼近,$諾華製藥 (NVS.US)$前CEO Vas Narasimhan加入董事會,LTBT的董事席位達到4/7(7個席位到位4人)。

意外就在於,LTBT指派的董事當中,僅任職一年的Jay Kreps(Confluent聯合創始人兼CEO,2024年5月由信託指派加入)官宣辭任相關職務。

「信託派」與「管理層+資方」的投票權比例又退回到了3-3。在下一名LTBT指派的董事就位之前,如果雙方出現明顯分歧,就會出現「治理真空」。

關鍵的「第7人」,會在IPO前到來嗎?

編輯/rice

譯文內容由第三人軟體翻譯。


以上內容僅用作資訊或教育之目的,不構成與象象銀行相關的任何投資建議。象象銀行竭力但無法保證上述全部內容的真實性、準確性和原創性。