Anthropic 身分危機的七十二小時

BTCC / BTCC Square / TechFlowPost /

Author:

TechFlowPost

Published:

2026-02-27 07:20:48

撰文：Ada，深潮 TechFlow

2 月 24 日，星期二。華盛頓，五角大廈。

Anthropic CEO Dario Amodei 坐在國防部長 Pete HegsETH 對面。據 NPR 和 CNN 多家媒體引述知情人士透露，會面的氣氛“禮貌”，但內容一點都不客氣。

Hegseth 給了他一個最後通牒：週五下午 5:01 之前，放開 Claude 的軍事使用限制，允許五角大樓將其用於“所有合法用途”，包括自主武器瞄準和國內大規模監控。

否則取消 2 億美元合約。啟動《國防生產法》，強制徵用。將 Anthropic 列為“供應鏈風險”，這等同於把它歸入俄羅斯和中國敵對實體的黑名單。

同一天，Anthropic 發布了第三版「負責任擴展政策」（RSP 3.0），悄悄刪掉了公司成立以來最核心的一條承諾：如果無法保證安全措施到位，就不訓練更強大的模型。

也是同一天，Elon Musk 在 X 上發文說：「Anthropic 大規模竊取訓練數據，這是事實。」同時，X 的社區筆記補充了 Anthropic 因使用盜版書籍訓練 Claude 而支付 15 億美元和解金的報道。

七十二小時內，這家自稱有「靈魂」的 AI 公司，同時扮演了三個角色：安全殉道者、智慧財產權竊賊、五角大廈的叛徒。

哪個才是真的？

也許都是。

五角大樓的「要嘛服從，要嘛滾」

故事的第一層很簡單。

Anthropic 是第一家獲得美國國防部機密級存取權的 AI 公司。去年夏天拿到的合同，上限 2 億美元。 OpENAI、Google、xAI 隨後也各拿了同等規模的合約。

根據 Al Jazeera 報道，Claude 曾被用於今年 1 月的一次美軍行動。報道稱該行動涉及委內瑞拉總統馬杜羅的綁架。

但 Anthropic 劃了兩條紅線：不支援全自主武器瞄準，不支援對美國公民的大規模監控。 Anthropic 認為，人工智慧的可靠性不足以操控武器，而且目前還沒有任何法律法規規範人工智慧在大規模監控中的應用。

五角大廈不買帳。

白宮 AI 顧問 David Sacks 去年 10 月在 X 上公開指控 Anthropic「以恐懼為武器，搞監管俘獲」。

競爭對手已經跪了。 OpenAI、Google、xAI 都同意讓軍方將其 AI 用於「所有合法場景」。 Musk 的 GROK 本週剛獲準進入機密系統。

Anthropic 是最後一個站著的。

截至發稿，Anthropic 在最新發表的聲明中表示，他們並沒有打算讓步。但周五 5:01 的大限，已經近在眼前。

一位匿名的前司法部與國防部聯絡員對 CNN 表示了困惑：“你怎麼能同時宣布一家公司是‘供應鏈風險’，又強迫這家公司為你的軍隊工作？”

好問題，但這不在五角大樓考慮範圍之內。他們在乎的是，如果 Anthropic 不妥協，將採取強製手段，或者，成為華盛頓棄兒。

「蒸餾攻擊」：一場打臉式的控訴

2 月 23 日，Anthropic 發了一篇措辭激烈的博客，指控三家中國 AI 公司對 Claude 進行了「工業級蒸餾攻擊」。

被告是 DEEPSeek、Moonshot AI、MiniMax。

Anthropic 指控它們透過 2.4 萬個偽造帳戶，對 Claude 發起超過 1600 萬次交互，定向提取 Claude 在智能體推理、工具調用和編程方面的核心能力。

Anthropic 把這件事定性為國家安全威脅，聲稱蒸餾後的模型“不太可能保留安全護欄”，可能被威權政府用於網路攻擊、虛假資訊和大規模監控。

敘事很完美，時機也很完美。

恰好在川普政府剛剛放寬對華晶片出口管制之後，恰好在 Anthropic 需要為自己的晶片出口管制遊說立場尋找彈藥的時候。

但是 Musk 開了一槍：「Anthropic 大規模竊取訓練數據，也為此支付了數十億美元和解金。這是事實。」

AI 基礎設施公司 IO.Net 聯合創始人 Tory Green 表示：「你們用別人全網的數據訓練自己的模型，然後用你們的公共 API 學習你們，就叫'蒸餾攻擊'了？ ”

Anthropic 把蒸餾叫“攻擊”，但這件事在 AI 行業是家常便飯。 OPEnAI 用它來壓縮 GPT-4，Google 用它來優化 Gemini，連 Anthropic 自己也在做。唯一的區別是，這次被蒸的是它自己。

根據新加坡南洋理工大學 AI 教授 Erik Cambria 對 CNBC 表示：「合法使用和惡意利用之間的邊界往往是模糊的。」

更諷刺的是，Anthropic 剛為使用盜版書籍訓練 Claude 支付了 15 億美元和解金。它用全網的資料訓練模型，然後指控別人用它的公開 API 學習它。這不是雙標，這是三標。

Anthropic 本想扮演受害者，結果被扒成了被告。

安全承諾的拆除：RSP 3.0

就在與五角大廈對峙、與矽谷互撕的同一天，Anthropic 發布了第三版負責任擴展政策。

Anthropic 首席科學家 JARed Kaplan 在接受媒體採訪時表示：「我們覺得停止訓練 AI 模式對任何人都沒有幫助。在 AI 快速發展的背景下，單方面做出承諾…而競爭對手在全速推進，這沒有意義。」

換句話說，不講別人武德，我們也不裝了。

RSP 1.0 和 2.0 的核心是一條硬性承諾，如果模型的能力超過了安全措施的覆蓋範圍，就暫停訓練。這項承諾讓 Anthropic 在 AI 安全圈獲得了獨一無二的聲譽。

但 3.0 刪了。

取而代之的是一個更「靈活」的框架，即把 Anthropic 自己能做的安全措施和需要全行業協作的安全建議分成兩條軌道。每 3-6 個月發一份風險報告。請外部專家審閱。

聽起來很負責？

來自非營利組織 METR 的獨立審查員 Chris Painter 在看完政策早期草案後對錶示：「這說明 Anthropic 認為需要進入'分診模式'，因為評估和緩解風險的方法跟不上能力增長的速度。這更多地證明了社會對 AI 潛在災難性風險沒有做好準備。」

根據 TIME 公司討論了將近一年和董事會全票通過。官方說法是，原來的政策設計初衷是推動產業共識，結果產業根本無法跟上。川普政府對人工智慧發展採取了放任自流的態度，甚至試圖廢除各州的相關法規。聯邦層級的人工智慧法律遙遙無期。儘管在 2023 年建立全球治理框架似乎還有可能，但三年過去了，這扇門顯然已經關閉。

一位長期追蹤 AI 治理的匿名研究員說得更直接：「RSP 是 Anthropic 最值錢的品牌資產。刪掉暫停訓練承諾，就像一家有機食品公司悄悄把'有機'兩個字從包裝上撕下來，然後告訴你他們現在的檢測更透明了。」