Anthropic 身分危機的七十二小時
撰文:Ada,深潮 TechFlow
2 月 24 日,星期二。 華盛頓,五角大廈。
Anthropic CEO Dario Amodei 坐在國防部長 Pete HegsETH 對面。 據 NPR 和 CNN 多家媒體引述知情人士透露,會面的氣氛“禮貌”,但內容一點都不客氣。
Hegseth 給了他一個最後通牒:週五下午 5:01 之前,放開 Claude 的軍事使用限制,允許五角大樓將其用於“所有合法用途”,包括自主武器瞄準和國內大規模監控。
否則取消 2 億美元合約。 啟動《國防生產法》,強制徵用。 將 Anthropic 列為“供應鏈風險”,這等同於把它歸入俄羅斯和中國敵對實體的黑名單。
同一天,Anthropic 發布了第三版「負責任擴展政策」(RSP 3.0),悄悄刪掉了公司成立以來最核心的一條承諾:如果無法保證安全措施到位,就不訓練更強大的模型。
也是同一天,Elon Musk 在 X 上發文說:「Anthropic 大規模竊取訓練數據,這是事實。」同時,X 的社區筆記補充了 Anthropic 因使用盜版書籍訓練 Claude 而支付 15 億美元和解金的報道。
七十二小時內,這家自稱有「靈魂」的 AI 公司,同時扮演了三個角色:安全殉道者、智慧財產權竊賊、五角大廈的叛徒。
哪個才是真的?
也許都是。
五角大樓的「要嘛服從,要嘛滾」
故事的第一層很簡單。
Anthropic 是第一家獲得美國國防部機密級存取權的 AI 公司。 去年夏天拿到的合同,上限 2 億美元。 OpENAI、Google、xAI 隨後也各拿了同等規模的合約。
根據 Al Jazeera 報道,Claude 曾被用於今年 1 月的一次美軍行動。 報道稱該行動涉及委內瑞拉總統馬杜羅的綁架。
但 Anthropic 劃了兩條紅線:不支援全自主武器瞄準,不支援對美國公民的大規模監控。 Anthropic 認為,人工智慧的可靠性不足以操控武器,而且目前還沒有任何法律法規規範人工智慧在大規模監控中的應用。
五角大廈不買帳。
白宮 AI 顧問 David Sacks 去年 10 月在 X 上公開指控 Anthropic「以恐懼為武器,搞監管俘獲」。
競爭對手已經跪了。 OpenAI、Google、xAI 都同意讓軍方將其 AI 用於「所有合法場景」。 Musk 的 GROK 本週剛獲準進入機密系統。
Anthropic 是最後一個站著的。
截至發稿,Anthropic 在最新發表的聲明中表示,他們並沒有打算讓步。 但周五 5:01 的大限,已經近在眼前。
一位匿名的前司法部與國防部聯絡員對 CNN 表示了困惑:“你怎麼能同時宣布一家公司是‘供應鏈風險’,又強迫這家公司為你的軍隊工作?”
好問題,但這不在五角大樓考慮範圍之內。 他們在乎的是,如果 Anthropic 不妥協,將採取強製手段,或者,成為華盛頓棄兒。
「蒸餾攻擊」:一場打臉式的控訴
2 月 23 日,Anthropic 發了一篇措辭激烈的博客,指控三家中國 AI 公司對 Claude 進行了「工業級蒸餾攻擊」。
被告是 DEEPSeek、Moonshot AI、MiniMax。
Anthropic 指控它們透過 2.4 萬個偽造帳戶,對 Claude 發起超過 1600 萬次交互,定向提取 Claude 在智能體推理、工具調用和編程方面的核心能力。
Anthropic 把這件事定性為國家安全威脅,聲稱蒸餾後的模型“不太可能保留安全護欄”,可能被威權政府用於網路攻擊、虛假資訊和大規模監控。
敘事很完美,時機也很完美。
恰好在 川普政府剛剛放寬對華晶片出口管制之後,恰好在 Anthropic 需要為自己的晶片出口管制遊說立場尋找彈藥的時候。
但是 Musk 開了一槍:「Anthropic 大規模竊取訓練數據,也為此支付了數十億美元和解金。這是事實。」
AI 基礎設施公司 IO.Net 聯合創始人 Tory Green 表示:「你們用別人全網的數據訓練自己的模型,然後用你們的公共 API 學習你們,就叫'蒸餾攻擊'了? ”
Anthropic 把蒸餾叫“攻擊”,但這件事在 AI 行業是家常便飯。 OPEnAI 用它來壓縮 GPT-4,Google 用它來優化 Gemini,連 Anthropic 自己也在做。 唯一的區別是,這次被蒸的是它自己。
根據新加坡南洋理工大學 AI 教授 Erik Cambria 對 CNBC 表示:「合法使用和惡意利用之間的邊界往往是模糊的。」
更諷刺的是,Anthropic 剛為使用盜版書籍訓練 Claude 支付了 15 億美元和解金。 它用全網的資料訓練模型,然後指控別人用它的公開 API 學習它。 這不是雙標,這是三標。
Anthropic 本想扮演受害者,結果被扒成了被告。
安全承諾的拆除:RSP 3.0
就在與五角大廈對峙、與矽谷互撕的同一天,Anthropic 發布了第三版負責任擴展政策。
Anthropic 首席科學家 JARed Kaplan 在接受媒體採訪時表示:「我們覺得停止訓練 AI 模式對任何人都沒有幫助。在 AI 快速發展的背景下,單方面做出承諾…而競爭對手在全速推進,這沒有意義。」
換句話說,不講別人武德,我們也不裝了。
RSP 1.0 和 2.0 的核心是一條硬性承諾,如果模型的能力超過了安全措施的覆蓋範圍,就暫停訓練。 這項承諾讓 Anthropic 在 AI 安全圈獲得了獨一無二的聲譽。
但 3.0 刪了。
取而代之的是一個更「靈活」的框架,即把 Anthropic 自己能做的安全措施和需要全行業協作的安全建議分成兩條軌道。 每 3-6 個月發一份風險報告。 請外部專家審閱。
聽起來很負責?
來自非營利組織 METR 的獨立審查員 Chris Painter 在看完政策早期草案後對錶示:「這說明 Anthropic 認為需要進入'分診模式',因為評估和緩解風險的方法跟不上能力增長的速度。這更多地證明了社會對 AI 潛在災難性風險沒有做好準備。」
根據 TIME 公司討論了將近一年 和董事會全票通過。 官方說法是,原來的政策設計初衷是推動產業共識,結果產業根本無法跟上。 川普政府對人工智慧發展採取了放任自流的態度,甚至試圖廢除各州的相關法規。 聯邦層級的人工智慧法律遙遙無期。 儘管在 2023 年建立全球治理框架似乎還有可能,但三年過去了,這扇門顯然已經關閉。
一位長期追蹤 AI 治理的匿名研究員說得更直接:「RSP 是 Anthropic 最值錢的品牌資產。刪掉暫停訓練承諾,就像一家有機食品公司悄悄把'有機'兩個字從包裝上撕下來,然後告訴你他們現在的檢測更透明了。」