BTCC / BTCC Square / TechFlowPost /
Anthropic 聯合 12 家巨頭發起「玻璃翼」計劃,用未發布的最強模型 Mythos 修補全球軟體漏洞

Anthropic 聯合 12 家巨頭發起「玻璃翼」計劃,用未發布的最強模型 Mythos 修補全球軟體漏洞

Published:
2026-04-08 08:41:19

作者: Anthropic  

編譯: 深潮 TechFlow

Anthropic 發布了一個尚未公開的前沿模型 Claude Mythos Preview,其程式碼審計能力已超過絕大多數人類安全專家,能自主發現存在數十年的零日漏洞。

基於這一能力,Anthropic 聯合 AWS、蘋果、谷歌、微軟、英偉達等 12 家科技巨頭發起 Project Glasswing 計劃,投入 1 億美元信用額度,目標是在攻擊者獲得同等能力之前,先把全球關鍵軟體的漏洞堵上。

引言

今天我們宣布 Project Glasswing(玻璃翼計畫),一項匯集亞馬遜雲端科技(AWS)、Anthropic、蘋果、博通、思科、CrowdStrike、Google、摩根大通、Linux 基金會、微軟、英偉達和 Palo Alto Networks 的新谷歌、摩根大通、Linux 軟體基金會、微軟、英偉達和 Palo Alto Networks 的新關鍵倡議,軟體目標是保護全球最偉大的軟體目標。

我們發起 Project Glasswing,是因為 Anthropic 訓練的一個新前沿模型展現了我們認為可能重塑網路安全格局的能力。 Claude Mythos Preview 是一個通用的、尚未發布的前沿模型,它揭示了一個殘酷事實:AI 模型的編碼能力已經達到了這樣的水平——在發現和利用軟體漏洞方面,它們可以超越除最頂尖專家之外的所有人。

Mythos Preview 已經發現了數千個高風險漏洞,涵蓋每一個主流作業系統和每一個主流瀏覽器。 按照 AI 的進步速度,這種能力在不遠的將來就會擴散,可能會落入不負責任的使用者手中。 對經濟、公共安全和國家安全的衝擊可能非常嚴重。 Project Glasswing 是個迫切的嘗試,要把這些能力優先用於防禦。

作為 Project Glasswing 的一部分,上述合作夥伴將在其防禦性安全工作中使用 Mythos Preview;Anthropic 會分享所學經驗,讓整個產業受益。 我們也向另外 40 多個建置或維護關鍵軟體基礎設施的組織開放了存取權限,讓它們可以掃描和加強自有系統及開源系統。 Anthropic 為此承諾投入最高 1 億美元的 Mythos Preview 使用額度,以及 400 萬美元直接捐贈給開源安全組織。

Project Glasswing 只是一個起點。 沒有任何一家機構能獨自解決網路安全問題:前沿 AI 開發者、其他軟體公司、安全研究人員、開源維護者以及全球各國政府都有不可取代的角色。 防禦全球網路基礎設施可能需要數年時間;而前沿 AI 能力在未來幾個月內就可能大幅躍進。 網路防御者要佔據先機,必須現在就行動。

AI 時代的網路安全

我們每天依賴的軟體——運行銀行系統、儲存醫療記錄、連接物流網路、維持電網運作——一直都有 bug。 大多數無關緊要,但有些是嚴重的安全缺陷,一旦被發現,攻擊者就能劫持系統、癱瘓運作或竊取資料。

網路攻擊對企業網路、醫療系統、能源基礎設施、交通樞紐以及各國政府機構的破壞性後果已經有目共睹。 在全球層面,來自中國、伊朗、北韓和俄羅斯的國家級攻擊已經威脅了支撐民用生活和軍事準備的基礎設施。 即使是針對單一醫院或學校的小規模攻擊,也能造成巨大經濟損失、暴露敏感數據,甚至危及生命。 全球網路犯罪的年度經濟損失難以精確估算,但可能在 5,000 億美元左右。

過去,許多軟體缺陷多年不被發現,因為找到並利用它們需要極少數安全專家才具備的專業知識。 但隨著最新前緣 AI 模式的出現,發現和利用軟體漏洞所需的成本、精力和專業門檻都大幅降低了。 過去一年,AI 模型在程式碼閱讀和推理方面越來越強,尤其在發現漏洞和構造利用方式方面表現驚人。 Claude Mythos Preview 在這些網路安全技能上實現了跨越式提升——它發現的一些漏洞在人類審查了幾十年、經歷了數百萬次自動化安全測試後依然存活,而它開發的利用程式碼也越來越精巧。

在首屆 DARPA 網路大挑戰賽十年後,前沿 AI 模型正在接近甚至追平最頂尖人類的漏洞發現和利用能力。 如果沒有必要的安全措施,這些強大的網路能力可能被用來利用全球最重要軟體中現存的大量缺陷。 網路攻擊會變得更頻繁、更具破壞力,也會讓美國及其盟友的對手獲得力量。 這是民主國家必須重視的安全優先順序。

好消息是:讓 AI 模型在錯誤的手中變得危險的那些能力,同樣使它們在發現和修復重要軟體缺陷方面極具價值——也能幫助生產出安全 bug 更少的新軟體。 Project Glasswing 是讓防禦者在即將到來的 AI 驅動網路安全時代建立持久優勢的重要一步。

Claude Mythos Preview 發現漏洞和利用方式的能力

過去幾週,我們使用 Claude Mythos Preview 在每一個主流作業系統、每一個主流瀏覽器以及一系列其他重要軟體中,發現了數千個零日漏洞(即先前軟體開發者完全不知道的缺陷等級),其中許多是高危險等級。

在 Frontier Red Team 部落格上,我們揭露了其中一部分已被修復的漏洞的技術細節,以及 Mythos Preview 找到的利用方式。 幾乎所有這些漏洞的發現(以及許多相關利用方式的發展),都是模型完全自主完成的,沒有任何人類引導。 以下是三個例子:

  • Mythos Preview 在 OpenBSD 中發現了一個存在 27 年的漏洞。 OpenBSD 以極高的安全加固水準聞名,被廣泛用於防火牆和其他關鍵基礎設施。 該漏洞允許攻擊者僅透過連接目標機器就能遠端使其崩潰。
  • 它也在 FFmpeg 中發現了一個 16 年的漏洞。 FFmpeg 被無數軟體用於視訊編解碼。 問題出在一行程式碼上,而自動化測試工具已經命中這行程式碼 500 萬次,卻從未發現問題。
  • 模型自主發現並串聯了 Linux 核心中的數個漏洞(Linux 核心運行全球大部分伺服器),實現了從普通用戶權限到完全控制機器的提權攻擊。

上述漏洞我們已全部回報給相關軟體維護者,且均已修復。 對於其他許多漏洞,我們今天提供了細節的加密雜湊(請參閱 Red Team 部落格),待修復完成後再公開具體資訊。

Cyber​​Gym 等評估基準也驗證了 Mythos Preview 與我們次強模型 Claude Opus 4.6 之間的顯著差距:

網絡安全漏洞復現 - Cyber​​​​Gym

除了我們自己的工作,

除了許多合作夥伴。 以下是他們的回饋:

「AI 能力已經跨過了一個門檻,從根本上改變了保護關鍵基礎設施免受網路威脅所需的緊迫程度,而且不可逆轉。我們用這些模型的基礎工作表明,可以以前所未有的速度和規模識別和修復硬體與軟體中的安全漏洞。這是一個深刻的轉變,也是一個清晰的訊號:新技術必須在思科 的原因——這項工作太重要、太緊迫,不能單打獨鬥。 是我們大規模防禦能力的核心。 Herzog,亞馬遜雲端科技副總裁兼首席資訊安全長

「當網路安全不再受限於純人力能力時,負責任地使用 AI 來大規模提升安全性和降低風險的機會是史無前例的。加入 Project Glasswing 並獲得 Claude Mythos Preview 的訪問權限,使我們能夠儘早識別客戶和緩解風險,增強我們的安全和解決方案解決方案,使我們能夠儘早識別和緩解風險,從而增強我們的安全性和解決方案,從而更好地保護微軟 上測試時,Claude Mythos Preview 相比之前的模型表現出了實質性提升。 展示了防御者大規模行動的可能性,而對手將不可避免地尋求利用同樣的能力。 首席技術長

「過去,安全專業知識是擁有龐大安全團隊的組織才能享有的奢侈品。開源軟體維護者——他們的軟體支撐著全球大部分關鍵基礎設施——歷來只能自己想辦法解決安全問題。開源軟體構成了現代系統中絕大部分程式碼,包括 AI 智能體用來編寫新系統的主動性系統本身。透過讓新程式碼讓這些功能來讓新世代維護程式碼存取系統來編寫新系統的系統本身。透過讓新程式碼讓設備來修復新程式碼-Projwing 的關鍵模型? 提供了一條切實的路徑來改變這一局面。 提供了一個獨特的早期機會,讓我們可以按自己的標準評估下一代 AI 工具在關鍵基礎設施防禦性網路安全中的能力,同時與受尊重的技術領袖並肩作戰。 Opet,摩根大通首席資訊安全長

「Google很高興看到這項跨產業網路安全倡議的形成,並透過 Vertex AI 向參與者提供 Mythos Preview。業界在新興安全議題上的協作一直至關重要,無論是後量子密碼學、負責任的零日漏洞揭露、開源軟體安全,或是基於 AI 的攻擊。 驅動工具來發現和修復關鍵軟體缺陷的原因。 模型,用它來識別前一代模型完全遺漏的複雜漏洞。 這不僅改變了發現隱藏漏洞的遊戲規則,也意味著攻擊者很快就能比以往更快地發現更多零日漏洞並開發利用代碼。 輔助的攻擊者做好準備。 以下評估結果顯示,該模型在多項軟體編碼任務上取得了所有已知模型中的最高分。

智能體編碼

推理

智能體搜尋與電腦使用

智能體搜尋與電腦使用

  • SWE-bench Multimodal:使用內部實現,分數與公開排行榜無法直接比較。
  • Terminal-Bench 2.0:使用 Terminus-2 框架,自適應思考模式下最大努力,每個任務總預算 100 萬 token,1 倍保證 / 3 倍上限資源配置,每任務 5 次嘗試取平均。 將超時限制提高到 4 小時並使用 Terminal-Bench 2.1 更新後,Mythos Preview 得分 92.1%。
  • BrowseComp:Claude Mythos Preview 得分高於 Opus 4.6,同時 token 消耗量僅為後者的 1/4.9。
  • Humanity's Last Exam:Mythos 在低努力模式下仍表現良好,可能存在一定程度的記憶化。
  • 更多關於該模型能力、安全屬性和基本特徵的信息,請參閱 Claude Mythos Preview 系統卡。

    我們不計劃將 Claude Mythos Preview 面向公眾開放,但最終目標是讓用戶能夠安全地大規模部署 Mythos 級別的模型——不僅用於網絡安全,也用於這類高能力模型將帶來的眾多其他價值。 為此,我們需要在開發網路安全(及其他)安全防護措施方面取得進展,能夠偵測並阻止模型最危險的輸出。 我們計劃在即將推出的 Claude Opus 模型中發布新的安全防護措施,使我們能夠用一個不具備 Mythos Preview 同等風險水平的模型來改進和完善這些措施。

    Project Glasswing 的下一步計畫

    今天的發布是一項長期努力的開端。 要成功,需要技術產業內外的廣泛參與。

    Project Glasswing 合作夥伴將獲得 Claude Mythos Preview 的存取權限,用於發現和修復其基礎系統中的漏洞和弱點——這些系統佔全球共享網路攻擊面的很大比例。 預計工作重點包括本地漏洞檢測、二進位黑盒測試、端點加固和系統滲透測試。

    Anthropic 為 Project Glasswing 及其他參與者承諾的 1 億美元模型使用額度,將涵蓋研究預覽期間的大量使用。 之後,Claude Mythos Preview 將以每百萬輸入 / 輸出 token 25 美元 / 125 美元的價格向參與者提供(參與者可透過 Claude API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry 存取該模型)。

    除了模型使用額度,我們還透過 Linux 基金會向 Alpha-Omega 和 OpenSSF 捐贈了 250 萬美元,向 Apache 軟體基金會捐贈了 150 萬美元,幫助開源軟體維護者應對這一變化的格局(有興趣的維護者可以透過 Claude for Open Source 計畫申請存取)。

    我們打算讓這項工作在範圍上持續擴展,持續數月,並盡可能多地分享經驗,讓其他組織也能將這些經驗應用於自身安全。 合作夥伴將在條件允許的範圍內互相分享資訊和最佳實踐;90 天內,Anthropic 將公開報告我們的發現,以及可以揭露的已修復漏洞和改進措施。 我們也將與領先安全組織合作,制定一套關於 AI 時代安全實踐演進的實用建議,可能涵蓋:漏洞揭露流程、軟體更新流程、開源和供應鏈安全、軟體開發生命週期與安全設計實踐、受監管行業標準、分診擴展與自動化、以及修補程式自動化。

    Anthropic 也一直在與美國政府官員討論 Claude Mythos Preview 的攻防網路安全能力。 保護關鍵基礎設施是民主國家的首要國家安全優先事項——這些網路安全能力的出現,再次說明了美國及其盟友必須在 AI 技術上保持決定性領先。 政府在幫助維持這一領先地位、評估和緩解 AI 模型相關國家安全風險方面有不可或缺的作用。 我們願與各級政府代表合作協助完成這些任務。

    我們希望 Project Glasswing 能催生一個覆蓋產業界和公共部門的更大規模努力,各方共同應對強大模型對安全影響的最大問題。 我們邀請其他 AI 產業成員加入,協助制定業界標準。 從中期來看,一個獨立的第三方機構——能夠匯集私人和公共部門組織——可能是承載這些大規模網路安全專案後續工作的理想平台。

    附註

  • 本項目以玻璃翼蝶(Greta oto)命名。 這個隱喻有兩層意義:蝴蝶透明的翅膀讓它能隱於無形,就像本文討論的那些藏在代碼中的漏洞;透明的翅膀也幫助它躲避傷害,如同我們倡導的透明方法。
  • Mythos 一詞源自古希臘語,意為「敘事」或「故事」:文明用來理解世界的故事體系。
  • 合法工作受到這些安全防護措施影響的安全專業人士,可以申請即將推出的網路安全驗證計畫(Cyber​​​​ Verification Program)。
  • |Square

    下載BTCC APP,您的加密之旅從這啟程

    立即行動 掃描 加入我們的 100M+ 用戶行列