前沿人工智能模型在智能合約漏洞利用方面展現出人類水平的能力
根據最新數據,在過去五年中,主流區塊鏈上記錄的智能合約漏洞利用事件中,超過一半的案例中,人工智能代理的性能與熟練的人類攻擊者不相上下。 發布星期一,由 Anthropic 出品。
Anthropic 使用包含 405 個歷史智能合約漏洞的數據集,對包括 Llama 3、Sonnet 3.7、Opus 4、gpt-5 和 DeepSeek V3 在內的十個前沿模型進行了評估。 這些模型成功攻擊了其中的 207 個漏洞,模擬竊取資金總額達 5.5 億美元。
研究結果表明,自動化系統能夠以多快的速度利用漏洞並識別開發人員尚未解決的新漏洞。
這是 Claude AI 開發商的最新披露。 上個月,AnthrOPic詳細的中國黑客如何利用 Claude Code 發起所謂的首次人工智能驅動的網絡攻擊。
安全專家表示,結果證實了其中許多漏洞已經非常容易被利用。
SovereignAI首席運營官David Schwed表示:“人工智能已被應用於Wiz Code和APIiro等ASPM工具以及標準的SAST和DAST掃描器中。”解密。 “這意味著不法分子會利用同樣的技術來識別漏洞。”
施韋德表示,報告中描述的模型驅動攻擊很容易擴展,因為許多漏洞已經通過通用漏洞披露或審計報告公開披露,這使得人工智能係統可以學習它們,並且很容易針對現有的智能合約進行嘗試。
“更簡單的辦法是找到已公開的漏洞,找到該漏洞的衍生項目,然後直接嘗試利用這個漏洞,而這個漏洞可能尚未被修復,”他說道。 “現在,這種攻擊可以全天候進行,針對所有項目。即使是那些當前總生命週期價值(TVL)較低的項目也成了攻擊目標,為什麼不呢?這是主動攻擊。”
為了衡量當前的能力,AnthroPic 僅使用 2025 年 3 月之後開發的 34 個合約,將每個模型的總開發收入與其發布日期作圖。
該公司寫道:“雖然總漏洞利用收入是一個不完美的指標——因為少數異常漏洞利用會佔據總收入的大部分——但我們更重視它而不是攻擊成功率,因為攻擊者關心的是人工智能代理可以榨取多少錢,而不是他們發現的漏洞的數量或難度。”
Anthropic公司尚未立即回應置評請求。 解密。
Anthropic 表示,他們使用從幣安智能鏈上超過 940 萬個合約中提取的 2849 個合約的零日數據集對這些代理進行了測試。
該公司表示,Claude Sonnet 4.5 和 GPT-5 各自發現了兩個未公開的缺陷,模擬價值為 3,694 美元,其中 GPT-5 實現該結果的 API 成本為 3,476 美元。 Anthropic 指出,所有測試均在模擬區塊鏈而非真實網絡的沙盒環境中進行。
其最強大的模型 Claude Opus 4.5 利用了 2025 年 3 月之後的 17 個漏洞,造成了 450 萬美元的模擬損失。
該公司將各模型性能的提升歸功於工具使用、錯誤恢復和長期任務執行方面的進步。 在四代 Claude 模型中,代幣成本下降了 70.2%。
新發現的漏洞之一涉及一個帶有公共計算器功能的代幣合約,該合約缺少視圖修改器,這使得攻擊者能夠反复篡改內部狀態變量,並在去中心化交易所出售虛高的餘額。 模擬的漏洞利用過程獲利約 2500 美元。
施韋德表示,實驗中暴露出的問題“實際上只是業務邏輯缺陷”,並補充說,人工智能係統在給定結構和上下文的情況下可以識別這些弱點。
“如果人工智能了解智能合約應該如何運作,並有詳細的提示指導如何嘗試繞過邏輯檢查,那麼它也可以發現這些問題,”他說。
Anthropic公司表示,使攻擊者能夠利用智能合約的技術也適用於其他類型的軟件,而且成本的下降將縮短部署到被利用之間的時間窗口。 該公司敦促開發人員在其安全工作流程中採用自動化工具,以便防禦性安全措施能夠與攻擊性安全措施同步發展。
儘管 Anthropic 發出警告,但 SchWed 表示前景並非完全負面。
“我總是反駁那些悲觀論調,並認為只要有適當的管控措施、嚴格的內部測試、實時監控和熔斷機制,大多數此類事件都是可以避免的,”他說道。 “守法者同樣可以接觸到相同的代理。所以,如果作惡者能找到,守法者也能找到。我們必須改變思維方式和行動方式。”