人類學研究表明,人工智能代理正逐漸接近真正的去中心化金融(DeFi)攻擊能力。
人工智能代理在發現智能合約中的攻擊途徑方面已經足夠出色,以至於它們已經被不法分子利用。 根據最新研究由人類學研究員項目出版。
由機器學習對齊與理論學者計劃 (MATS) 和人類學研究員計劃聯合開展的一項研究,利用 SCONE-bench 數據集(包含 405 個已被破解的合約)測試了前沿模型。 gpt-5、Claude Opus 4.5 和 Sonnet 4.5 在模擬破解中,針對知識截止後被破解的合約,共計竊取了 460 萬美元,這為這一代人工智能在實際應用中可能竊取的金額設定了一個下限。
研究團隊發現,前沿模型不僅能夠識別漏洞,還能合成完整的攻擊腳本,對交易進行排序,並以與以太坊和 BNB 鏈上的真實攻擊高度相似的方式抽取模擬流動性。
該論文還測試了現有模型是否能夠發現尚未被利用的漏洞。
GPT-5 和 Sonnet 4.5 掃描了 2,849 個近期部署的 BNB 鏈合約,這些合約均未顯示任何先前被入侵的跡象。 兩種模型均發現了兩個漏洞。 零日漏洞模擬利潤價值 3,694 美元。 其中一個漏洞源於公共函數中缺少視圖修飾符,該修飾符允許代理增加其代幣餘額。
另一種漏洞允許呼叫者通過提供任意收款人地址來重定向手續費提款。 在這兩種情況下,代理商都生成了可執行腳本,將漏洞轉化為利潤。
雖然金額不大,但這一發現意義重大,因為它表明,盈利的自主開發在技術上是可行的。
在所有合同上運行代理的成本僅為 3,476 美元,每次運行的平均成本為 1.22 美元。 隨著模型變得更便宜、功能更強大,經濟效益將進一步向自動化傾斜。
研究人員認為,這種趨勢將縮短合約部署和攻擊之間的時間窗口,尤其是在 DeFi 環境中,資金是公開可見的,可利用的漏洞可以立即變現。
雖然研究結果主要集中在 defi 領域,但作者警告說,其底層功能並非特定於某個領域。
允許代理人增加代幣餘額或重定向費用的相同推理步驟,也適用於支持加密市場的傳統軟件、閉源代碼庫和基礎設施。
隨著模型成本下降和工具使用改進,自動掃描可能會從公共智能合約擴展到通往有價值資產的任何服務。
作者將這項研究定位為警示而非預測。 人工智能模型如今能夠執行以往需要高技能人類攻擊者才能完成的任務,而這項研究表明,DeFi 領域的自主攻擊已不再是假設。
現在加密貨幣開發者面臨的問題是,防禦能力需要多久才能趕上。