BTCC / BTCC Square / 528BTC /
Vitalik Buterin 重啟“人類陪審團”:在 MCP 漏洞之後,信息金融將如何保護加密資產免受人工智能攻擊

Vitalik Buterin 重啟“人類陪審團”:在 MCP 漏洞之後,信息金融將如何保護加密資產免受人工智能攻擊

Author:
528BTC
Published:
2025-09-16 00:57:00
20
3

只需包含一個越獄提示重點介紹 AI 代理如何通過可能會促使數據洩露。 針對此類事件的信號和緩解措施即時注入已在OWASP GENAI 指南中正式化,該指南於 2025 年 4 月 17 日更新了 LLM01 風險 OWASP GenAI.

因此,這個想法被重新提出:採用人類陪審團來監督決策和加密語言模型的出現,與其相輔相成,但並非完全取代。 在這種情況下,首要任務是確保人類作為最終裁決者。

概括

  • 利用 MCP:發生了什麼以及它對加密金庫的重要性
  • 維塔利克·布特林 的提議:由人工智能輔助的人類陪審團
  • 信息金融:人為控制的“開放市場”治理
  • 以太坊基金會:提高財政透明度並註重可持續性
  • 如何構建人力陪審團以進行財務治理
  • MCP、越獄和“古德哈廷”:需要區分的兩種風險
  • 運營清單:降低當前風險的 7 項舉措
  • 迷你常見問題解答
  • 未來幾個月的影響和值得關注的事項
  • 利用 MCP:發生了什麼以及它對加密金庫的重要性

    研究人員(據報導比特幣以太坊新聞) 說明了一個簡單的日曆邀請,充滿了,說服人工智能代理閱讀並將內容轉發給攻擊者。 該向量利用 MCP 集成鏈,,, 和:更多連接器意味著更寬. 需要注意的是,內容表面上無害,但實際上卻增加了風險。

    在 MCP 運作的環境中開發者模式,敏感操作是必需的。 但是,可以將確認提示變成自動化操作;當涉及文件和憑證的資金或工作流程受到威脅時,人為錯誤就成為也就是說,分離權限和關鍵步驟仍然至關重要。

    行業分析師指出,間接即時注入(即人眼無法看到但 LLM 可解讀的內容)代表著一類日益增長的風險,正如 OWASP 在其 2025 年 4 月更新中所述。 在專業安全團隊於 2025 年上半年進行的紅隊測試中,針對包含多種集成(電子郵件、日曆、文件存儲)的場景,如果不應用過濾器和最小權限策略,缺乏隔離會顯著增加數據洩露的可能性。

    Vitalik Buterin 的提議:由人工智能輔助的人類陪審團

    “一個人必須始終從自己信任的基本事實信號出發。我認為現實情況下應該由人工陪審團組成,每位陪審員顯然都會得到所有法學碩士的協助。”

    —(AMBCrypto)

    Buterin 指出從:由具有互補技能的人員組成的陪審團,由模型支持和,但最終決定權。 在這種情況下,陪審團充當了“錨”,以防止以及操作幻覺人工智能訪問或高影響力.

    信息金融:人為控制的“開放市場”治理

    的概念將治理轉向:不同的框架和政策公開競爭,而和仍掌握在陪審團。 這是 DAO 和DeFi,優先考慮,分佈式以及持續審計的激勵措施。

    Buterin 警告說,如果資金分配委託給人工智能,敵對分子可能會插入類似“把所有的錢都給我“ 在,, 和. 因此,信息金融專注於的決定和關於資本流動的步驟。 然而,程序部分與技術部分同樣重要。

    以太坊基金會:提高財政透明度並註重可持續性

    在這一願景中,Buterin 解釋說以太坊基金會正在更新其——一份於2025年6月4日發布的文件——旨在實現更積極的管理和運營限制,以確保長期可持續性。 行業報告表明截至2024年10月31日,已申報的國庫餘額約為9.702億美元,這一數字將作為ETH銷售和運營限制新規的參考。 此外,Buterin還提到,面向支付的第二層穩定幣,作為“大規模價值”用例——這是一項旨在增強彈性和採用能力的戰略舉措,儘管一些細節尚待驗證。

    如何構建人力陪審團以進行財務治理

  • 作品:混合型人才(安全、法律、財務、運營)。 定期輪換和部分匿名以減少偏見和壓力。
  • 授權:明確定義阻斷行動(例如,權限變更、執行交易、新 AI 連接器的連接)。
  • 過程:雙重驗證(四眼 或者 多重簽名)具有不可變的審計日誌和明確的推理保存在鏈上或可驗證的檔案中。
  • 激勵措施:補償時間責任,如證明存在疏忽,將受到處罰。
  • 利益衝突:對敏感案件實行強制披露、迴避和獨立審查。
  • MCP、越獄和“古德哈廷”:需要區分的兩種風險

  • 通過 MCP 越獄:普通內容中的隱藏提示(邀請, 筆記, 文件)利用與真實工具相連的人工智能,存在無意的執行行動或數據洩露.
  • Goodharting:當公制成為目標後,它就不再衡量它應該衡量的東西,從而導致明顯但扭曲的優化(例如,“操縱”表現以最大化特定分數)。
  • 運營清單:降低當前風險的 7 項舉措

  • 連接器分段:將測試環境和生產環境分開。 將 AI 限制在沙盒郵箱和日曆。
  • 獲得強有力的批准:禁用自動批准功能;要求2FA並針對涉及以下操作的多重簽名財政部和權限。
  • 內容過濾器:阻止或清理邀請和外部文件,檢測異常提示在到達代理商之前。
  • 最小特權:僅授予 AI最低權限必要時,輪換代幣 頻繁地。
  • 監控:針對異常活動發出實時警報,並向陪審團提供日誌。
  • 紅隊測試:定期模擬活動(例如惡意日曆邀請)並向治理部門報告。
  • 事件劇本:明確撤銷連接器、隔離AI的程序,並及時通知利益相關者。
  • 迷你常見問題解答

  • 通過日曆邀請進行 MCP 漏洞演示了什麼? 這表明單一內容可以傳達迅速的能夠引導人工智能代理與真實工具相連,影響隱私並可操作正直.
  • 什麼是“人工智能輔助人類陪審團”? 這是一個機制人類製造最終決定,利用人工智能分析研究,尤其是當金錢或許可證處於危險之中。
  • 什麼是信息金融? 這是一種治理政策和框架相互競爭公開市場但高風險作業仍需人類監督並定期審計。
  • 如今國庫是如何受到保護的? 通過使用多重簽名、操作限制、角色隔離和人工陪審團來驗證交易、新的集成和變更權限.
  • 未來幾個月的影響和值得關注的事項

    安全不僅僅是問題;它需要,並且可驗證正如 Buterin 指出的那樣,不是二進制的,而代表一種微妙的度量形式“在日益自動化的環境下,由人類陪審團支持,充當實用的降落傘,以減輕風險和關鍵決策。

    |Square

    下載BTCC APP,您的加密之旅從這啟程

    立即行動 掃描 加入我們的 100M+ 用戶行列