推薦
充幣
為合約帳戶即時儲值加密貨幣資產
USDT永續合約
多種以USDT結算的合約
VIP費率折扣
不同等級VIP享受不同費率
幣本位永續合約
多種以加密貨幣結算的合約
買幣
只需幾秒,即可購買加密貨幣
代理返傭
推薦好友,賺取收益
閃兌
即時兌換 加密貨幣
幫助中心
帳戶常見問題
公告中心
關注BTCC最新官方消息
學院
區塊鏈及加密資產學習平台
資訊
聚焦加密貨幣市場動態
最新活動
邀請好友
活動中心
資產
充幣
買幣
閃兌
劃轉
提幣
我的卡券
資金記錄
總覽
帳戶安全
身分驗證
API管理
交易報表
登出
登入
註冊帳號
BTCC
/
BTCC Square
/
Blocktempo
/
小模型也能發現 Claude Mythos 偵測的資安漏洞?AISLE:護城河在系統,不在模型
小模型也能發現 Claude Mythos 偵測的資安漏洞?AISLE:護城河在系統,不在模型
Author:
Blocktempo
發佈時間:
2026-04-12 14:56:57
0
資安新創 AISLE 用每百萬 token 僅 0.11 美元的 3.6B 引數小模型,複現了 Anthropic 旗艦資安系統 Mythos 的部分核心展示。AI 資安能力的邊界比你想的更「參差不齊」。 (前情提要:Anthropic發布Mythos之時,會是DeFi的核爆時刻嗎?) (背景補充:Anthropic Mythos 太強嚇出緊急會議:貝森特、鮑爾召集花旗,高盛,美銀,大小摩,五大銀行聚焦金融風險) Anthropic 本週發布尚未公開的模型 Claude Mythos Preview,並同步啟動 Project Glasswing 玻璃翼計畫,由亞馬遜、蘋果、微軟、CrowdStrike、思科等 12 家科技公司組成,使用該模型進行防禦性資安研究。 因為 Mythos 據稱自主找出每個主要作業系統與瀏覽器中的數千個零日漏洞(zero-day vulnerability,指尚未公開修補、連廠商都可能不知道的安全缺陷),暗示一個由 AI 主導資安防禦的新紀元即將開啟。 然而不到一週,由前 DeepMind 與 Anthropic 研究員 Stanislav Fort 共同創辦的資安新創 AISLE,在公司技術部落格發表了一份系統性報告。 核心結論直接:在 Mythos 的旗艦展示任務中,一個 active 引數僅 3.6B、每百萬 token 花費 0.11 美元的開源小模型,達成了相同的漏洞偵測結果。 Mythos 展示了什麼,小模型又複現了什麼? AISLE 設計了三組測試,分別對應不同難度與性質的資安任務。 第一組是 OWASP(開放 Web 應用安全專案)偽陽性測試。 翻譯過來就是,一段 Java SQL 查詢程式碼看起來像 SQL Injection(資料庫注入攻擊),但實際上邏輯安全。正確答案是非漏洞。 測試結果呈現近乎逆向的 scaling(規模縮放)效應:小型開源模型 GPT-OSS-20b(3.6B active 引數,$0.11/M tokens)正確追蹤了程式邏輯,判定無害。 相反地,Claude Sonnet 4.5、所有 GPT-4.1/5.4 系列(o3 與 pro 除外)、Anthropic 全系列至 Opus 4.5,均自信地誤判為高危漏洞。只有極少數頂端模型 — o3、OpenAI-pro、Sonnet 4.6、Opus 4.6 答對。 第二組是 FreeBSD NFS 漏洞,即 Mythos 旗艦發布中特別展示的 CVE-2026-4747,一個 17 年歷史、未授權遠端程式碼執行漏洞。 結果:8/8 個受測模型全部成功偵測,包括那個 3.6B active 引數的小模型。所有模型均正確識別出 stack buffer overflow(堆疊緩衝區溢位)、計算剩餘空間,並將其評為 Critical RCE。 AISLE 的結論是:此類偵測能力已「商品化」。 第三組是 OpenBSD SACK 漏洞(27 年歷史),需要真正的數學推理:追蹤有號整數溢位(signed integer overflow)的多步驟邏輯鏈。 難度顯著提升,模型表現分化。GPT-OSS-120b(5.1B active 引數)完整複現了漏洞利用鏈,AISLE 評為 A+;Kimi K2 開源版本得 A-;而 Qwen3 32B 則給出「程式碼很健壯」的錯誤結論,評 F。 即便在這個更困難的任務上,一個成本極低的開源模型仍然達成了旗艦系統的同等展示。 為什麼更大的模型,不等於更安全的系統 這份報告的真正論點不是「小模型夠用」,而是 AI 資安能力的結構遠比外界想像複雜。 AISLE 將資安 AI 管線拆解為五個獨立子任務: 廣譜掃描(broad scanning) 漏洞偵測(vulnerability detection) 分流驗證(triage and validation) 修補生成(patch generation) 漏洞利用構建(exploit construction) 每個子任務的 scaling 性質不同,所需的模型能力也不同。Mythos 的公告將這五個層次整合呈現為一個完整系統,但實際上它們的模型需求差異極大,某些子任務在 3.6B 引數下已完全飽和,某些則需要複雜推理能力。 這呼應了 2023 年哈佛商學院研究者 Dell’Acqua 與 Mollick 等人提出的「Jagged Frontier」(參差不齊邊界)概念:AI 能力的邊界不是一條平滑曲線,而是凹凸不平的鋸齒狀,在某些任務上遠超人類,在相鄰任務上卻意外脆弱。 該研究顯示,使用者若在能力邊界內部署 AI,生產力提升約 40%;若貿然延伸至邊界外,表現反而下降 19%。 AISLE 在這個框架下提出了更具操作性的推論:「一千個夠用的偵探無處不搜,比一個天才偵探猜測在哪裡找,能發現更多漏洞。」 大量部署低成本模型進行廣譜掃描,在總體效益上可能優於謹慎排程單一高成本模型。AISLE 表示自 2025 年中旬起已在真實目標上執行漏洞發現系統:在 OpenSSL 中找到 15 個 CVE(其中單次安全版本包含 12 個,CVSS 9.8 Critical),curl 中 5 個,跨超過 30 個專案共計逾 180 個外部驗證 CVE。 護城河在哪裡、不在哪裡 這份分析對 Anthropic 而言既非全面批評,也非單純背書。 AISLE 明確表示,Mythos 的意義在於證明「AI 資安」這個類別是真實的,它不只是演示實驗室裡的概念,而是可以在真實目標上運作的系統。Anthropic 正在做的,是最大化「每 token 的智慧密度」,這在需要深度推理的任務上仍有難以替代的價值。 但 AISLE 同時點出了一個對整個產業而言更根本的問題:護城河在系統,不在模型本身。 在資安領域,AISLE 認為嵌入深度專業知識的架構設計,例如:如何分解任務、如何在子任務間排程不同成本的模型、如何在生產環境中維持維護者信任,才...
來源:
登入回覆
登入分享您的看法
0/500
提交
評論
顯示更多評論
前一篇
<< AI大爆炸之後,Coinbase 的 x402 協議跑得怎麼樣了? >>
本站轉載文章皆來自公開網絡,部分由AI整理,僅為傳遞產業訊息,不代表BTCC立場。原創權益歸原作者所有。如發現版權問題,請透過
[email protected]
聯絡我們,我們將依法處理。 BTCC不對資訊準確性、時效性及完整性作任何保證,不承擔因依賴資訊而產生的任何責任。內容僅供參考,不構成投資、法律或商業建議。
相關文章
華邦電(2344)做什麼的?可以買嗎?華邦電合理價及未來展望
華邦電(2344)是台灣重要的記憶體(DRAM / Flash)廠商。近年隨著 AI/資料中心與手機、車用等需…
2025-12-15
Terra詐騙案創辦人Do Kwon判刑15年!Do Kwon是誰?Terra Luna 崩盤回顧
2022 年初,Do Kwon(權渡衡)曾被稱為加密圈的「天才少年」,與 Terraform Labs 推出的…
2025-12-12
Pepe2.0是什麼?會是下一個暴富機會嗎?$PEPE2幣價分析和價格預測
自前兩年以 Pepe 幣為代表的迷因(meme)幣出現驚人漲幅以來,迷因幣已經成為加密貨幣投資者暴富的選擇。 …
2025-12-12
SOON幣是什麼?未來如何?SOON價格走勢分析及預測
SOON 幣於 2025 年 5 月在幣安 Alpha 上線,引發社群關注。SOON 是一個高效能 SVM(S…
2025-12-12
Nvidia GTC大會是什麼?2025輝達GTC大會黃仁勳演講重點及影響一次看
GTC 大會(GPU Technology Conference,GPU 技術大會)是全球最具影響力、最權威的…
2025-12-12
|
Square
下載BTCC APP,您的加密之旅從這啟程
Download on the
App Store
GEI IT ON
Google Play
立即行動
掃描 加入我們的 100M+ 用戶行列
登入回覆
登入分享您的看法評論