BTCC / BTCC Square / 528BTC /
大腦、微型模型:西班牙多元宇宙計算公司斥資 2.15 億美元,將 AI 縮小到智能手機規模

大腦、微型模型:西班牙多元宇宙計算公司斥資 2.15 億美元,將 AI 縮小到智能手機規模

Author:
528BTC
Published:
2025-06-13 08:26:00

一家西班牙人工智能初創公司剛剛以一個大膽的聲明說服投資者投資 2.15 億美元:他們可以在不影響其性能的情況下將大型語言模型縮小 95%。

Multiverse COMPuting 的創新取決於其 CompactifAI 技術,這是一種借用量子物理學的數學概念將 AI 模型縮小到智能手機大小的壓縮方法。

這家聖塞巴斯蒂安公司表示,他們壓縮的 Llama-2 7B 模型推理速度提高了 25%,同時使用的參數減少了 70%,準確率僅下降 2-3%。

如果得到大規模驗證,這可以解決人工智能的巨大問題:模型過於龐大,需要專門的數據中心才能運行。

Multiverse 首席科學官 Román Orús 在一份聲明中表示:“歷史上第一次,我們能夠分析神經網絡的內部工作原理,從而消除數十億個虛假相關性,真正優化各種人工智能模型。”博客文章星期四。

Bullhound CaPItal 領投了 2.15 億美元的 B 輪融資,HP Tech Ventures 和東芝也參與其中。

壓縮背後的物理原理

應用量子啟發的概念來解決人工智能最緊迫的問題之一聽起來不太可能——但如果研究堅持下去,這是真的。

與簡單地削減神經元或降低數值精度的傳統壓縮不同,COMpactifAI 使用張量網絡——物理學家開發的用於追踪粒子相互作用而不會淹沒在數據中的數學結構。

該過程就像 AI 模型的摺紙一樣:權重矩陣被折疊成更小、相互連接的結構,稱為矩陣積運算符。

該系統並不存儲神經元之間的每個連接,而是僅保留有意義的相關性,同時丟棄冗餘模式,例如一遍又一遍重複的信息或關係。

Multiverse 發現,AI 模型並非均勻壓縮。 早期層級已被證實較為脆弱,而較深的層級(最近被證明對性能的影響較小)則能夠承受劇烈壓縮。

這種選擇性方法可以讓它們在其他方法失敗的情況下實現尺寸的大幅減小。

壓縮後,模型會經歷短暫的“修復”——由於參數數量的減少,重新訓練只需不到一個epoch。 該公司聲稱,由於GPU-CPU傳輸負載的降低,此恢復過程比訓練原始模型的速度快50%。

長話短說 - 根據公司自己的報價 - 你從一個模型開始,運行 Compactify magic,最終得到一個壓縮版本,該版本的參數不到 50%,可以以兩倍的推理速度運行,成本低得多,並且功能與原始版本一樣強大。

該團隊在研究中表明,可以將 Llama-2 7B 模型的內存需求減少 93%,將參數數量減少 70%,將訓練速度提高 50%,將回答(推理)速度提高 25%,同時僅損失 2-3% 的準確率。

傳統的縮小方法,如量化(降低精度,如使用更少的小數位)、修剪(完全切掉不太重要的神經元,如修剪樹上的枯枝)或蒸餾技術(訓練較小的模型來模仿較大模型的行為)甚至還無法接近實現這些數字。

Multiverse 已經為包括博世和加拿大銀行在內的 100 多家客戶提供服務,將其受量子啟發的算法應用於人工智能以外的能源優化和金融建模。

西班牙政府共同投資6700萬歐元3 月份,總融資額突破 2.5 億美元。

該公司目前通過 AWS 提供 Llama 和 Mistral 等開源模型的壓縮版本,併計劃擴展到 DEEPSeek R1 和其他推理模型。

OpENAI 或 Claude 的專有系統顯然仍然是禁止進入的,因為它們不能用於修補或研究。

這項技術的前景遠不止於成本節約。 惠普科技風險投資公司的參與表明了其對邊緣人工智能部署的興趣——在本地而非雲服務器上運行複雜的模型。

惠普技術與創新總裁 Tuan Tran 表示:“Multiverse 的創新方法有可能為各種規模的公司帶來人工智能的優勢,即增強性能、個性化、隱私和成本效率。”

所以,如果有一天你發現自己在智能手機上運行 Deepseek R1,你也許應該感謝這些傢伙。

編輯喬什·奎特納 和 塞巴斯蒂安·辛克萊

|Square

下載BTCC APP,您的加密之旅從這啟程

立即行動 掃描 加入我們的 100M+ 用戶行列