BTCC / BTCC Square / 528BTC /
美國的開源人工智能戰略:兩個實驗室,一個問題——美國能否參與競爭?

美國的開源人工智能戰略:兩個實驗室,一個問題——美國能否參與競爭?

Author:
528BTC
Published:
2025-11-21 06:52:00

本週,兩家美國人工智能實驗室發布了開源模型,但各自採用截然不同的方法來解決同一個問題:如何與中國在公共人工智能係統領域的統治地位競爭。

DEEP Cogito 發布了 Cogito v2.1,這是一個擁有 6710 億個參數的龐大模型,其創始人 Drishan Arora 稱之為“美國公司最好的開放權重 LLM”。

艾倫人工智能研究所反駁道:“別急。”奧爾莫 3Olmo 3 被譽為“最佳完全開源的基礎模型”,並擁有完全的透明度,包括其訓練數據和代碼。

具有諷刺意味的是,Deep Cognito 的旗艦機型正是建立在……之上的。 中國基金會Arora 在 X 上承認,Cogito v2.1“從 2024 年 11 月起,基於開源許可的 Deepseek 基礎模型分叉而來”。

這引發了一些批評,甚至引發了關於微調中國模型是否算作美國人工智能進步的爭論,或者這是否僅僅證明了美國實驗室落後了多少。

無論如何,Cogito 相對於 DeepSeek 的效率提升是真實存在的。

Deep Cognito 聲稱 Cogito v2.1 生成的推理鏈比 DeepSeek R1 短 60%,同時保持了具有競爭力的性能。

ARora 稱之為“迭代提煉和放大”——通過自我改進循環來訓練模型,使其發展出更好的直覺——這家初創公司僅用了 75 天就利用 RunPod 和 Nebius 的基礎設施訓練出了自己的模型。

如果基準測試結果屬實,這將是目前由美國團隊維護的最強大的開源LLM。

為什麼這很重要

到目前為止,中國在開源人工智能領域一直處於領先地位,美國公司為了保持競爭力,越來越依賴中國的基礎模型——無論是悄悄地還是公開地。

這種動態存在風險。 如果中國實驗室成為全球開放人工智能的默認平台,美國初創企業將失去技術獨立性、議價能力以及製定行業標準的能力。

開放權重人工智能決定誰控制著下游所有產品所依賴的原始模型。

目前,中國開源模型(DeepSeek、QWen、Kimi、MiniMax)主導全球採用因為它們價格低廉、速度快、效率高,而且不斷更新。 .

圖片來源:Artificialanalysis.ai

許多美國初創公司已經在使用這些技術,即使它們公開場合避免承認這一點.

這意味著美國企業正在利用外國的知識產權、培訓體系和硬件優化技術來構建業務。 從戰略角度來看,這使美國重蹈覆轍,再次面臨半導體製造領域的困境:越來越依賴他國的供應鏈。

Deep Cogito 的方法——從 DeepSeek 的一個分支開始——展現了其優點(快速迭代)和缺點(依賴性)。

艾倫研究所的做法——以完全透明的方式構建 Olmo 3——展現了另一種選擇:如果美國想要在開放人工智能領域佔據領先地位,就必須從數據、訓練方案到檢查點,重建整個技術棧。 這需要耗費大量人力物力,而且速度緩慢,但卻能確保美國對底層技術的自主權。

理論上,如果您已經喜歡 DeepSeek 並在線使用它,Cogito 大多數情況下都能提供更好的答案。 如果您通過 API 使用 Cogito,您會更加滿意,因為其效率更高,您只需花費更少的錢就能獲得高質量的回复。

艾倫研究所採取了截然相反的做法。 Olmo 3 系列全系列產品均配備多爾瑪3一個從零開始構建的 5.9 萬億個 token 的訓練數據集,以及每個訓練階段的完整代碼、配方和檢查點。

該非營利組織發布了三種模型變體——基礎模型、思考模型和指導模型——分別具有 70 億和 320 億個參數。

該研究所寫道:“人工智能領域的真正開放不僅僅關乎獲取途徑,更關乎信任、問責和共同進步。”

Olmo 3-Think 32B 是第一個達到如此規模的完全開放推理模型,它使用大約六分之一的類似模型(如 Qwen 3)的標記進行訓練,同時取得了具有競爭力的性能。

圖片:Ai2

Deep Cognito 已獲得1300萬美元該公司於8月份獲得由Benchmark領投的種子輪融資。 這家初創公司計劃發布參數量高達6710億的前沿模型,這些模型將使用“更強大的計算能力和更好的數據集”進行訓練。

與此同時,英偉達為 Olmo 3 的開發提供了支持,副總裁 Kari Briski 也參與其中。 稱之為對於“開發者而言,利用開放的、美國製造的模型來擴展人工智能至關重要”。

該研究所使用谷歌云的 H100 GPU 集群進行訓練,計算需求比 Meta 的 Llama 3.1 8B 減少了 2.5 倍。

Cogito v2.1 提供免費在線測試。 這裡該模型可供下載。 這裡但要注意:它需要一張非常強大的顯卡才能運行。

Olmo 可供測試這裡這些模型可以下載。 這裡這些產品對消費者更加友好,具體取決於你選擇哪一款。

|Square

下載BTCC APP,您的加密之旅從這啟程

立即行動 掃描 加入我們的 100M+ 用戶行列