BTCC / BTCC Square / 528BTC /
Anthropic 完成 AI 模型升級,推出 Claude Opus 4.5,並大幅降價

Anthropic 完成 AI 模型升級,推出 Claude Opus 4.5,並大幅降價

Author:
528BTC
Published:
2025-11-26 00:35:00
12
1

AnthrOPic 於 2017 年發行了 Claude Opus 4.5。 週一至此,該公司已推出三款機型,這也是該公司在短短兩個月內第三次重大產品發布。 這款全新旗艦機型在編碼基準測試中名列前茅,同時價格也大幅下調。

此次發布標誌著AnthroPIc Games快速迭代計劃的圓滿結束,該計劃始於9月下旬的Claude Sonnet 4.5,並於10月推出了Claude Haiku 4.5。 如今,隨著Opus的加入,Anthropic Games為其兄弟產品提供了一套完整的工具包:Opus用於復雜的生產工作,Sonnet用於日常任務,而Haiku則用於處理邏輯簡單、與速度和效率相關的任務。

Claude Opus 4.5 得分 80.9%SWE-bench 已驗證這是一項測試真實世界軟件工程任務的基準測試。 Opus 的表現略勝 OpenAI 的 gpt-5.1-Codex-Max(77.9%)和 Google 的 Gemini 3 Pro(76.2%)。 Anthropic 表示,Opus 在其內部性能工程測試中表現優於所有人類候選人——這項為期兩小時的評估旨在考察應試者在壓力下的判斷力。

人工智能巨頭們展開了一場爭奪年終榜首的競賽。 谷歌於11月18日發布了Gemini 3 Pro,並將其定位為多模態推理領域的突破性成果。 OpENAI第二天就推出了GPT-5.1-Codex-Max予以回應。

幾天后,AnthroPic 推出了 Opus 作為回應,但它卻有一個誘餌:每百萬個輸入代幣定價 5 美元,每百萬個輸出代幣定價 25 美元,這比之前的 Opus 模型降低了 67%。

阿里巴巴的Qwen模型為這場競爭增添了新的維度。 該公司於1月下旬發布了Qwen2.5-Max,擁有超過20萬億個訓練樣本,並聲稱其在關鍵基準測試中優於DEEPSeek-V3。9月發布的Qwen3-Max擁有超過1萬億個參數,在LMArena全球排名第三,並在各種任務中表現出色。 深入研究例如,多模態推理或東方語言的工作流。 雖然Qwen模型在西方市場仍然相對冷門,但它們代表了在美國芯片出口限制下,中國推動人工智能自主發展的決心。

這個定價介於 OPEnAI 最新的 GPT-5.1(1.25 美元/10 美元)和 Anthropic 較早的 Opus 4.1(15 美元/75 美元)之間,但仍然比 Gemini 3 Pro 的 2 美元/12 美元要貴。 此次降價表明市場壓力,領先的人工智能實驗室不僅在能力上展開競爭,而且在如何使前沿智能在經濟上可行,從而實現大規模部署方面也展開了競爭。

克勞德的最新產品雖然比許多亞洲競爭對手的價格更高,但功能也更強大一些。 因此,用戶現在可以在性價比和純粹的技術能力之間進行選擇。

十四行詩 4.5發布日期:9月30日Haiku 4.5 以適中的成本帶來了最先進的編碼和代理功能,並且在特定任務上已經優於 Opus 4.1。 更簡潔的 Haiku 4.5 於 10 月 15 日發布。 Opus 4.5 目前處於領先地位,能夠處理最複雜的推理和耗時最長的任務。

與 Sonnet 和 GPT-5 類似,Claude Opus 4.5 採用了 Anthropic 所稱的“混合推理”架構——一個同時訓練用於直接推理和鍊式推理的單一模型。 它支持 20 萬個詞元的上下文窗口,最多可輸出 6.4 萬個詞元。 該模型的知識截止時間為 2025 年 3 月,略早於 Sonnet 的 1 月截止時間。

開發者西蒙·威利森測試了 Opus 4.5整個週末,他都大量使用這個模型重構了自己的一個項目。 該模型處理了 39 個文件中的 20 次提交,新增了 2022 行代碼,刪除了 1173 行代碼。 “這顯然是一個非常棒的新模型,”Willison 寫道。 不過他也提到,之後回退到 Sonnet 4.5 並沒有顯著降低他的工作效率。

“我並不是說新模型沒有比 Sonnet 4.5 有所改進——但我不能自信地說,我提出的挑戰能夠識別出兩者在功能上的實質性差異,”他寫道。

開發者、YouTube博主兼人工智能平台T3 Chat的首席執行官西奧·布朗稱Claude Opus 4.5“瘋狂”,並補充道:視頻評測它“絕對是有史以來最好的編碼模型”。

競爭格局日趨擁擠。 谷歌的Gemini 3 Pro上周成為新聞焦點,在LMArena上獲得了1501分的高分,並贏得了Salesforce首席執行官馬克·貝尼奧夫的讚揚。 貝尼奧夫表示,他將放棄ChatGPT,轉而採用谷歌的模式。 這一消息推動ALPHAbet的股價上漲超過6%。 據說OpenAI 首席執行官 Sam Altman 對此感到不安,他告訴同事,Gemini 項目將造成“暫時的經濟逆風”。

微軟和英偉達宣布上週,Anthropic 獲得了數十億美元的投資,使其估值飆升至約 3500 億美元。 這些交易包括擴大 Azure 集成以及採用英偉達技術的基礎設施,用於訓練和部署 Claude 模型。

Opus 4.5 現已可通過以下方式獲取:人類行為學的APIAWS Bedrock、Google Vertex AI 以及 Claude 網絡和桌面應用程序。

|Square

下載BTCC APP,您的加密之旅從這啟程

立即行動 掃描 加入我們的 100M+ 用戶行列

本站轉載文章均源自公開網絡平台,僅為傳遞行業信息之目的,不代表BTCC任何官方立場。原創權益均歸屬原作者所有。如發現內容存在版權爭議或侵權嫌疑,請透過[email protected]與我們聯絡,我們將依法及時處理。BTCC不對轉載信息的準確性、時效性或完整性提供任何明示或暗示的保證,亦不承擔因依賴這些信息所產生的任何直接或間接責任。所有內容僅供行業研究參考,不構成任何投資、法律或商業決策建議,BTCC不對任何基於本文內容採取的行為承擔法律責任。