百度ERNIE 5 AI模型排名上升——數學奇才擊敗OpenAI的GPT 5.1
中國科技巨頭百度剛剛更新了其最先進的人工智能模型——而且顯然效果相當不錯。
該公司的 ERNIE-5.0-0110 獲得了 1,460 分LMArena 的文本排行榜ERNIE v4.0 最終在全球排名第八,成為唯一躋身該平台前十的中國模型。 它的排名高於 OpenAI 的 gpt-5.1-High 和 Google 的 Gemini-2.5-Pro。 2023年發布.
ERNIE 5.0 在數學推理方面也位列全球第二,僅次於尚未發布的 GPT-5.2-High。 對於一款中國模型而言,在復雜的邏輯任務上超越幾乎所有公開的西方系統,標誌著人工智能能力差距的顯著縮小——或者更確切地說,是正在縮小。
百度的X 公告報告強調,ERNIE 5.0 已正式結束預覽階段。 該模型在創意寫作、指令執行和編程方面也展現出強大的競爭力,在包括科學、商業和金融以及醫療保健在內的多個職業類別中均位列前十。
這些成果背後的技術架構體現了中國註重效率而非單純追求功率的理念。 ERNIE 5.0 使用了大約2萬億個參數混合專家架構,每次推理僅激活一小部分專家(更準確地說,只有 3%)。
與其他稀疏前沿模型一樣,這種設計相比密集型系統降低了每次查詢的計算量,但也增加了工程複雜性。 百度還表示,ERNIE 5.0 是在文本、圖像、音頻和視頻等多種模態下進行原生訓練的,而不是在僅支持語言的核心基礎上後期添加多模態模塊。 該公司稱,這使得 Ernie 成為一個原生“全模態”AI 模型。
考慮到百度此前跌幅之大,此次反彈尤為引人注目。 去年11月,ERNIE 5.0預覽版在LMArena排名中一度跌至第24位。 國內AI市場一度被更靈活的競爭對手主導:字節跳動的豆寶擁有1.01億月活躍用戶,而DEEPSeek的高性價比模式引發了一場價格戰,迫使百度徹底放棄了付費訂閱模式。 去年四月.
但消費者的困境並沒有減緩百度的發展步伐。 企業發展勢頭. ERNIE 現在為智慧城市指揮中心百度在中國擁有龐大的業務網絡,服務於所有具有系統重要性的中國銀行,每天處理165億次API調用。 這一B2B業務優勢使百度免受消費者市場激烈競爭的影響,同時為其持續的模式開發提供了資金支持。
除了LLM強大的運算能力之外,ERNIE聊天機器人的用戶界面也非常友好,並預置了許多自定義功能,可以幫助用戶根據自身需求獲得更精準的反饋。 例如,聊天機器人不會讓用戶面對針對不同任務的複雜提示,而是提供了獨立的寫作、閱讀、圖像編輯和通用功能模塊。 雖然核心模型相同,但係統提示和功能調整的差異使得每項任務的完成都更加便捷。
有趣的是,最新版本並未啟用網絡搜索功能,因此只能離線使用。 不過,用戶可以切換到之前的 Ernie 4.5 版本,獲取啟用網絡搜索功能的最新信息。
用戶反響不一,部分用戶仍在等待公司提供更詳細的模型性能和基準測試數據,該公司承諾將盡快發布。 此外,值得注意的是,雖然 ERNIE 5.0 在某些基準測試中與 GPT-5 和 Gemini 2.5 的表現相當,但許多西方實驗室已經轉向 GPT-5.2 或 Gemini 3,因此 ERNIE 5.0 更像是追趕而非超越。
用戶可以免費測試該模型。 ernie.baidu.com.