BTCC / BTCC Square / 528BTC /
Sam Altman 的 OpenAI 在 AI 國際象棋錦標賽中擊敗 Elon Musk 的 Grok

Sam Altman 的 OpenAI 在 AI 國際象棋錦標賽中擊敗 Elon Musk 的 Grok

Author:
528BTC
Published:
2025-08-10 20:37:00
18
1

Sam Altman 的 OpenAI o3 模型(該模型已於上週晚些時候隨著 gpt-5 的發布而被棄用)在周四的四場比賽中擊敗了 Elon Musk 的 Grok 4,贏得了谷歌的 Kaggle遊戲競技場人工智能像棋展覽。

你可能會認為這是一場超級複雜的盛會,高科技巨頭們正在對他們的推理進行終極考驗,但作為開胃菜,讓我們假設世界冠軍馬格努斯·卡爾森比較的兩個機器人都說“這是一個有天賦的孩子,但不知道棋子如何移動。”

Screenshot of the AI chess tournament bracket.

AI 國際象棋錦標賽對陣表截圖。

這場為期三天的比賽於 8 月 5 日至 7 日舉行,要求通用聊天機器人(沒錯,就是那些幫你寫電子郵件、號稱智能水平接近人類的聊天機器人)在未經任何專門訓練的情況下下棋。 沒有國際象棋引擎,不用查棋譜,它們只是從互聯網上隨意獲取一些國際象棋知識。

結果和你期望的一樣優雅,就像你強迫語言模型玩棋盤遊戲一樣。 決賽的聯合評論員卡爾森估計,這兩個人工智能的水平都與剛學會規則的普通玩家相當——大約800 ELO。 作為背景,他可以說是有史以來最優秀的國際象棋選手,ELO為2839 分這些人工智能就像是從損壞的 PDF 中學會下棋一樣。

“他們的棋藝時好時壞,時好時壞,”卡爾森在賽后直播中說道。 在看到格羅克棋手將國王逼入險境後,他一度開玩笑說,格羅克棋手可能會以為他們在玩“山丘之王”而不是國際象棋。

實際比賽就像是一堂大師課,教你如何不下棋,即使對那些不懂棋的人來說也是如此。 在第一場比賽中,GROK 幾乎免費送出了一枚重要棋子,然後在已經落後的情況下又交換了更多棋子,讓局面雪上加霜。

第二局比賽更加詭異。 格羅克試圖使用棋手們所謂的“毒兵”——一種危險卻合法的策略,即吃掉一個看似自由但實際上並非自由的敵方兵。 然而,格羅克吃的兵完全錯了,那是一個明顯被防守的兵。 它的後(棋盤上最強大的棋子)立刻被困住並吃掉。

到了第三局,Grok 似乎已經建立了一個穩固的陣型——位置控制良好,沒有明顯的危險,基本上是一個能幫你贏球的陣型。 然而到了中局,它卻幾乎直接把球丟給了對手。 它接連丟掉了一個又一個的棋子。

這其實挺奇怪的,畢竟在對陣o3的比賽之前,Grok可是實力不俗的有力競爭者,展現出了不俗的潛力——就連國際象棋大師中村光都對它贊不絕口。 “Grok無疑是目前為止最好的,客觀來說,絕對是最好的。”

第四局(也是最後一局)比賽才真正帶來了懸念。 OpENAI 的 o3 在比賽初期犯了一個大錯誤,這在任何一場合理的比賽中都是一個很大的風險。 直播這場比賽的 Nakamura 表示,儘管 o3 處於劣勢,但“仍有一些機會”。

他是對的——o3 奮力奪回了皇后,慢慢地取得了勝利,而 Grok 的殘局卻像濕紙板一樣崩潰了。

中村在直播中說道:“Grok 在這些比賽中犯了很多錯誤,但 OPEnAI 沒有。” 這與本週早些時候的情況大相徑庭。

對埃隆·馬斯克來說,時機真是糟糕透了。 在 Grok 前幾輪表現強勁之後,他在 X 上發帖稱,他的 AI 的國際象棋能力只是“副作用”,而 xAI“幾乎沒有在國際象棋上投入任何精力”。 事實證明,這番話是輕描淡寫的。

在這場“正式”國際象棋錦標賽之前,國際大師萊維·羅茲曼舉辦了自己的錦標賽今年早些時候,他用一些不太先進的模型進行了比賽。 他遵循了聊天機器人推薦的所有走法,結果整個局面變得一團糟,充斥著非法走法、棋子召喚和錯誤計算。 Stockfish,一個專為國際象棋打造的人工智能,最終贏得了與 ChatGPT 的比賽。 Altman 的人工智能在半決賽中對陣 Musk 的人工智能,Grok 輸了。 所以 Sam 贏了 2-0。

然而,這次錦標賽有所不同。 每個機器人都有四次合法走棋的機會——如果四次都失敗了,就自動輸了。 這並非空穴來風。 在早期回合中,AI 會嘗試將棋子傳送到棋盤各處,讓死棋復活,以及將棋子橫向移動,就像在玩他們自己發明的某種夢幻版國際象棋一樣。

他們被取消了資格。

谷歌的 Gemini 擊敗了另一個 OPenAI 模型,奪得季軍,為賽事組織者挽回了一些尊嚴。 那場銅牌爭奪戰的平局尤其荒誕,兩個 AI 在不同時間點都佔據絕對優勢,卻不知該如何收場。

卡爾森指出,人工智能更擅長計算被吃的棋子,而不是真正將死對手——它們懂得物質優勢,卻不懂如何取勝。 這就好比擅長收集食材,卻不會做飯一樣。

科技高管們聲稱,這些人工智能模型正在逼近人類智能,威脅著白領工作,並徹底改變我們的工作方式。 然而,它們卻無法在這場存在了1500年的棋盤遊戲中不作弊或不忘規則。

因此可以肯定地說,我們是安全的,目前人工智能不會控制人類。

|Square

下載BTCC APP,您的加密之旅從這啟程

立即行動 掃描 加入我們的 100M+ 用戶行列