Google Gemini剛剛擊敗了整個1996年的遊戲男孩遊戲神奇寶貝藍
昨晚,Google首席執行官Sundar Pichai在X上分享了新聞,寫道:“ Gemini 2.5 Pro剛剛完成了PokémonBlue!”
真好! Gemini 2.5 Pro剛剛完成了PokémonBlue! 特別感謝@thecodeofjoel為了創建和運行直播,並向所有在此過程中歡呼寶石的人。 pic.twitter.com/E2pn3tpfEb
- Sundar Pichai(@sundarpichhai)2025年5月3日
TechCrunch報告喬爾·Z(Joel Z)是一位30歲的軟件工程師,他說他“與Google不相關”流在抽搐上運行。
即便如此,搜索巨頭的高管們一直在為該項目加油。 Logan Kilpatrick,Google AI Studio的產品負責人,發表上個月,雙子座“在完成神奇寶貝方面取得了長足的進步”,並“贏得了第五個徽章(迄今為止,下一個最佳模特只有3個徽章,儘管有不同的特工安全帶)。 pichai回答開玩笑說:“我們正在研究API,人造神奇寶貝智能:)”
雙子座擊敗了人類AI模型Claude,該模型仍在PokémonRed上
遊戲的選擇絕非易事。 2月,競爭對手公司Anthropic在演奏“PokémonRed”時,其Claude模特帶來的穩定增長。 該公司表示,克勞德(Claude)“擴展思維和經紀人的培訓”為意外任務(例如經典角色扮演遊戲)提供了“重大提升”。
喬爾·Z(Joel Z)列舉了克勞德(Claude)扮演神奇寶貝Twitch Feed,這是他的靈感之一。
到目前為止,克勞德尚未完成“神奇寶貝紅”。 這意味著雙子座是一個更好的遊戲玩家。
但是,喬爾·Z(Joel Z)警告觀眾不要過多地閱讀比較。 他在Twitch頁面上寫道:“請不要認為這是LLM可以玩神奇寶貝的基準。” “您無法真正進行直接比較 - Gemini和Claude擁有不同的工具並接收不同的信息。”
Google Gemini與其他AI模型一樣,需要在提示或所謂的代理安全帶中提供幫助
這特工安全帶與攜帶額外屏幕上數據的LLM共享更新的屏幕截圖。 Gemini然後出現這種情況的原因,可以致電子代理執行專業任務,最後指示在遊戲男孩模擬器中按下哪個按鈕。

喬爾·Z(Joel Z)承認,他偶爾會介入,但認為幫助在公平的範圍內。 他解釋說:“我的干預措施改善了雙子座的整體決策和推理能力。”此外,該模型不需要特定的提示,演練或直接說明,例如月亮山等特定挑戰。
他補充說:“唯一接近的事情就是讓Gemini知道它需要兩次與火箭咕unt交談以獲取升降機鑰匙,這是一個蟲子,後來固定在神奇寶貝黃色中。”
喬爾說:“雙子座扮演神奇寶貝仍在積極發展。”他指出,該項目背後的框架“繼續發展”。
加密大都會學院:想在2025年養活您的錢嗎? 在即將到來的WebClass中學習如何使用defi進行操作。 保存您的位置