BTCC / BTCC Square / 528BTC /
Google Gemini剛剛擊敗了整個1996年的遊戲男孩遊戲神奇寶貝藍

Google Gemini剛剛擊敗了整個1996年的遊戲男孩遊戲神奇寶貝藍

Author:
528BTC
Published:
2025-05-04 06:54:00
15
1

昨晚,Google首席執行官Sundar Pichai在X上分享了新聞,寫道:“ Gemini 2.5 Pro剛剛完成了PokémonBlue!”

真好! Gemini 2.5 Pro剛剛完成了PokémonBlue!  特別感謝@thecodeofjoel為了創建和運行直播,並向所有在此過程中歡呼寶石的人。 pic.twitter.com/E2pn3tpfEb

- Sundar Pichai(@sundarpichhai)2025年5月3日

TechCrunch報告喬爾·Z(Joel Z)是一位30歲的軟件工程師,他說他“與Google不相關”流在抽搐上運行。

即便如此,搜索巨頭的高管們一直在為該項目加油。 Logan Kilpatrick,Google AI Studio的產品負責人,發表上個月,雙子座“在完成神奇寶貝方面取得了長足的進步”,並“贏得了第五個徽章(迄今為止,下一個最佳模特只有3個徽章,儘管有不同的特工安全帶)。 pichai回答開玩笑說:“我們正在研究API,人造神奇寶貝智能:)”

雙子座擊敗了人類AI模型Claude,該模型仍在PokémonRed上

遊戲的選擇絕非易事。 2月,競爭對手公司Anthropic在演奏“PokémonRed”時,其Claude模特帶來的穩定增長。 該公司表示,克勞德(Claude)“擴展思維和經紀人的培訓”為意外任務(例如經典角色扮演遊戲)提供了“重大提升”。

喬爾·Z(Joel Z)列舉了克勞德(Claude)扮演神奇寶貝Twitch Feed,這是他的靈感之一。

到目前為止,克勞德尚未完成“神奇寶貝紅”。 這意味著雙子座是一個更好的遊戲玩家。

但是,喬爾·Z(Joel Z)警告觀眾不要過多地閱讀比較。 他在Twitch頁面上寫道:“請不要認為這是LLM可以玩神奇寶貝的基準。” “您無法真正進行直接比較 - Gemini和Claude擁有不同的工具並接收不同的信息。”

Google Gemini與其他AI模型一樣,需要在提示或所謂的代理安全帶中提供幫助

這特工安全帶與攜帶額外屏幕上數據的LLM共享更新的屏幕截圖。 Gemini然後出現這種情況的原因,可以致電子代理執行專業任務,最後指示在遊戲男孩模擬器中按下哪個按鈕。

Google’s Gemini just beat the entire 1996 Game Boy game Pokémon Blue,

喬爾·Z(Joel Z)在抽搐中的“雙子座”扮演口袋妖怪

喬爾·Z(Joel Z)承認,他偶爾會介入,但認為幫助在公平的範圍內。 他解釋說:“我的干預措施改善了雙子座的整體決策和推理能力。”此外,該模型不需要特定的提示,演練或直接說明,例如月亮山等特定挑戰。

他補充說:“唯一接近的事情就是讓Gemini知道它需要兩次與火箭咕unt交談以獲取升降機鑰匙,這是一個蟲子,後來固定在神奇寶貝黃色中。”

喬爾說:“雙子座扮演神奇寶貝仍在積極發展。”他指出,該項目背後的框架“繼續發展”。

加密大都會學院:想在2025年養活您的錢嗎? 在即將到來的WebClass中學習如何使用defi進行操作。 保存您的位置

|Square

下載BTCC APP,您的加密之旅從這啟程

立即行動 掃描 加入我們的 100M+ 用戶行列