GPT-5 會成為夏季的驚喜之作嗎? 以下是一些值得期待的內容
值得關注的是——OpenAI 的 gpt-5 預計將於今年夏天發布。 它會成為 AI 重磅炸彈嗎?
Sam Altman 在 6 月份公司首次播客節目並隨意提到,該車型將融合之前車型的功能,並“可能在今年夏天的某個時候”上市。
一些 OpENAI 觀察者預測它將到達在接下來的幾週內。 分析OpenAI 模型發布歷史指出,GPT-4 於 2023 年 3 月發布,GPT-4-Turbo(為 ChatGPT 提供支持)於 2023 年 11 月發布。 更快的多模態模型 GPT-4o 於 2024 年 5 月推出。 這意味著 OpenAI 一直在更快地完善和迭代模型。
但對於競爭如此激烈、發展如此迅速的人工智能市場來說,這還不夠快。 今年 2 月,在 X 上被問及 GPT-5 何時發佈時,Altman 說“幾週/幾個月”。 幾週確實變成了幾個月,與此同時,競爭對手正在迅速縮小差距,Meta 斥資數十億美元在過去的 10 天裡,OPEnAI 花費了數百萬美元來挖走一些頂尖科學家。
根據 Menlo Ventures 的數據,OpenAI 的企業市場份額暴跌從 50% 上升到 34%,而 Anthropic 則從 12% 翻了一番,達到 24%。 谷歌的 Gemini 2.5 Pro 在數學推理領域徹底擊敗了競爭對手,DeepSeek R-1 成為“革命性”的代名詞——擊敗了閉源替代品——甚至 xAI 的 GROK(之前僅以“趣味模式”配置而聞名)也開始受到程序員的重視。
對 GPT-5 的期望
根據 Altman 的說法,即將推出的 GPT 模型將有效地一個模型統治所有模型.
GPT-5 有望將 OPenAI 的各種模型和工具統一到一個系統中,從而無需“模型選擇器”。 用戶無需再在不同的專用模型之間進行選擇——一個系統即可處理文本、圖像、音頻以及潛在的視頻。
到目前為止,這些任務分佈在 GPT-4.1、Dall-E、GPT-4o、o3、Advanced Voice、Vision 和 sora 上。 將所有內容集中到一個真正的多模態模型中是一項相當大的成就。
技術規格看起來也雄心勃勃。 該模型預計將顯著擴展上下文窗口,可能超過 100 萬個標記,一些報導推測其甚至可能達到 200 萬個標記。 就上下文而言,GPT-4o 的最大標記數為 12.8 萬個。 這相當於處理一章內容和消化整本書的區別。
OpenAI 於 2024 年開始在 GPT-4-Turbo 中推出實驗性記憶功能,使助手能夠記住用戶姓名、語氣偏好和正在進行的項目等詳細信息。 用戶可以查看、更新或刪除這些記憶,這些記憶是隨著時間的推移逐漸建立起來的,而不是基於單次交互。
在 GPT-5 中,記憶預計將更加深度集成和無縫銜接——畢竟,該模型將能夠處理近 100 倍的關於你的信息,可能擁有 200 萬個標記,而不是 8 萬個。 這將使該模型能夠在幾週後回憶起對話,隨著時間的推移構建上下文知識,並提供更類似於個性化數字助理的連續性。
推理能力的提升聽起來同樣雄心勃勃。 預計這一進步將體現為向“結構化思維鏈”處理的轉變,使模型能夠將復雜問題分解為邏輯清晰、多步驟的序列,從而模擬人類的深思熟慮的思維過程。
至於參數,普遍的傳言是 10 到 50 萬億,甚至是一個引人注目的千萬億然而,正如奧特曼自己所說,“參數縮放的時代已經結束”,因為人工智能訓練技術的重點從數量轉向質量,更好的學習方法使得較小的模型變得極其強大。
這是 OpenAI 面臨的另一個根本問題:網絡數據耗盡進行訓練。 解決方案是什麼? 讓人工智能生成自己的訓練數據,這可能標誌著人工智能訓練的新時代.
專家們的意見
AI 代理鏈上競技場首席執行官 AndreW Hill 表示:“下一個飛躍將是在可驗證域中生成合成數據。”記起,告訴解密“我們在互聯網規模數據方面遇到了瓶頸,但推理方面的突破表明,只要有驗證機制,模型就可以生成高質量的訓練數據。最簡單的例子是數學問題,你可以檢查答案是否正確,以及代碼,你可以運行單元測試。”
希爾認為這是一次變革:“這一飛躍在於創造出比人類生成的數據更好的新數據,因為它通過驗證循環反复完善,而且創建速度要快得多。”
基準測試是另一個戰場:人工智能專家兼教育家戴維·夏皮羅期望該模型在MMLU上達到了95%的準確率,在SWEBench上也從32%飆升至82%——這幾乎是一個神級的AI模型。 哪怕只有一半的準確率是真的,GPT-5都會成為頭條新聞。 OpenAI內部也對這個模型充滿信心,甚至一些OpenAI的研究人員在模型發布前就對其進行了大力宣傳。
不要相信炒作
專家解密接受采訪的一位人士提醒道,任何期待 GPT-5 達到通用人工智能 (AGI) 水平的人都應該抑制自己的熱情。 希爾表示,他預計這將是一個“循序漸進的進步,偽裝成革命”。
Wyatt Mayham,首席執行官西北人工智能諮詢公司更進一步,預測 GPT-5 可能會是“一次有意義的飛躍,而非漸進式的飛躍”,並補充道:“我期待更長的上下文窗口、更原生的多模態性,以及智能體行動和推理方式的轉變。我絕不指望它能帶來靈丹妙藥,但我確實認為 GPT-5 應該能夠擴展我們可以自信地交付給用戶的工具類型。”
邁哈姆表示,每前進兩步就會後退一步:“每次重大發布都會解決上一代產品最明顯的局限性,同時引入新的局限性。”
GPT-4 彌補了 GPT-3 的推理缺陷,但遇到了數據瓶頸。 推理模型 (o3) 修復了邏輯思維,但成本高昂且速度緩慢。
TONy Tong,首席技術官智力人工智能——一個為投資者提供人工智能洞察的平台——也持謹慎態度,期待一個更好的模型,但不像許多人工智能狂熱分子那樣期待改變世界的東西。 “我押注 GPT-5 將結合更深層次的多模態推理、更好的工具或記憶基礎,以及在協調和代理行為控制方面取得的重大進展,”Tong 告訴解密.“想想:更可控、更可靠、更具適應性。”
首席執行官帕特里斯·威廉姆斯-林多 (Patrice Williams-Lindo)職業游牧者預測 GPT-5 只不過是一場“漸進式革命”。 然而,她懷疑,它可能更適合日常 AI 用戶,而非企業應用。
威廉姆斯-林多表示:“可靠性、情境記憶、多模態性和較低錯誤率的複合效應,可能會徹底改變人們對這些系統的信任程度和日常使用方式。這本身就可能是一個巨大的勝利。”
一些專家只是懷疑 GPT-5 或任何其他 LLM 是否會被人們記住。
人工智能研究員 GARy Marcus 一直對純粹的縮放方法持批評態度(更好的模型需要更多的參數),他以慣常的方式寫道預測全年:“2025 年可能不會出現‘GPT-5 級別’的模型(這意味著根據社區共識判斷,這將是一次巨大的、全面的量子飛躍)。”
馬庫斯押注的是升級公告,而不是全新的基礎型號。 話雖如此,這仍然是他不太有把握的猜測之一。
數十億美元的人才流失
不過,馬克·扎克伯格對 OpenAI 智囊團的突襲是否會推遲 GPT-5 的發布,目前還不得而知。
“這肯定會減緩他們的努力,”去中心化人工智能網絡的首席代碼維護者 David A. Johnston莫菲斯,告訴解密。 約翰斯頓認為,除了金錢之外,頂尖人才在道德上也更願意致力於 Llama 這樣的開源項目,而不是 ChatGPT 或 Claude 這樣的閉源替代方案。
不過,一些專家認為,該項目已經發展成熟,人才流失不會對其造成影響。
Mayham 表示,“2025 年 7 月發布看起來是現實的。即使一些關鍵人才轉投 Meta,我認為 OpenAI 仍然走在正確的軌道上。他們保留了核心領導層,並調整了薪酬,所以看起來他們正在穩步發展。”
Williams-Lindo 補充道:“OpenAI 的發展勢頭和資本儲備都很強勁。更重要的不是哪些人離開了,而是留下的人如何重新調整優先事項——尤其是他們是加倍投入產品化,還是暫停以應對安全或法律壓力。”
如果以史為鑑,世界很快就會迎來 GPT-5 的發布,隨之而來的是一系列的頭條新聞、熱門話題以及“就這些了嗎?”的尷尬時刻。 然後,整個行業將開始提出下一個重要的問題:GPT-6 何時發布?