谷歌最新「香蕉」AI 圖像模型，讓網友瘋玩「Vibe Photoshoping」

BTCC / BTCC Square / TechFlowPost /

Author:

TechFlowPost

Published:

2025-08-29 18:54:48

還記得之前大家熱議的神秘 AI 圖片編輯模型「nano-banana」嗎？當時在 LMArENA 大語言模型競技場裡，它憑藉出色表現一度被討論得沸沸揚揚。 Google Gemini 各路技術大牛也是輪番出馬，在社交媒體上吊足眾人胃口，。

如今，Google 終於揭開了它的神秘面紗。

北京時間 8 月 27 日凌晨，Google AI Studio 正式發布了 Gemini 2.5 Flash Image（代號 nano banana）🍌。

預熱許久終於登場的 Gemini 2.5 Flash Image ｜圖片來源：極客公園

一登場就達到 SOTA 能力的 Gemini 2.5 Flash Image ｜圖片來源：LMARena.ai

在技術博客裡，Google 提到 Gemini 2.0 Flash 已經憑藉低延遲和高性價比贏得了開發者的青睞，但用戶們一直期待更高質量的圖像和更強大的創作控制。 Gemini 2.5 Flash Image 正是帶著這些重磅升級而來：角色一致性終於得以充分保持，基於提示的圖片編輯也更精準，多幅圖像的融合效果自然流暢，再加上對現實世界知識的理解，讓它不僅是一款模型，更像是為下一代爆款應用奠定基礎的「原點」。

過去我們習慣了美圖秀秀這樣的工具，點點按鈕、套個濾鏡，照片就能迅速變美。但 Gemini 2.5 Flash Image 給人的感覺完全不同。它快得不可思議，聰明得像個懂你心思的設計師，你只需要說出想要的效果，它就能在幾秒鐘裡把畫面呈現出來。

除了效果，速度也是 Gemini 2.5 Flash Image 另一個明顯不同於此前模型生圖產品的體驗｜圖片來源：極客公園

01 極速生成，幾秒鐘出結果

Nano banana 體驗最直觀的就是速度。以往在使用一些開源模型時，哪怕你電腦配置不錯，從輸入提示到生成一張像樣的圖，也得等個幾十秒甚至更久。對於手機端用戶來說，這個等待過程更是煎熬。

。它本身是 Google 宣稱的「最新、最快、最高效」的原生多模態模型，在優化上明顯下了很大功夫。我在實際測試時，輸入一句提示，大概三四秒就能生成結果，而且分辨率和細節都相當清晰。

如果說速度解決的是傳統 P 圖用戶的體驗感，。

Gemini 2.5 Flash Image 不僅能生成圖片，還能同時理解文字和圖像輸入。這意味著我可以把一張照片和一段文字提示同時給它，它會結合兩者的信息去理解我到底想要什麼。

對於這種人像圖片處理需求，Gemini 2.5 Flash Image 的角色一致性真的提供了一種前所未有的「Vibe PhotoshOPing」體驗。

一秒幫程序員「挽尊」｜圖片來源：極客公園

這種體驗打破了很多人對 AI 圖像生成以往印象 —— 「玄學」：無論你提示詞寫得好，出圖效果驚艷；提示詞寫得一般，生成的東西可能完全跑偏。

但在 Gemini 2.5 Flash Image 裡，我發現這種「玄學感」被削弱了很多。—— 這就是為什麼不少人會突然覺得它會好用很多的原因。

比如我對它說「模糊背景，突出前景人物」，幾秒鐘後生成的圖正是我想要的效果；我讓它「把照片裡的人換成微笑的表情」，結果不僅嘴角微微上揚，連眼神都做了調整，細節非常到位；我甚至試過「給黑白照上色」，結果輸出的彩色圖並不是亂塗一氣，而是盡可能貼近歷史照片中該有的色彩氛圍。

這種「說到做到」的能力，讓我想到過去用美圖秀秀時，明明只是想磨皮，結果整張臉變成了「開了十級美顏」的假人臉。而現在，Gemini 2.5 Flash Image 的操作是精準的、克制的，它真的理解你要什麼，然後儘量還原。

02 能力加強，旦用難回

在 Snapseed 上，我如果要模糊背景，通常需要花一兩分鐘手動圈選前景區域，再調整模糊程度。即使操作熟練，也免不了反復修改。

在美圖秀秀上，雖然有一鍵背景模糊功能，但經常會把人物的邊緣模糊掉，效果不夠自然。

而在 Gemini 2.5 Flash Image 上，我只需要一句話，它自動識別出人物和背景的邊界，模糊效果自然，完全不需要二次修飾。

這種對比其實說明了一點：。對於普通人來說，它降低了修圖的門檻；對於專業人士來說，它節省了大量時間。

體驗下來，我最大的感受是，Gemini 2.5 Flash Image 已經不再只是一個修圖工具，而是更接近「智能助手」。

這種轉變看似細微，但實質上完全改變了 P 圖這個流程的關係。以前是我們去適應工具，現在是工具來適應我們。這種交互方式，本身就是下一代應用形態的雛形。

站在現在來看，Gemini 2.5 Flash Image 還處在早期階段，功能上可能還有邊界。但它展現出來的速度、理解力和還原度，足以讓人對未來充滿想像。

如果把它和美圖秀秀結合起來，會是什麼樣子？可能是你打開應用，對著手機說一句「幫我修一下這張照片，讓皮膚自然一些」，幾秒鐘後結果就生成了；可能是旅行拍照時，你告訴它「把天氣改成晴天」，照片立刻變成陽光明媚的樣子；甚至可能是視頻編輯裡，你用一句話就能改變整個片段的氛圍。

但目前 Gemini 2.5 Flash Image 還並不能一步到位，充當開箱即用的大眾 P 圖 App：不僅是因為它的主要目的仍然是圖像生成而非在現有的基礎上微調，而且所有通過 Gemini 2.5 Flash Image 創建或編輯的圖像都會包含一個SynthID 數字水印，用於社交內容平台識別 AI 生成內容。

回頭想想，美圖秀秀曾經之所以能成為全民應用，靠的是它用最簡單的方式解決了所有人都想解決的問題——讓照片更好看。

而 Gemini 2.5 Flash Image，正是在這個基礎上進一步，把複雜的 AI 能力打磨成人人都能用的「秒出圖」體驗。

來源:

前一篇

<< 佛羅里達州退休基金披露將 8000 萬美元配置於 Strategy 股票 >>

|Square

下載BTCC APP，您的加密之旅從這啟程

Download on the App Store GEI IT ON Google Play

立即行動 掃描加入我們的 100M+ 用戶行列

推薦

最新活動

谷歌最新「香蕉」AI 圖像模型，讓網友瘋玩「Vibe Photoshoping」

01 極速生成，幾秒鐘出結果

02 能力加強，旦用難回

|Square