BTCC / BTCC Square / TechFlowPost /
谷歌最新「香蕉」AI 圖像模型,讓網友瘋玩「Vibe Photoshoping」

谷歌最新「香蕉」AI 圖像模型,讓網友瘋玩「Vibe Photoshoping」

Published:
2025-08-29 18:54:48
12
3

還記得之前大家熱議的神秘 AI 圖片編輯模型「nano-banana」嗎? 當時在 LMArENA 大語言模型競技場裡,它憑藉出色表現一度被討論得沸沸揚揚。 Google Gemini 各路技術大牛也是輪番出馬,在社交媒體上吊足眾人胃口,。

如今,Google 終於揭開了它的神秘面紗。

北京時間 8 月 27 日凌晨,Google AI Studio 正式發布了 Gemini 2.5 Flash Image(代號 nano banana)🍌。

預熱許久終於登場的 Gemini 2.5 Flash Image | 圖片來源:極客公園

一登場就達到 SOTA 能力的 Gemini 2.5 Flash Image | 圖片來源:LMARena.ai

在技術博客裡,Google 提到 Gemini 2.0 Flash 已經憑藉低延遲和高性價比贏得了開發者的青睞,但用戶們一直期待更高質量的圖像和更強大的創作控制。 Gemini 2.5 Flash Image 正是帶著這些重磅升級而來:角色一致性終於得以充分保持,基於提示的圖片編輯也更精準,多幅圖像的融合效果自然流暢,再加上對現實世界知識的理解,讓它不僅是一款模型,更像是為下一代爆款應用奠定基礎的「原點」。

過去我們習慣了美圖秀秀這樣的工具,點點按鈕、套個濾鏡,照片就能迅速變美。 但 Gemini 2.5 Flash Image 給人的感覺完全不同。 它快得不可思議,聰明得像個懂你心思的設計師,你只需要說出想要的效果,它就能在幾秒鐘裡把畫面呈現出來。

除了效果,速度也是 Gemini 2.5 Flash Image 另一個明顯不同於此前模型生圖產品的體驗 | 圖片來源:極客公園

01 極速生成,幾秒鐘出結果

Nano banana 體驗​​最直觀的就是速度。 以往在使用一些開源模型時,哪怕你電腦配置不錯,從輸入提示到生成一張像樣的圖,也得等個幾十秒甚至更久。 對於手機端用戶來說,這個等待過程更是煎熬。

。 它本身是 Google 宣稱的「最新、最快、最高效」的原生多模態模型,在優化上明顯下了很大功夫。 我在實際測試時,輸入一句提示,大概三四秒就能生成結果,而且分辨率和細節都相當清晰。

如果說速度解決的是傳統 P 圖用戶的體驗感,。

Gemini 2.5 Flash Image 不僅能生成圖片,還能同時理解文字和圖像輸入。 這意味著我可以把一張照片和一段文字提示同時給它,它會結合兩者的信息去理解我到底想要什麼。

對於這種人像圖片處理需求,Gemini 2.5 Flash Image 的角色一致性真的提供了一種前所未有的「Vibe PhotoshOPing」體驗。

一秒幫程序員「挽尊」| 圖片來源:極客公園

這種體驗打破了很多人對 AI 圖像生成以往印象 —— 「玄學」:無論你提示詞寫得好,出圖效果驚艷;提示詞寫得一般,生成的東西可能完全跑偏。

但在 Gemini 2.5 Flash Image 裡,我發現這種「玄學感」被削弱了很多。—— 這就是為什麼不少人會突然覺得它會好用很多的原因。

比如我對它說「模糊背景,突出前景人物」,幾秒鐘後生成的圖正是我想要的效果;我讓它「把照片裡的人換成微笑的表情」,結果不僅嘴角微微上揚,連眼神都做了調整,細節非常到位;我甚至試過「給黑白照上色」,結果輸出的彩色圖並不是亂塗一氣,而是盡可能貼近歷史照片中該有的色彩氛圍。

這種「說到做到」的能力,讓我想到過去用美圖秀秀時,明明只是想磨皮,結果整張臉變成了「開了十級美顏」的假人臉。 而現在,Gemini 2.5 Flash Image 的操作是精準的、克制的,它真的理解你要什麼,然後儘量還原。

02 能力加強,旦用難回

在 Snapseed 上,我如果要模糊背景,通常需要花一兩分鐘手動圈選前景區域,再調整模糊程度。 即使操作熟練,也免不了反復修改。

在美圖秀秀上,雖然有一鍵背景模糊功能,但經常會把人物的邊緣模糊掉,效果不夠自然。

而在 Gemini 2.5 Flash Image 上,我只需要一句話,它自動識別出人物和背景的邊界,模糊效果自然,完全不需要二次修飾。

這種對比其實說明了一點:。 對於普通人來說,它降低了修圖的門檻;對於專業人士來說,它節省了大量時間。

體驗下來,我最大的感受是,Gemini 2.5 Flash Image 已經不再只是一個修圖工具,而是更接近「智能助手」。

這種轉變看似細微,但實質上完全改變了 P 圖這個流程的關係。 以前是我們去適應工具,現在是工具來適應我們。 這種交互方式,本身就是下一代應用形態的雛形。

站在現在來看,Gemini 2.5 Flash Image 還處在早期階段,功能上可能還有邊界。 但它展現出來的速度、理解力和還原度,足以讓人對未來充滿想像。

如果把它和美圖秀秀結合起來,會是什麼樣子? 可能是你打開應用,對著手機說一句「幫我修一下這張照片,讓皮膚自然一些」,幾秒鐘後結果就生成了;可能是旅行拍照時,你告訴它「把天氣改成晴天」,照片立刻變成陽光明媚的樣子;甚至可能是視頻編輯裡,你用一句話就能改變整個片段的氛圍。

但目前 Gemini 2.5 Flash Image 還並不能一步到位,充當開箱即用的大眾 P 圖 App:不僅是因為它的主要目的仍然是圖像生成而非在現有的基礎上微調,而且所有通過 Gemini 2.5 Flash Image 創建或編輯的圖像都會包含一個SynthID 數字水印,用於社交內容平台識別 AI 生成內容。

回頭想想,美圖秀秀曾經之所以能成為全民應用,靠的是它用最簡單的方式解決了所有人都想解決的問題——讓照片更好看。

而 Gemini 2.5 Flash Image,正是在這個基礎上進一步,把複雜的 AI 能力打磨成人人都能用的「秒出圖」體驗。

|Square

下載BTCC APP,您的加密之旅從這啟程

立即行動 掃描 加入我們的 100M+ 用戶行列