爆火的奧秘圖畫修改模型nano-banana,總算脫掉了“香蕉皮”!
就在今日,谷歌官方招領(lǐng),并標(biāo)明這個模型其實(shí)是Gemini 2.5 Flash Image。
最新一波官方Demo也來了:
還展示出了高明的圖畫推理才能:
現(xiàn)在該模型能夠在Gemini和Google AI Studio上免費(fèi)運(yùn)用,一同API以每張圖畫0.039$(折合人民幣0.28¥)的價(jià)格敞開。
模型的具體體現(xiàn)怎么?一同來看~
超卓的圖畫修改才能
官方給出了許多風(fēng)趣的用法。
除了慣例的修圖方法,它還能夠兼并最多三張圖片來發(fā)明新事物。
生成超現(xiàn)實(shí)藝術(shù),組合不同的相片元素,或無縫交融物體、色彩和紋路。
或許輕松完結(jié)規(guī)劃主意。
還能夠用幾張相片生成可謂電影畫面的連接劇情故事。
而在官方實(shí)錘之前,網(wǎng)友們也早就被nano-banana的各種私家case招引,敞開張狂評論。
比如說精準(zhǔn)改動面部表情和氣候。
或許讓禿頭男人從頭具有不同發(fā)型。
網(wǎng)友表明:PhotoShop危如累卵。
究竟這個“香蕉”不只能夠完結(jié)平面圖畫的修改,乃至還能夠進(jìn)行2D到3D的轉(zhuǎn)化。用戶只需供給一張一般的2D圖片,體系就可主動生成相應(yīng)的3D視角,每一個視點(diǎn)都是適可而止、調(diào)和一致。
最最最牛的是,它居然還能夠進(jìn)行圖畫推理。勾股定理so easy,核算視亞洲360偷拍在線看點(diǎn)手拿把掐,辨認(rèn)圖畫里的水母結(jié)構(gòu),居然也是瞬間反應(yīng),可謂你畫我猜AI版。
說實(shí)話,最讓我敬服的是,當(dāng)咱們要求此“香蕉”給出一個人從A到B的計(jì)劃時,它居然直接生成一個梯子!
好好好,圖畫修改器真的能考慮了。
咱們自己也實(shí)測了一下這款模型,發(fā)現(xiàn)它的確很有意思:
給它一只貓貓,貓能環(huán)游世界。
提示詞:以這只貓為主角,生成旅行照。
提示詞:讓貓貓去故宮拍張自拍照。
假如不想做真實(shí)場景,讓林黛玉和孫悟空成為漫威英豪并肩戰(zhàn)役也就一句話的事兒~
別的,它對光影的細(xì)節(jié)了解也適當(dāng)真實(shí)。
提示詞:一根香蕉被放在廚房臺面上,周圍有水杯、刀具和切菜板,陽光從窗戶照進(jìn)來,香蕉投下天然暗影。
能夠看到生成成果仍是很不錯滴,陽光透過水杯折射的影子以及周圍植物的影子都還算合理。
它還能夠很好地抓取人物特征,不出意外地改動人物主體:
假如那一年,工藤新一喝下的并不是縮小藥水,而是……
奧秘香蕉模型
Nano Banana開始呈現(xiàn)在一個名為LMArena的網(wǎng)站上,這是一個讓不同AI模型匿名進(jìn)行“戰(zhàn)役形式”比賽的當(dāng)?shù)亍?/p>$亞洲360偷拍在線看$$$$$而讓Nano-banana爆火的原因無他,體現(xiàn)真實(shí)太好了。
這又是一個SOTA等級的圖畫修改模型——而且在一開始沒有任何官方文檔。
不過在官方宣告之前,已經(jīng)有一些人猜到了這是谷歌宗族的一員。
一方面,該模型的體現(xiàn)與Gemini近期發(fā)布的多模態(tài)版別類似,這樣超卓的功能很難是車庫團(tuán)隊(duì)的產(chǎn)品。
另一方面,它的發(fā)布戰(zhàn)略——匿名發(fā)布、無品牌標(biāo)識、讓用戶集體自行探究——與DeepMind前期在匿名測驗(yàn)平臺上評價(jià)大言語模型的方法千篇一律。
還有一點(diǎn)額定原因:一些與谷歌有相關(guān)的開發(fā)者在交際媒體上發(fā)了古怪的香蕉內(nèi)容
有網(wǎng)友問到Google為什么要挑選隱秘發(fā)布,官方給出了這樣的解說:
正在為全球規(guī)劃的發(fā)布做準(zhǔn)備作業(yè)。
網(wǎng)友:何時發(fā)布完好版別
已然官方都那樣說了,網(wǎng)友們也坐不住了。
紛紛表明:那咱們能用完好版了嗎?
不過,盡管這個模型在圖畫生成的體現(xiàn)的確很好,但并不意味著它沒有問題——
尤其是在大公司的服務(wù)方針下,很簡單呈現(xiàn)一些讓人比較抓狂的狀況:
有網(wǎng)友以為,這是一個十分風(fēng)趣的營銷方法,而且的確達(dá)到了他們想要的作用。
感興趣的朋友也能夠去試一下這個香蕉,哦不,這個Gemini 2.5 Flash Image。
參閱鏈接:
[1]https://x.com/googleaistudio/status/1960344388560904213
[2]https://x.com/OfficialLoganK/status/1960343135436906754
[3]https://aistudio.google.com/prompts/new_chat?model=gemini-2.5-flash-image-preview
[4]https://techcrunch.com/2025/08/26/google-geminis-ai-image-model-gets-a-bananas-upgrade/
[5]https://deepmind.google/models/gemini/image/
本文來自微信大眾號“量子位”,作者:不圓 時令 ,36氪經(jīng)授權(quán)發(fā)布。