您现在的位置是:首页 > 文章详情

替兄弟们试过了,Nano Banana 是真心能打!

日期:2025-09-04点击:6

某红书最新的起号方法,出奇得一致。随便翻一下,几乎全被各式精致、逼真的手办图刷屏了。仔细深扒,不管是 AI 圈、二次元圈、萌宠圈,还是骑行圈、健身圈、模特圈,感觉大家都在用 AI 生成 3D 手办,咔咔吸粉~

那么,他们具体玩的是哪一款模型呢?请出今天的主角: Nano Banana

起初, Nano Banana 在 LM Arena 平台匿名出现,因生图表现太过能打,引得无数网友猜测其归属。直至两天后,Google 才下场认领,原来是他们刚上线的 Gemini-2.5-Flash-Image-Preview 。官方的介绍有三:

  • SOTA 图像生成和编辑

  • 令人难以置信的主体一致性

  • 闪电般快速

主打一个言简意赅。而在笔者查阅资料的过程中还发现:Gemini-2.5-Flash-Image-Preview 支持 32K 上下文,提供了温度(可以控制模型的创造力)以及一些高级设置。价格方面,该模型输入/输出文本的价格是 0.3/2.5 美元,输入/输出图像的价格是 0.3/30 美元。知识截止时间是 2025 年 6 月。

大概计算下来, 该模型生成每张图像的成本大约为 0.039 美元(约 0.27 元人民币),价格也很平民化。当然,好模还得跑了才知道!目前,Nano Banana 已经在 Google AI Studio 和 Gemini API 中提供了预览,大家可以免费使用。同时,笔者也为大家整理了 5 个 Nano Banana 的创意玩法,一并奉上~

体验入口:

玩法一:纹理修改

首先要为大家介绍的,是 Nano Banana 强大的 「电商级」纹理修改功能。

比如说,你准备发朋友圈,但手里只有一张低等级牛肉的照片,想整高级一点,怎么办呢?只需要把原图丢给 Nano Banana ,然后输入提示词:

Adjust the grain of the beef to that of S3-grade beef

把牛肉的纹路改成 S3 级别牛排的纹路,就可以得到你想要的高级氛围感~

左为原图输入,右为模型输出

而这样的纹路修改,笔者在谷歌的 AI Studio 的环境下只需要运行 11.5s ,丝毫没有多余的思考过程及文字,属于是直接将图片甩了出来。并且,由于模型对“一致性”的重视,所输出的图片将严格遵守提示词指令,如果大家有别的增改,例如:添加氛围灯、旁边放杯红酒、切块放置等等,只需要继续在 Chat 框里添加新的提示词。

*笔者还发现:在 AI Studio 环境下,使用英文提示词的成功率远大于中文提示词,大段的中文提示词容易被当作文本,被模型原封不动吐回来。

Nano Banana 的纹路修改功能,特别适用于工业设计的样品纹理开版,而对于电商平台 低成本生成产品展示图也非常方便,进一步提高了设计人员的工作效率。但在实测过程中,笔者总感觉这个功能有点邪修,如果后续广泛应用于修改食材纹路、玉石纹路、布样纹路,那么非标领域的广告真实性将很难保证。

玩法二:草图控制

分享一个不那么容易被大家想到的玩法:通过草图(或线稿),修改图片角色的动作。

实测中,笔者找了一张《进击的巨人》中的兵长的图片,然后自己用笔在白纸上手绘了一张动作草图,然后丢给 Nano Banana ,输入提示词:

Make the character in Picture 1 pose in the posture shown in Picture 2, with an image aspect ratio of 1:1

让图片一的角色摆出图片二所示的动作,画幅比例1:1 ,就可以得到:

左为原图输入(图一),中为草图输入(图二),右为模型输出

虽然最后生成的图片,并没有与图二完全保持一致,但整体来说:Nano Banana 所生成的图片,其人物面部表情,已经非常贴合了,且在细节方面丝毫没有偷懒: 图一人物袖标“自由之翼”为9根羽毛,图三 AI 输出的“自由之翼”依旧为9根羽毛

鉴于笔者的画工着实不济,后续我又找了两张动漫图片,加一张表情包,还是丢给 Nano Banana ,输入提示词:

The two characters interact in the posture shown in Picture 3. The scene background should match the atmosphere of the image, and interactive effects between the environment and the characters should be added. The image aspect ratio is set to 1:1

两名角色以图三所示的姿势展开互动,场景背景需与画面氛围相契合,并加入环境与角色的互动效果, 画面比例 设定为 1:1 ,就可以得到:

似乎 Nano Banana 在处理图片时,还考虑到了人类世界的一些真实可能,例如:右边女性角色在攻击的同时,另一只手保持出握拳的姿势。而在场景处理方面,走廊地板上还对应生成了来自于天花板的灯光投影。

笔者只想说:或许哈,等 Nano Banana 的生成能力再提一个数量级,那么大家后面想看什么,基本就可以自己画了~

玩法三:无提示词

刚才笔者测试的,还只是动漫角色,这部分,带大家来看看 Nano Banana 的 AI 人像生成效果,并且: 不用提示词,而是将文字直接标注在图片上。例如这样:

上为原图输入,下为模型输出

大家可以看到,在没有输入任何提示词的情况下,Nano Banana 依旧可以根据图片中的文字说明,进行 AI 图片生成,并且图中两个的衣服均与原图保持一致。细节来了: 鉴于原图出现了两个人物,Nano Banana 在生成时还细节地让两名角色的空间位置保持了协调,而不是呆板地放置在那里。

但是,目前 Nano Banana 图片标注功能所生成的图片,清晰度还不算很高,期待它优化后的表现~

玩法四:图片拆分

以上实例,多多少少聊的都是“多图融合”,那么图片拆分呢?Nano Banana 在视觉推理上的能力可是非常强大的。比如,笔者向 Nano Banana 输入一张人像图片,并输入:

Extract the clothing worn by the characters in the picture separately to form a single product collection.

将图片中的角色的衣服单独挑出来,形成一个单品合集,就可以得到:

左为原图输入,右为模型输出

这对服装设计师来说,绝对的“垂死病中惊坐起”。一方面,Nano Banana 可以(几乎)原封不动地将原图模特身上的单品拆解下来,并且恰到好处地添加一些光影效果,完成了基础指令;另一方面,Nano Banana 还在外套的领口处添加了内胆设计,颜色也与整体画面很兼容,又带来了新的创意点。

玩法五:画面转绘

上一次被 AI 转绘惊艳,还是那一幅幅的“吉卜力”风格的 AI 照片,而现在,大家只需要在 Nano Banana 输入风格提示词,就可以得到超高一致性的各类风格 AI 转绘。

笔者自己用同一张图片,试了几款风格,提示词如下:

Convert this image to a black-and-white comic style. (黑白漫画风格)
Convert this image to an oil painting style. (油画风格)
Convert this image to a pop art style. (波普风格)

左一为原图输入,其余均为模型输出

之前使用 GPT-4o 、Flux Kontext ,图片转绘功能也让我觉得很牛,但也就那样, 涉及到人像、产品时,一点细微的变形,就让它们的商业价值大大降低。

相较之,Nano Banana 会更加一致、严谨,这一点从水纹、石块的细节上就可以得知,看一下对比图:

左为 Nano Banana 生成 ,右为某 AI 生成 (提示词一致)

右图的人像,基本已经脱离原图,不仅刻意收了腰线,还有点网红脸;而水纹方面,也是那种大粗笔的色块覆盖,且出现了一些不属于原图的色系。

玩法五:3D手办图

正如文章一开始所说,目前有很多博主在用 Nano Banana 起号、吸粉,笔者也把我实测到的结果,分享给大家,提示词如下:

Transform this photo into a character figurine. Place a packaging box printed with the character's image behind the figurine, and display a computer next to it, with the Blender modeling production process shown on the screen. Put a circular plastic base in front of the packaging box, on which the character figurine stands. Ensure the PVC material exhibits a clear and realistic texture, and set the scene in an indoor environment as much as possible.

将这张照片转换为一个角色手办。在手办背后放置一个印有该角色图像的包装盒,并在旁边展示一台电脑,屏幕上显示 Blender 建模的制作过程。在包装盒前方放置一个圆形塑料底座,上面站立着角色手办。让 PVC 材质呈现出清晰真实的质感,并尽量将场景设置在室内环境中,就可以得到:

不得不说,整个流程异常丝滑,但笔者也发现了一个大问题: 无论是 Nano Banana ,还是其他生图模型,在对于文字生成上面,基本上都会出现乱码,这也是笔者在多次测试过程中,都出现了一个情况。

写在最后:

从上述案例,我们可以得知:Nano Banana 已经不再只是一个图像生成模型,而是逐渐朝 「视觉推理 + 创意设计」的商业级工具迈进。这意味着什么?

意味着 Nano Banana 直接动了 Stable Diffusion 和 Photoshop 的蛋糕,因为后两者还是有一定的学习门槛,但 Nano Banana 只需要用户输入一句话、一张图,就能快速得到想要的图片,妥妥的 降本增效

LM Arena 投票 榜单

另一方面,Nano Banana 是一种极致压缩、能在移动端运行的生图模型。换句话说,它不再是“ AI 工坊里的实验品”,而是真正能嵌入到 社交、广告、应用的“即时生成引擎”。

试想一下,某个刚刚创业的大学生,想在自己的电商平台上架一款运动鞋。过去,他需要自己搞定模特、摄影、美工、后期、文案,整个流程至少需要花 3-4 天;而现在,他将产品图上传给 Nano Banana 驱动的“ AI 商品助手”,就可以快速生成各类 banner 、产品展示、节日氛围图等等—— Nano Banana 把 AI 生图从“后台实验室”带到了“前台实时场景”

最后,笔者还是需要向兄弟们提醒一句:Nano Banana 的强大一致性,意味着也可能会生成一些违规、违纪的图片出来 (懂得都懂),这一点,模型谈不上道德与否,但 AI 生图也不是法外之地。

散会~

 
原文链接:https://my.oschina.net/u/7819858/blog/18690613
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章